Post content
Машинное обучение (Ml) — ограниченный набор базовых алгоритмов извлечение структуры — зависимости, границ, группы или вероятности Линейная регрессия — самый прямолинейный способ предсказания Она пытается описать данные простой зависимостью: если меняется одно, как меняется другое Логистическая регрессия, несмотря на название, используется не для чисел, а для решений типа «да / нет» Дерево решений работает как набор вложенных вопросов: если выполнено одно условие — идём туда, если другое — сюда Метод опорных векторов (SVM) ищет границу между классами так, чтобы она была максимально устойчивой Интуитивно — это попытка разделить данные с запасом прочности Алгоритм хорошо работает на задачах средней сложности, особенно когда данных не слишком много, а граница между классами не совсем очевидна Метод ближайших соседей (KNN) вообще ничего не «учит» заранее Чтобы классифицировать новый объект, он просто смотрит на похожие объекты в данных и голосует Это делает алгоритм концептуально простым и понятным, но на больших объёмах данных он становится медленным, потому что каждый новый запрос требует сравнения со всеми остальными Снижение размерности — это не столько алгоритм, сколько класс методов Их цель — упростить данные, оставив главное Когда признаков слишком много, часть из них дублирует друг друга или добавляет шум Такие методы позволяют сжать пространство признаков, сделать данные более наглядными или подготовить их для других алгоритмов Случайный лес — попытка исправить слабости отдельных деревьев решений Вместо одного дерева строится много разных, каждое со своими ошибками, а затем их ответы усредняются или объединяются голосованием В результате модель становится устойчивее и часто даёт хороший результат без тонкой настройки K-means — один из базовых алгоритмов кластеризации Он не знает правильных ответов заранее, а просто пытается разбить данные на заданное число групп так, чтобы внутри групп объекты были похожи друг на друга Наивный Байес — вероятностный подход, который делает сильные упрощающие предположения о независимости признаков В сумме эти алгоритмы образуют своего рода «алфавит» машинного обучения Современные модели могут быть гораздо сложнее, но почти всегда они либо развивают эти идеи, либо комбинируют их между собой Понимание базовых методов даёт не только техническую основу, но и интуицию: что именно модель делает с данными и почему она ошибается там, где ошибается