Лекция 5. Основы машинного обучения (Machine Learning).

 

1. Переход от анализа данных к машинному обучению

На прошлой лекции

·                     мы изучали данные

·                     считали средние, распределения

·                     визуализировали результаты

·                     отвечали на вопрос: «Что происходит в данных?»

 

1.2. Новый вопрос

Теперь появляется следующий логичный шаг:

«А можно ли научить компьютер делать выводы сам?»

Ответ: да, с помощью машинного обучения

 

2. Что такое машинное обучение простыми словами

2.1. Определение без формул

Машинное обучение (ML) — это способ:

научить компьютер находить закономерности в данных на примерах, а не по жёстким правилам

 

2.2. Классический подход vs ML

Обычное программирование:

Правила + данные → результат

Машинное обучение:

Данные + правильные ответы → модель → новые результаты

В ML мы не пишем правила вручную — система их «изучает».

 

2.3. Простой жизненный пример

Как человек учится отличать:

·                     хороший фильм

·                     плохой фильм

Мы:

·                     смотрим примеры

·                     сравниваем

·                     делаем выводы

 ML учится точно так же

 

3. Обучение по примерам (Learning from Data)

3.1. Что такое обучающая выборка

Обучающая выборка — это таблица, где:

·                     каждая строка — пример

·                     есть входные данные

·                     есть правильный ответ (не всегда)

Пример:

Посещаемость

Часы подготовки

Итог

 

 

 

 

3.2. Признаки и целевая переменная

·                     Признаки (features) — то, что мы знаем (возраст, оценки, температура)

·                     Цель (target) — то, что хотим предсказать

ML = поиск связи между признаками и целью

 

3.3. Модель машинного обучения

Модель — это:

·                     математическая конструкция

·                     которая «запоминает» закономерности

·                     и применяет их к новым данным

Не «память», а обобщение

 

4. Основные типы машинного обучения

4.1. Обучение с учителем (Supervised Learning)

Есть входы и правильные ответы

Примеры:

·                     прогноз оценки студента

·                     распознавание спама

·                     диагноз по анализам

Типовые задачи:

·                     классификация (категории)

·                     регрессия (числа)

Самый распространённый тип ML

 

4.2. Обучение без учителя (Unsupervised Learning)

Есть данные, но нет правильных ответов

Примеры:

·                     группировка клиентов

·                     анализ интересов

·                     поиск скрытых структур

Основная задача:

·                     кластеризация

«Найди, что здесь вообще происходит»

 

4.3. Обучение с подкреплением (Reinforcement Learning)

Обучение через награды и штрафы

Примеры:

·                     игры (шахматы, Go)

·                     роботы

·                     управление процессами

Идея:

·                     агент действует

·                     получает награду

·                     улучшает стратегию

Ближе к поведению человека и животных

 

5. Как происходит процесс обучения ML-модели

5.1. Упрощённый алгоритм

1.                  Собираем данные

2.                  Выбираем признаки

3.                  Делим данные:

o                  обучение

o                  проверка

4.                  Обучаем модель

5.                  Оцениваем качество

 

 

5.2. Почему нельзя учиться на всех данных сразу

Проблема:

·                     модель может заучить примеры

Это называется:

переобучение (overfitting)

Хорошая модель умеет работать с новыми данными

5.3. Пример «плохого обучения»

·                     модель идеально знает прошлое

·                     но плохо работает в будущем

В реальной жизни это бесполезно

 

6. Где ML используется в разных специальностях

·                     образование — прогноз успеваемости

·                     медицина — помощь врачу

·                     бизнес — рекомендации

·                     агросектор — прогноз урожайности

·                     право — анализ документов

·                     дизайн — рекомендации, генерация идей

ML — универсальный инструмент

 

7. Ограничения и мифы машинного обучения

7.1. Распространённые мифы

ML «думает как человек»

ML всегда объективен

Чем больше данных — тем лучше

 

7.2. Реальность

·                     ML зависит от данных

·                     ошибки в данных → ошибки в модели

·                     ML не понимает смысл, он ищет связи

Ответственность всегда на человеке

 

8. Итоги лекции

Главное:

·                     машинное обучение — это обучение на примерах

·                     модель ищет закономерности в данных

·                     есть три основных подхода обучения

·                     ML — основа современных ИИ-систем

·                     без качественных данных ML не работает

 

Вопросы

1.                  Чем ML отличается от обычной программы?

2.                  Можно ли обучить ML без правильных ответов?

3.                  Где ML может быть опасен?

4.                  Всегда ли ML лучше человека?