Лабораторная работа 5. Основы машинного обучения и обучение моделей на примерах

 

Цель работы. Изучить базовые принципы машинного обучения, познакомиться с типами моделей и освоить обучение простой модели на примере готовых данных.

Теоретическая часть

Машинное обучение (Machine Learning, ML) — направление искусственного интеллекта, позволяющее системам обучаться на данных и делать прогнозы или принимать решения без явного программирования всех правил.

Основные этапы машинного обучения:

1.                  Сбор данных

2.                  Подготовка данных

3.                  Выбор модели

4.                  Обучение модели

5.                  Проверка качества

6.                  Использование модели для прогнозирования

Основные виды машинного обучения:

1. Обучение с учителем (Supervised Learning)

Используются размеченные данные, где известен правильный ответ.

Примеры:

·                     прогноз оценок;

·                     определение стоимости товара;

·                     классификация изображений.

2. Обучение без учителя (Unsupervised Learning)

Система самостоятельно выявляет закономерности.

Примеры:

·                     сегментация клиентов;

·                     поиск групп объектов;

·                     анализ поведения пользователей.

3. Обучение с подкреплением (Reinforcement Learning)

Модель обучается через взаимодействие со средой.

Примеры:

·                     робототехника;

·                     игровые ИИ;

·                     автономный транспорт.

План выполнения работы

 

1. Изучение набора данных

Обучающийся должен:

·                     получить готовый набор данных;

·                     определить:

o                  количество объектов;

o                  признаки (features);

o                  целевой параметр (target).

Примеры датасетов:

·                     оценки студентов;

·                     данные о погоде;

·                     продажи товаров;

·                     данные клиентов.

 

2. Подготовка данных

Необходимо:

·                     изучить структуру таблицы;

·                     определить пропуски и ошибки;

·                     подготовить данные для обучения.

Возможные действия:

·                     удаление пропусков;

·                     сортировка;

·                     выбор нужных признаков.

 

3. Обучение простой модели

С использованием готового инструмента (например, Google Teachable Machine, Orange Data Mining или встроенных средств Python/AutoML) необходимо:

·                     выбрать тип модели;

·                     выполнить обучение;

·                     получить результат.

Примеры задач:

·                     классификация;

·                     прогнозирование;

·                     распознавание.

 

4. Анализ качества модели

Необходимо:

·                     оценить результат обучения;

·                     определить:

o                  точность модели;

o                  успешность прогнозов;

o                  возможные ошибки.

Ответить на вопросы:

·                     насколько хорошо работает модель;

·                     какие факторы влияют на качество;

·                     как можно улучшить результат.

 

Пример структуры анализа

Этап

Описание

Данные

таблица оценок студентов

Признаки

посещаемость, домашние задания

Целевой параметр

итоговая оценка

Модель

классификация

Результат

прогноз успеваемости

Требования к оформлению результата

Работа должна содержать:

·                     краткое введение;

·                     описание выбранного набора данных;

·                     результаты обучения модели;

·                     таблицы или скриншоты;

·                     выводы по работе.

Допускается использование:

·                     таблиц;

·                     схем;

·                     диаграмм;

·                     скриншотов процесса обучения.

Критерии оценивания

Критерий

Описание

Баллы

Корректность работы с данными

Правильная подготовка и использование данных

0–40

Обучение модели

Корректность запуска и получения результата

0–30

Анализ результатов

Обоснованность выводов и оценка качества

0–20

Оформление работы

Логичность и аккуратность оформления

0–10

Максимальный балл: 100

 

Дополнительно (рекомендации для студентов)

Для повышения оценки рекомендуется:

·                     использовать реальные датасеты;

·                     сравнить две модели или два подхода;

·                     привести примеры применения ML в своей специальности;

·                     оформить результаты в виде мини-отчёта или презентации.

 

Итог работы

Студент должен уметь:

·                     понимать базовые принципы машинного обучения;

·                     работать с простыми наборами данных;

·                     обучать элементарную модель;

·                     анализировать результаты и делать выводы.