Лабораторная работа 4. Анализ и визуализация данных средствами цифровых инструментов
Цель:
Освоить
базовые методы анализа и визуализации табличных данных с использованием Excel
или Google Sheets.
Теоретическая часть
(кратко)
Data Science (наука о данных)
включает методы обработки, анализа и визуализации данных для получения полезной
информации и принятия решений.
Табличные данные (CSV, Excel) — это
структурированная форма хранения информации в виде строк и
столбцов.
Основные этапы анализа
данных:
·
загрузка данных;
·
первичный анализ (структура,
пропуски, типы данных);
·
обработка и очистка;
·
визуализация;
·
интерпретация результатов.
План выполнения
работы
1. Получение набора табличных
данных
Обучающийся
должен:
·
загрузить набор данных в формате
CSV или Excel;
·
использовать готовый датасет или
предложенный преподавателем.
Примеры
данных:
·
успеваемость студентов
·
продажи товаров
·
посещаемость сайта
·
данные о погоде
·
показатели устройств IoT
2. Первичный анализ
данных
Необходимо:
·
открыть файл в Excel / Google
Sheets;
·
изучить структуру данных;
·
определить:
o
количество строк и столбцов;
o
наличие пропусков;
o
типы данных;
o
базовые статистические показатели
(среднее, минимум, максимум).
3. Построение
визуализаций
На основе данных необходимо
построить:
·
столбчатую диаграмму (bar chart);
·
круговую диаграмму (pie chart);
·
линейный график (line chart) — при
наличии временных данных.
Рекомендуемые
инструменты:
·
Microsoft Excel
·
Google Sheets
4. Интерпретация
результатов
Обучающийся
должен:
·
описать, что показывают графики;
·
выявить закономерности;
·
сделать выводы на основе данных.
Пример:
·
какие показатели
максимальные/минимальные;
·
есть ли рост или снижение;
·
какие категории доминируют.
Требования к оформлению
результата
Работа должна
включать:
·
исходный файл данных (CSV/Excel);
·
таблицу с первичным анализом;
·
2–3 диаграммы;
·
текстовый вывод по результатам
анализа.
Критерии
оценивания
|
Критерий |
Описание |
Баллы |
|
Корректность
обработки данных |
Правильная
загрузка, анализ и работа с данными |
0–40 |
|
Качество
визуализации |
Понятные и
информативные графики |
0–30 |
|
Интерпретация |
Логичные выводы на
основе данных |
0–20 |
|
Оформление
файла |
Структура,
аккуратность, читаемость |
0–10 |
Максимальный балл:
100
Дополнительно (рекомендации для
студентов)
Для повышения оценки
рекомендуется:
·
использовать реальные датасеты
(Kaggle, Google Dataset Search);
·
добавлять подписи к диаграммам;
·
выделять ключевые показатели
(highlight);
·
использовать фильтры и сортировку
данных;
·
оформлять работу как мини-отчет.
Итог
работы:
Студент должен
уметь:
·
загружать и обрабатывать табличные
данные;
·
выполнять первичный анализ;
·
визуализировать данные в
Excel/Google Sheets;
·
делать выводы на основе данных.