Лабораторная работа 8. Компьютерное зрение и технологии оптического распознавания
Цель работы. Изучить основы
компьютерного зрения и технологий оптического распознавания, а также освоить
практические навыки использования ИИ-систем для анализа и обработки
изображений.
Теоретическая часть
Компьютерное зрение (Computer
Vision)
— направление искусственного интеллекта, позволяющее компьютерным системам
получать, анализировать и интерпретировать визуальную информацию из изображений
и видео.
Компьютерное зрение применяется
для:
·
распознавания объектов;
·
анализа изображений;
·
обнаружения лиц и жестов;
·
автономной навигации;
·
медицинской диагностики;
·
контроля качества продукции;
·
систем безопасности.
Одной из технологий компьютерного
зрения является оптическое распознавание символов (OCR — Optical Character
Recognition) — технология преобразования текста на изображениях и документах
в редактируемый цифровой текст.
Основные задачи компьютерного
зрения:
·
классификация изображений;
·
обнаружение объектов;
·
сегментация изображений;
·
распознавание текста;
·
анализ видео.
Примеры
применения:
·
системы видеонаблюдения;
·
беспилотный транспорт;
·
распознавание документов;
·
промышленная автоматизация;
·
мобильные приложения.
План выполнения
работы
1. Изучение технологий
компьютерного зрения и OCR
Обучающийся
должен:
·
изучить понятие компьютерного
зрения;
·
рассмотреть основные задачи
Computer Vision;
·
изучить принцип работы
OCR-технологий;
·
определить области применения
данных технологий.
2. Исследование сервисов
компьютерного зрения
Необходимо выбрать 2 сервиса или
приложения, использующих технологии компьютерного зрения или
OCR.
Примеры:
·
распознавание текста на
изображениях;
·
анализ фотографий;
·
распознавание объектов;
·
интеллектуальный поиск по
изображениям.
Для каждого сервиса
указать:
·
назначение;
·
тип анализируемых данных;
·
основные функции;
·
преимущества и ограничения.
3. Практическое использование
технологий
С использованием выбранных сервисов
необходимо выполнить не менее двух заданий.
Возможные
задания:
OCR и работа с
текстом
·
распознавание текста с фотографии;
·
извлечение текста из документа;
·
сравнение качества распознавания.
Компьютерное
зрение
·
распознавание объектов на
изображении;
·
анализ сцены или фотографии;
·
определение категорий объектов.
4. Анализ
результатов
Необходимо:
·
оценить качество работы сервисов;
·
определить сильные и слабые стороны
технологий.
Параметры
анализа:
·
точность распознавания;
·
скорость обработки;
·
качество результата;
·
удобство использования.
Ответить на
вопросы:
·
насколько корректно выполнено
распознавание;
·
какие ошибки были обнаружены;
·
где такие технологии наиболее
востребованы.
Пример структуры
анализа
|
Этап |
Описание |
|
Сервис |
OCR-система |
|
Задача |
распознавание
текста из изображения |
|
Результат |
текст успешно
извлечён |
|
Недостатки |
ошибки при низком
качестве изображения |
|
Вывод |
подходит для
цифровизации документов |
Требования к оформлению
результата
Работа должна
содержать:
·
введение;
·
краткое описание технологий;
·
анализ двух сервисов;
·
примеры изображений и результатов;
·
выводы.
Допускается
использование:
·
таблиц;
·
схем;
·
скриншотов;
·
изображений и примеров
распознавания.
Критерии
оценивания
|
Критерий |
Описание |
Баллы |
|
Понимание
технологий |
Корректное
описание Computer Vision и OCR |
0–40 |
|
Практическое
применение |
Использование
сервисов и выполнение заданий |
0–30 |
|
Анализ
результатов |
Критическая оценка
качества распознавания |
0–20 |
|
Оформление
работы |
Логичность и
аккуратность |
0–10 |
Максимальный балл:
100
Дополнительно (рекомендации для
студентов)
Для повышения оценки
рекомендуется:
·
сравнить несколько сервисов
распознавания;
·
использовать изображения различного
качества;
·
протестировать OCR на разных
языках;
·
привести примеры применения в
профессиональной деятельности;
·
оформить работу в виде мини-отчёта
или презентации.
Итог
работы
Студент должен
уметь:
·
объяснять принципы работы
компьютерного зрения и OCR;
·
использовать сервисы анализа
изображений;
·
выполнять распознавание текста и
объектов;
·
анализировать качество работы
технологий и делать выводы.