Лабораторная работа 8. Компьютерное зрение и технологии оптического распознавания

 

Цель работы. Изучить основы компьютерного зрения и технологий оптического распознавания, а также освоить практические навыки использования ИИ-систем для анализа и обработки изображений.

Теоретическая часть

Компьютерное зрение (Computer Vision) — направление искусственного интеллекта, позволяющее компьютерным системам получать, анализировать и интерпретировать визуальную информацию из изображений и видео.

Компьютерное зрение применяется для:

·                     распознавания объектов;

·                     анализа изображений;

·                     обнаружения лиц и жестов;

·                     автономной навигации;

·                     медицинской диагностики;

·                     контроля качества продукции;

·                     систем безопасности.

Одной из технологий компьютерного зрения является оптическое распознавание символов (OCR — Optical Character Recognition) — технология преобразования текста на изображениях и документах в редактируемый цифровой текст.

Основные задачи компьютерного зрения:

·                     классификация изображений;

·                     обнаружение объектов;

·                     сегментация изображений;

·                     распознавание текста;

·                     анализ видео.

Примеры применения:

·                     системы видеонаблюдения;

·                     беспилотный транспорт;

·                     распознавание документов;

·                     промышленная автоматизация;

·                     мобильные приложения.

План выполнения работы

 

1. Изучение технологий компьютерного зрения и OCR

Обучающийся должен:

·                     изучить понятие компьютерного зрения;

·                     рассмотреть основные задачи Computer Vision;

·                     изучить принцип работы OCR-технологий;

·                     определить области применения данных технологий.

2. Исследование сервисов компьютерного зрения

Необходимо выбрать 2 сервиса или приложения, использующих технологии компьютерного зрения или OCR.

Примеры:

·                     распознавание текста на изображениях;

·                     анализ фотографий;

·                     распознавание объектов;

·                     интеллектуальный поиск по изображениям.

Для каждого сервиса указать:

·                     назначение;

·                     тип анализируемых данных;

·                     основные функции;

·                     преимущества и ограничения.

3. Практическое использование технологий

С использованием выбранных сервисов необходимо выполнить не менее двух заданий.

Возможные задания:

OCR и работа с текстом

·                     распознавание текста с фотографии;

·                     извлечение текста из документа;

·                     сравнение качества распознавания.

Компьютерное зрение

·                     распознавание объектов на изображении;

·                     анализ сцены или фотографии;

·                     определение категорий объектов.

4. Анализ результатов

Необходимо:

·                     оценить качество работы сервисов;

·                     определить сильные и слабые стороны технологий.

Параметры анализа:

·                     точность распознавания;

·                     скорость обработки;

·                     качество результата;

·                     удобство использования.

Ответить на вопросы:

·                     насколько корректно выполнено распознавание;

·                     какие ошибки были обнаружены;

·                     где такие технологии наиболее востребованы.

Пример структуры анализа

Этап

Описание

Сервис

OCR-система

Задача

распознавание текста из изображения

Результат

текст успешно извлечён

Недостатки

ошибки при низком качестве изображения

Вывод

подходит для цифровизации документов

 

Требования к оформлению результата

Работа должна содержать:

·                     введение;

·                     краткое описание технологий;

·                     анализ двух сервисов;

·                     примеры изображений и результатов;

·                     выводы.

Допускается использование:

·                     таблиц;

·                     схем;

·                     скриншотов;

·                     изображений и примеров распознавания.

Критерии оценивания

Критерий

Описание

Баллы

Понимание технологий

Корректное описание Computer Vision и OCR

0–40

Практическое применение

Использование сервисов и выполнение заданий

0–30

Анализ результатов

Критическая оценка качества распознавания

0–20

Оформление работы

Логичность и аккуратность

0–10

Максимальный балл: 100

 

Дополнительно (рекомендации для студентов)

Для повышения оценки рекомендуется:

·                     сравнить несколько сервисов распознавания;

·                     использовать изображения различного качества;

·                     протестировать OCR на разных языках;

·                     привести примеры применения в профессиональной деятельности;

·                     оформить работу в виде мини-отчёта или презентации.

 

Итог работы

Студент должен уметь:

·                     объяснять принципы работы компьютерного зрения и OCR;

·                     использовать сервисы анализа изображений;

·                     выполнять распознавание текста и объектов;

·                     анализировать качество работы технологий и делать выводы.