OCR-технології для розпізнавання паперових
документів
Мета:
Допомогти учням засвоїти поняття «розпізнавання», «OCR». Ознайомити з етапами
роботи OCR, методами розпізнавання тексту. Показати альтернативи комерційному
ПЗ для розпізнавання текстів (безкоштовне ПЗ та онлайн сервіси). Забезпечити
якість вивчення нового матеріалу. Формувати вміння виділяти головне,
актуалізувати, конспектувати, порівнювати, зіставляти. Забезпечити
диференційований підхід. Встановити зв'язки між засвоєними та новими знаннями.
Формувати групи компетентностей: соціально-трудову, інформаційну,
загальнокультурну, соціально-трудову, уміння вчитися.
Тип уроку:
засвоєння нових знань;
Обладнання та наочність: комп’ютери, підручники, презентація, проєктор.
Програмне забезпечення: браузер.
Хід
уроку
І.
Організаційний етап
·
Привітання з класом
-
Доброго дня, діти.
·
Повідомлення теми і
мети уроку
-
Сьогодні на уроці ми з
вами ознайомимося з OCR-технологіями для розпізнавання паперових
документів. Будемо розпізнавати документи за допомогою онлайн сервісів.
ІІ. Мотивація
навчальної діяльності
-
Не забувайте про
правила поведінки на уроці. (Слайд2).
ІІІ. Актуалізація
опорних знань
Перевірка знань (Слайд 3)
IІІ. Вивчення нового
матеріалу
Слайд 4. Оптичне розпізнавання тексту (англ. optical
character recognition, OCR) — це механічне або електронне переведення
зображень рукописного, машинописного або друкованого тексту в послідовність
кодів, що використовуються для представлення в текстовому редакторі.
Розпізнавання широко використовується для конвертації книг і документів в
електронний вигляд, для автоматизації систем обліку в бізнесі або для
публікації тексту на веб-сторінці. Оптичне розпізнавання тексту дозволяє
редагувати текст, здійснювати пошук слова або фрази, зберігати його в
компактнішій формі, демонструвати або роздруковувати матеріал, не втрачаючи
якості, аналізувати інформацію, а також застосовувати до
тексту електронний переклад, форматування або перетворення в
мовлення. Оптичне розпізнавання тексту є досліджуваною проблемою в
галузях розпізнавання образів, штучного
інтелекту і комп'ютерного зору.
Системи
оптичного розпізнавання тексту вимагають калібрування для роботи з
конкретним шрифтом; у ранніх версіях, для програмування було необхідно
зображення кожного символу, програма одночасно могла працювати тільки з одним
шрифтом. Зараз найпоширеніші так звані «інтелектуальні» системи, що розпізнають
більшість шрифтів із високим ступенем точності. Деякі системи оптичного
розпізнавання тексту здатні відновлювати вихідне форматування тексту, включаючи
зображення, колонки й інші нетекстові компоненти.
Слайд 5. Принцип
роботи OCR
-
Фотографія з текстом, отримана зі сканера, розбивається на безліч
фрагментів.
-
Для кожного з них програма створює кілька припущень.
-
Вибираючи найбільшу з них, програма «бачить» символ і виводить його в
полі вбудованого текстового редактора.
-
Перевіряючи і порівнюючи їх з еталонами кожного фрагменту дає оцінку,
відповідну до ступеня збігу.
Слайд
6. Методи розпізнавання
тексту-символів різних зображень забезпечують вирішення ряду наукових та
прикладних задач при ідентифікації об'єктів різного типу. Сучасні методи
розпізнавання символів використовуються для вирішення як типових задач,
наприклад, розпізнавання тексту, так і спеціалізованих задач, орієнтованих на
розпізнавання символьної інформації, нанесеної на поверхню різних об'єктів.
Існує достатньо велика кількість програм, призначених для розпізнавання тексту
(наприклад, FineReader, Readiris, ScanSoft OmniPage та
ін.). Кожна з цих програм пропонує свою реалізацію вирішення задачі обробки та
розпізнавання зображень.
Шаблонний
метод
Шаблонні методи перетворюють зображення
окремого символу в растрове, порівнюють його зі всіма шаблонами, наявними в
базі і вибирають шаблон з найменшою кількістю крапок, відмінних від вхідного
зображення. Шаблонні методи досить стійкі до дефектів зображення і мають високу
швидкість обробки вхідних даних, але надійно розпізнають тільки ті шрифти,
шаблони яких їм «відомі». І якщо розпізнаний шрифт хоч трохи відрізняється від
еталонного, шаблонні методи можуть робити помилки навіть при обробці дуже
якісних зображень.
Структурний
метод
Структурні методи розпізнавання
зберігають інформацію не про поточкове написання символу, а про його топологію.
Еталон містить інформацію про взаємне розташування окремих складових частин
символу. Перевага методу – стійкість до зсуву і повороту символу на невеликий
кут, до різних стильових варіацій шрифтів. Однак, при повороті на кут, більший
десяти градусів, даний метод не може бути використаний для розпізнавання
символів. При застосуванні цього методу неважливими стають такі ознаки, як
розмір букви, що розпізнається і навіть шрифт, яким вона надрукована. Проте,
основною проблемою цього методу є ідентифікація знаків, які містять певні
дефекти (наприклад, розрив ліній або з'єднання сусідніх ліній).
Ознаковий
метод
Ознакові методи базуються на тому, що
зображенню ставиться у відповідність N-мірний вектор ознак. Розпізнавання
полягає в порівнянні вектора ознак з набором еталонних векторів тієї ж
розмірності. Переваги методу – простота реалізації, хороша узагальнююча
здатність, висока швидкість розпізнавання. Недолік методу – висока чутливість
до дефектів зображення. Крім того, ознакові методи мають інший недолік — на
етапі виділяння ознак відбувається незворотня втрата частини інформації про
символ. Виділяння ознак проходить незалежно, тому інформація про взаємне
розташування елементів символів втрачається.
Слайд 7. Перетворенням
графічного зображення в текст займаються програми, які використовують
принцип оптичного розпізнавання.
Сучасні програми з OCR вміють:
·
розпізнавати тексти, набрані не лише
різними шрифтами, але й написані екзотичними, у тому числі і рукописними;
·
коректно працювати з текстами, які
містять слова на декількох мовах;
·
розпізнавати таблиці;
·
розпізнавати нечітко
набрані чи написані тексти.
Слайд
8.
Процес
уведення документа в комп'ютер можна розділити на етапи:
1. Сканування. На першому етапі сканер
відіграє роль «ока» Вашого комп'ютера: «переглядає» зображення і передає його
комп'ютеру. При цьому отримане зображення є не чим іншим, як набором чорних,
білих чи кольорових крапок, картинкою, що неможливо відредагувати в жодному
текстовому редакторі.
2. Розпізнавання. Обробка зображення
OCR-системою.
3. Перевірка орфографії.
4. Збереження .
Слайд
9.
FineReader - це універсальна програма для оптичного розпізнавання
тексту, що дозволяє підвищити продуктивність бізнесу при роботі з документами.
Він надає потужні, але водночас прості у використанні інструменти для отримання
доступу до інформації, що міститься у паперових документах і PDF-файлах.
OmniPage
Professional 15 – це найбільш точний механізм конвертації документів
і форм у ваші улюблені програми на PC включаючи документи формату PDF.
Чудова точність і форматування в поєднанні з
просунутими технологіями з автоматизації процесу конвертації. Все, що потрібно для конвертації, редагування і
архівування та обміну документами - це OmniPage Pro 15.
Readiris
Це функціональний
інструмент для розпізнавання тексту, як зі сканера, так і зі збережених файлів
різних форматів (PDF, PNG, JPG і ін.). Хоча по функціоналу дана програма дещо
поступається ABBYY FineReader, але значно перевершує більшість інших
конкурентів. Головною ж фішкою Readiris є можливість інтеграції з цілою низкою
хмарних сервісів для зберігання файлів.
Слайд 10.
FineReader
Online
Сьогодні цей додаток можна вважати одним із найкращих
варіантів OCR. Причин успішного просування цієї програми дуже багато. Перш за
все, це відшліфований алгоритм ідентифікації друкованих символів. Рушій самої
популярної системи оптичного розпізнавання тексту, FineReader, удосконалювався
роками, механізм аналізу зображення поліпшувався від версії до версії. У
програму вносилися різні зміни та покращення, які зменшували кількість
нерозпізнаних або некоректно розпізнаних певних символів при обробці
сканованого зображення. FineReader включає в себе безліч способів і допоміжних
інструментів, які дають можливість виконати тонку настройку програми, поліпшити
якість вихідного зображення, визначити тип розпізнавання символів, встановити
області для обробки і т.д.
OnlineOCR
Сервіс пропонує дуже зручне завантаження файлів – на
сервер можна завантажувати одночасно кілька зображень, запакувавши їх в
ZIP-архів. Максимальний розмір файлу – 20 Мб, але можна використовувати і файли
більшого розміру, однак для отримання такої можливості необхідно зв’язатися з
адміністрацією сервісу. В якості вихідного формату графічного файлу можна
використовувати TIFF (підтримуються в тому числі і багатосторінкові документи),
JPEG / JPG, BMP, PCX, PNG, GIF, PDF.
img2txt
Сервіс
пропонує зручне завантаження файлів, швидкий процес розпізнавання. Результат
розпізнавання можна скопіювати, поділитися, надіслати, опублікувати або
завантажити в Google Docs.
Слайд
11. Підбірка мобільних додатків для розпізнавання тексту (для домашньої
роботи)
ІV.
Усвідомлення набутих знань та формування вмінь і навичок
·
Практичне завдання
Слайд 13.
10-11 клас урок №11 модуля «Основи електронного документообігу» –
«OCR-технології для розпізнавання паперових документів»
Увага! Під час роботи з
комп’ютером дотримуйтеся правил безпеки та санітарно-гігієнічних норм.
Алгоритм роботи
1. Відкрити сервіс для
онлайн розпізнавання документів ABBYY FineReader-online. Перейти за посиланням https://finereaderonline.com
2. У папці «Матеріали до уроку №14» відкрийте
зображення для сканування «Зображення 1».
3. Відредагуйте текст
за потреби.
4. Використовуючи відповідний сервіс, розпізнайте
текст та збережіть його в текстовому редакторі під назвою «Сервіс Abbyy Fine Reader».
2. У папці «Матеріали до уроку №14» відкрийте
зображення для сканування «Зображення 2».
3. Відредагуйте текст
за потреби.
4. Використовуючи відповідний сервіс, розпізнайте
текст та збережіть його в текстовому редакторі під назвою «Сервіс ONLINEOCR».
2. У папці «Матеріали до уроку №14» відкрийте
зображення для сканування «Зображення 3».
3. Відредагуйте текст
за потреби.
4. Використовуючи відповідний сервіс, розпізнайте
текст та збережіть його в текстовому редакторі під назвою «IMG2TXT».
2. У папці «Матеріали до уроку №14» відкрийте зображення
для сканування «Зображення 4».
3. Редагувати текст за
потреби.
4. Використовуючи відповідний сервіс, розпізнайте
текст та збережіть його в текстовому редакторі під назвою «NEWOCR».
Заповнити порівняльну таблицю сервісів для розпізнавання
тексту онлайн
ABBYY FineReader online
|
ONLINEOCR
|
IMG2TXT
|
NEWOCR
|
|
Чи потрібна реєстрація?
|
||||
Етапи розпізнавання
|
||||
Кількість посилок в тексті
|
||||
Малюнки в тексті
|
||||
Переваги
|
||||
Недоліки
|
·
Релаксація
Раз, два, три!
Очі догори!
На чотири, п’ять і шість
Треба міцно їх стулить.
Знову очі догори,
Рахуємо: раз, два, три!
Вправа
для профілактики короткозорості та порушення зору
V.
Підведення підсумків уроку
Бесіда
за питаннями (Слайд
15)
1. Що
означає абревіатура OCR?
2. Технологія
для розпізнавання паперових докмуентів - це…
3. Які є етапи
розпізнавання документів?
4. Який
принцип роботи OCR?
5. Які модулі
OCR?
6. Яке ПЗ
використовується для OCR?
VI.
Домашнє завдання
Слайд
16. Завантажити один із запропонованих додатків
для розпізнавання тексту.
Розпізнати
текст будь-якого підручника (1 сторінка).
Результат
розпізнавання оцінити на наявність посилань.
Зробити
скріншоти етапів розпізнавання.
Визначити
переваги та недоліки.
Результат
оформити в колективну презентацію Google.
(на слайді
повинна бути назва додатку, скріншоти етапів розпізнавання, переваги та
недоліки додатку.
Немає коментарів:
Дописати коментар