Системи розпізнавання тексту або OCR-системи. Системи оптичного розпізнавання документів

Системи розпізнавання тексту або OCR-системи. Системи оптичного розпізнавання документів

OCR & ICR Technology White Paper

  1. Вступ.
    1.1 OCR і ICR-системи. Критерії оцінки систем розпізнавання.

    Сучасні системи оптичного розпізнавання символів (optical character recognition, OCR) можуть бути умовно розділені на дві категорії. Власне OCR-системи вирішують стала класичною завдання розпізнавання друкованихсимволів, нанесених на папір за допомогою принтера, плоттера або друкарської машинки (при цьому мається на увазі, що будь-яка система розпізнавання працює з електронним зображенням документа, зазвичай отримуються за допомогою сканера). Крім того, виділяють клас ICR-систем (intelligent character recognition), в завдання яких входить обробка документів, заповнених друкованими літерами і цифрами від руки, або, інакше кажучи, розпізнавання рукопечатнихсимволів.

    В обох випадках якість функціонування системи розпізнавання може бути оцінений по ряду параметрів. Однак найбільш важливим параметром системи будь-якого типу є точність розпізнавання, зазвичай виражається процентним співвідношенням

    A REC \u003d 100% * N OK / N 0; (1.1)

    де N OK і N 0 є кількість вірно розпізнаних символів і загальна кількість символів документа відповідно. Цілком природно, що виробники OCR \\ ICR-систем в першу чергу фокусують увагу на оптимізації використовуваних алгоритмів з точки зору точності розпізнавання.

    1.2 Технології ABBYY.

    Протягом останніх шести років на світовому ринку присутні OCR \\ ICR-системи, побудовані на базі технологій компанії ABBYY. На сьогоднішній день вони добре відомі і користуються стабільним попитом. Зокрема, програмне ядро \u200b\u200b(engine) OCR-системи ABBYY FineReader ліцензовано і успішно експлуатується такими відомими компаніями, як Cardiff Software, Inc., Cobra Technologies, Kofax Image Products, Kurzweil Educational Systems, Inc., Legato Systems, Inc., Notable Solutions Inc., ReadSoft AB, Saperion AG, SER Systems AG, Siemens Nixdorf, Toshiba Corporations.

    В рамках даного документа будуть описані базові принципи технологій ABBYY, і, крім того, будуть детально розглянуті процедури розпізнавання друкованих (OCR) і рукопечатних (ICR) символів, реалізовані в продуктах ABBYY.

  2. Базові принципи технологій розпізнавання тексту ABBYY.
    2.1 Принципи IPA.

    Перетворення документа в електронний вигляд виконується OCR-системами поетапно: сканування і попередня обробка зображення, аналіз структури документа, розпізнавання, перевірка результатів, потім проводиться реконструкція (відтворення вихідного виду) документа, і експорт. Методи, що застосовуються при розпізнаванні, вельми різноманітні.

    Але, як відомо, найкращі в світі системи оптичного розпізнавання конструює природа. Пристрій ділянок нервової системи, що доставляють і обробних сигнали органів зору, настільки складно, що завдання моделювання живих «распознавателей» в загальному вигляді до сих пір не вирішена наукою. Однак базові принципи їх функціонування вивчені добре і можуть бути використані на практиці. Їх налічують три:

      Принцип цілісності (integrity), Згідно з яким об'єкт розглядається як ціле, що складається з пов'язаних частин. Зв'язок частин виражається в просторових відносинах між ними, і самі частини отримують тлумачення тільки в складі передбачуваного цілого, тобто в рамках гіпотези про об'єкт. Перевага системи, наступної описаних вище правил, виражається в здатності точніше класифікувати розпізнається об'єкт, виключаючи з розгляду відразу безліч гіпотез, що суперечать хоча б до одного з положень принципу.

      принцип цілеспрямованості(Purposefulness): Будь-яка інтерпретація даних переслідує певну мету. Отже, розпізнавання має являти собою процес висунення гіпотез про цілий об'єкті і цілеспрямованої їх перевірки. Зрозуміло, що система, яка діє відповідно до принципу цілеспрямованості, не тільки економніше витрачає обчислювальні потужності, але і значно рідше помиляється.

      Принцип адаптивності (adaptability)має на увазі здатність системи до самонавчання. Отримана при розпізнаванні інформація упорядковується, зберігається і використовується згодом при вирішенні аналогічних завдань. Перевага самообучающихся систем полягає в здатності «спрямлять» шлях логічних міркувань, спираючись на раніше накопичені знання.

    Технології розпізнавання, розроблені компанією ABBYY, побудовані саме на цих принципах. замість повних назв принципів часто вживають абревіатуру IPA, Складену з перших букв відповідних англійських слів. Очевидно, що система розпізнавання, яка працює відповідно до принципів IPA, Буде функціонувати максимально гнучко і точно, на межі осмисленого дії.

    Компанія ABBYY, спираючись на результати багаторічних досліджень, реалізувала принципи IPAв рамках своїх технологій оптичного розпізнавання символів. ABBYY FineReader - єдина в світі OCR-система, яка діє відповідно до вищеописаними принципами на всіх етапах обробки документа.

    Зокрема, на етапі розпізнавання фрагмент зображення, згідно принципом цілісності, Буде інтерпретований як якийсь об'єкт (символ), тільки якщо на ньому присутні всі структурні частини цього об'єкта, і ці частини знаходяться в відповідних відносинах. Тому ABBYY FineReader не намагається приймати рішення, перебираючи тисячі еталонів в пошуках найбільш підходящого. Замість цього висувається ряд гіпотез щодо того, на що схоже виявлене зображення, потім кожна гіпотеза цілеспрямованоперевіряється. Причому перевіряти, чи вірна висунута гіпотеза, система буде, використовуючи принцип адаптивності, Спираючись на накопичені раніше відомості про можливі накресленнях символу в розпізнається документі.

    2.2 Багаторівневий аналіз документа. MDA.

    На етапі аналізу та попередньої обробки зображення перед будь-OCR -системою стоять два основні завдання: по-перше, підготувати зображення до процедур розпізнавання, по-друге, виявити структуру документа - з тим, щоб в подальшому мати можливість відтворити її в електронному вигляді. Процедури попередньої обробки будуть розглянуті в наступному розділі, зараз же звернемося до задачі аналізу структури.

    Найбільшого поширення набули так звані методи аналізу ієрархічної структури документа. При аналізі структури в рамках цих методів зазвичай виділяють кілька ієрархічно організованих логічних рівнів. Об'єкт найвищого рівня тільки один - власне сторінка, на наступному ступені ієрархії розташовуються таблиця, текстовий блок і картинка, і так далі (рис.1). Зрозуміло, що будь-який об'єкт може бути представлений як набір об'єктів нижчого рівня.

    Рис.1. Ієрархічна структура документа

    Більшість сучасних OCR-систем веде аналіз документа відповідно до одним з таких принципів: top - down ( «зверху вниз») або bottom - up ( «знизу вгору»). Аналіз документа за принципом top - down, як випливає з назви, ведеться в напрямку зверху вниз. Система ділить сторінку на об'єкти, їх, в свою чергу - на об'єкти нижчих рівнів, і так далі, аж до символів. Системи, в основу яких покладено другий принцип, навпаки, починають аналіз з пошуку одиночних знаків. Потім формується уявлення про те, як знайдені символи були складені в слова, і так далі, аж до формування повного електронного аналога сторінки.

    Для прийняття рішень щодо того чи іншого об'єкта нерідко використовується механізм так званого «голосування», voting. Суть даного методу полягає в паралельній виробці кількох гіпотез щодо об'єкта і передачі їх «експерту», \u200b\u200bлогічного блоку, яка обирає одну з них.

    Такий метод широко практикувався протягом останнього десятиліття; зокрема, існують OCR-системи, буквально складені з двох або більше незалежних механізмів розпізнавання із загальним «експертом» на виході. Втім, як показала практика, подібне побудова добре саме в тих випадках, коли OCR-програма використовує «чужі», ліцензовані механізми розпізнавання. У ситуації, коли інформація про всі тонкощі роботи кожного распознавателя недоступна виробнику програми, таке рішення виявляється найбільш зручним. Якщо ж виробник розробляє розпізнавачі своїми силами, то якість розпізнавання можна поліпшити більш ефективними способами. Саме про них і піде мова в даному документі.

    Розробники компанії ABBYY створили унікальний алгоритм багаторівневого аналізу документа - його називають MDA(Multilevel document analysis) - дозволяє об'єднати переваги обох вищеописаних принципів. У рамках MDAструктура сторінки розглядається подібно до того, як це робиться за методом top - down, а відтворення документа в електронному вигляді після закінчення розпізнавання ведеться «від низу до верху», аналогічно методу bottom - up. При цьому в алгоритм доданий механізм зворотнього зв'язку, Що охоплює всі рівні аналізу, що дозволило різко знизити ймовірність грубих помилок, пов'язаних з неправильним розпізнаванням об'єктів високих рівнів.

    Можливості нового алгоритму виявилися значно ширше, ніж у прототипів. Зауважимо, що об'єкти будь-якого рівня OCR-системи ABBYY розпізнають в повній відповідності з принципами IPA: В першу чергу висуваються гіпотези щодо типів виявлених об'єктів, потім вони цілеспрямовано перевіряються. При цьому враховуються знайдені раніше особливості даного документа, а також зберігається вся знову надходить інформація.

    Розглянемо особливості алгоритму MDAна наступному прикладі. Припустимо, на сторінці виділено ряд об'єктів, один з яких ідентифікований як текстовий блок. Однак в процесі вивчення структури блоку виявляється специфічне вирівнювання, аналіз поділяють слова інтервалів показує, що блок не містить зв'язного тексту, навіть якщо допустити, що він набраний з розрядкою. На підставі накопиченої інформації приймається рішення переглянути результати попереднього рівня аналізу: це не текстовий блок, а таблиця без розділових ліній. Після чого розпізнавання блоку триває у звичайному порядку, але тепер воно буде проведено практично без помилок, і в підсумковому документі таблиця буде відтворено саме як таблиця.

    Одним словом, за рахунок того, що результати аналізу на одному з нижніх рівнів завжди можуть вплинути на дії з об'єктами більш високих рівнів, досягається багаторазове збільшення точності розпізнавання в порівнянні з типовими алгоритмами.

    Ми коротко розглянули основні принципи технологій оптичного розпізнавання символів ABBYY. Як згадувалося, розпізнавання будь-якого документа проводиться поетапно, за допомогою вдосконаленої процедури багаторівневого аналізу документа (MDA). Розподіл сторінки на об'єкти нижчих рівнів, аж до окремих символів, розпізнавання символів і «збірку» електронного документа ABBYY FineReader проводить, спираючись на принципи цілісності, цілеспрямованостіі адаптивності (IPA).


    Вищенаведене опис вельми і вельми загально. Ми розглянули базові принципи, не висвітливши власне процес розпізнавання. В рамках наступного розділу будуть детально описані всі етапи роботи з об'єктами різних рівнів документа аж до окремих символів.
  3. Опис OCR-процедури.
    3.1 Попередня обробка зображення.

    Обробка документа починається з отримання графічного образу (зображення) сторінки. Сучасні OCR-системи підтримують обидва основні способи отримання зображень, з файлу і від сканера. Взаємодія зі сканером зазвичай здійснюється засобами універсального протоколу TWAIN. Так чи інакше, вхідними даними для OCR-програми служить кольорове (глибина кольору 24 біт) або півтонове (глибина кольору 8 біт) зображення документа.

    3.2 Розпізнавання об'єктів вищих рівнів. Бінаризація.

    Перш, ніж приступити до структурування сторінки, виділенню та ідентифікації блоків, OCR-система виробляє бінаризація, Тобто перетворення кольорового або напівтонового образу в монохромний (глибина кольору 1 біт). Однак сучасні документи часто містять такі елементи дизайну, як фонові текстури або зображення. Після типовий процедури бинаризации будь-яка текстура залишить велика кількість «зайвих» точок, розташованих навколо символів і різко знижують якість розпізнавання. Бінаризація фонових зображень призводить до аналогічних наслідків. Тому здатність системи правильно відокремлювати текст від «підкладених» текстур і картинок дуже важлива.


    Рис.2. Обробка процедурою IBF документа з фонової текстурою.

    Ілюстрацією останньої тези може послужити приклад, показаний на рис.2. Як показують численні експерименти, OCR-система, що починає обробку цієї або схожою сторінки з типовою процедури бинаризации, показує вкрай низький результат. В середньому точність на сторінках подібного виду становить для різних систем від 31,1% до 62,7%, що фактично рівносильно відмові від розпізнавання.

    Однак ABBYY FineReader цілком коректно обробляє подібні документи; як показують експерименти, середня точність розпізнавання сторінок такого виду дорівнює 98,7% . Успішно вирішити вищеописану проблему дозволяє процедура інтелектуальноїфільтрації фонових текстур,(Intelligent background filtering, IBF). Запускається при необхідності, в залежності від результатів попереднього аналізу сторінки, ця процедура дозволяє впевнено відокремлювати текст від як завгодно складного фону. Більш того, і виділення об'єктів вищих рівнів - текстових блоків, таблиць, тощо - на сторінках складної структури після обробки процедурою IBFвиконується значно точніше.

    Однак наявність фонових зображень або текстур - далеко не єдина особливість документа, здатна знизити якість розпізнавання. Наприклад, сторінка, показана на рис.3, не містить явно виражених фонових елементів. Однак спроба обробки її засобами більшості OCR-систем призведе до неприпустимо низьких результатів. Причиною тому невисока контрастність оригіналу, а також спостерігається протягом більшості рядків помітна зміна яскравості фону. Звичайна OCR-система, підібравши параметри бинаризации для однієї ділянки документа, не зможе впевнено виділити об'єкти на сусідніх ділянках - вони виявляться або «засвіченими», або «зачорненими».


    Рис.3. Без обробки процедурою адаптивної бинаризации цей документ розпізнається погано.

    Технології, розроблені фахівцями ABBYY, дозволяють вирішити і цю проблему. процедура адаптивної бинаризации(Adaptive binarization, AB) Здатна гнучко вибирати оптимальні для даної ділянки (фрагмента рядка або навіть слова) параметри бинаризации. Вдавшись до адаптивної бинаризации, ABBYY FineReader досліджує яскравість фону і насиченість чорного кольору протягом всього рядка і підбере оптимальні параметри перетворення для кожного фрагмента окремо. В результаті, як рядки, так і окремі слова будуть виділені правильно, що підвищить загальну точність розпізнавання A REC.

    Вельми показовими є результати порівняльного дослідження, проведеного на базі зображень, подібних показаному на рис.3. Методика тестування докладно описана в, результати представлені в наведеної нижче таблиці.

    Таблиця 1.
    Підвищення якості розпізнавання
    за рахунок застосування адаптивної бинаризации.

    Як видно з таблиці, застосування адаптивної бинаризации дозволяє істотно підвищити точність розпізнавання. З точки зору технічного виконання, ідея AB, Що є частиною вдосконаленого алгоритму MDA, Полягає в використанні зворотного зв'язку для оцінки якості перетворення тієї чи іншої ділянки. Узагальнена блок-схема алгоритму процедури адаптивної бинаризации приведена на рис. 4.


    Рис.4. Узагальнена блок-схема алгоритму процедури адаптивної бинаризации.

    3.3 Розпізнавання символів. Класифікатори.

    Розподіл рядки на слова і слів на букви в програмному ядрі ABBYY FineReader виконується так званої процедурою лінійного поділу. Процедура завершується після досягнення кінця рядка і передає для подальшої обробки список гіпотез, висунутих щодо можливих варіантів поділу. При цьому кожній гіпотезі приписується певну вагу; за змістом ця величина відповідає чисельному висловом впевненості. Відповідний кожної з гіпотез набір графічних об'єктів рівня «символ» надходить на вхід механізму розпізнавання символів. Останній являє собою комбінацію ряду елементарних распознавателей, званих класифікаторами.


    Рис.5. Спрощена схема роботи класифікатора.

    У загальному вигляді роботу класифікатора ілюструє схема рис.5. Як показано, після закінчення обробки класифікатор породжує список гіпотез щодо належності чергового зображення до того чи іншого класу, або - в тому випадку, коли вхідні дані вже є список - відповідним чином змінює ваги наявних гіпотез, підтверджує або спростовує їх. Вихідний список завжди ранжований за вагою (впевненості).

    Однією з найважливіших характеристик класифікатора є середнє положення правильної гіпотези. Це обумовлено особливостями процедур контекстної і словникової перевірки, зазвичай задействуемих на етапах подальшої обробки списків гіпотез. Згадані процедури істотно збільшують загальну точність розпізнавання, однак лише в тому випадку, якщо правильний варіант в списку розташований не дуже глибоко. Для оцінки середнього положення правильного варіанту можуть бути використані різні критерії, наприклад, точність за першими трьома варіантами розпізнавання, Тобто відсоток символів, для яких правильна гіпотеза виявилася не нижче третього місця в вихідному списку.

    Крім того, серед важливих характеристик класифікатора називають точність за першим варіантом розпізнавання, швидкодія, простоту реалізації, а також стійкість до різних спотворень, яке трапляється в реальних документах (розірвані, залиті, сильно змінили свою форму символи).

    У системах розпізнавання, побудованих на технологіях ABBYY, застосовуються такі типи класифікаторів: растровий, признаковая, признаковая диференційний, контурний, структурний і структурний диференційний. Розглянемо властивості і особливості кожного з них.

      Растровий класифікатор.
      Принцип дії заснований на прямому порівнянні зображення символу з еталоном. Ступінь відмінності при цьому обчислюється як кількість незбіжних пікселів. Для забезпечення прийнятної точності реєстрового класифікатора потрібна попередня обробка зображення: нормалізація розміру, нахилу і товщини штриха. Еталон для кожного класу зазвичай отримують шляхом усереднення зображення символів навчальної вибірки.

      Цей класифікатор простий в реалізації, працює швидко, стійкий до випадкових дефектів зображення, проте має відносно невисоку точність. Широко використовується в сучасних системах розпізнавання символів. В системі ABBYY FineReader на початковому етапі розпізнавання для швидкого породження попереднього списку гіпотез задіяна одна з різновидів реєстрового класифікатора. Точність цього засобу розв'язання, оцінена за першими трьома позиціями списку, складає 99,29% 97,57% .

      Признаковая класифікатор.
      Принцип дії: зображенню ставиться у відповідність N-мірний вектор ознак. Власне класифікація полягає в порівнянні його з набором еталонних векторів тієї ж розмірності. Тип і кількість ознак в чималому ступені визначають якість розпізнавання. Формування вектора (обчислення його координат в N-мірному просторі) проводиться під час аналізу попередньо підготовленого зображення. Даний процес називають витяганням ознак. Еталон для кожного класу отримують шляхом аналогічної обробки символів навчальної вибірки.


      Рис.6. Блок-схема роботи признакового класифікатора.

      Порівняння кожної пари векторів полягає в обчисленні оцінки, що характеризує відстань між точками в N-вимірному просторі (точка - геометричне уявлення такого вектора). Приклад, який ілюструє даний метод, Наведено на рис.7; для наочності в цьому прикладі ми вважаємо N \u003d 2, тобто вектора знаходяться в звичайному двовимірному просторі. Координати X0, Y0 вектора-еталона обчислені заздалегідь, при навчанні класифікатора, тоді як X1, Y1 отримані на етапі отримання ознак. Зрозуміло, що чим менше виявляється значення оціночної величини | L |, тим точніше аналізоване зображення відповідає даним стандартом, отже, тим вищий вага буде присвоєно класифікатором до цієї гіпотези. У загальному вигляді залежність, за якою визначається | L |, записується таким чином:

      Основні переваги признакового класифікатора - простота реалізації, хороша узагальнююча здатність, хороша стійкість до змін форми символів, низьке число відмов від розпізнавання, високу швидкодію. Найбільш серйозний його недолік - нестійкість до різних дефектів зображення. Крім того, прізнаковие класифікатори мають інший серйозним недоліком - на етапі отримання ознак відбувається необоротна втрата частини інформації про символ. Витяг ознак ведеться незалежно, тому інформація про взаємне розташування елементів символу втрачається.

      Точність роботи признакового класифікатора сильно залежить від якості обраних ознак. Під якістю в даному випадку розуміється їх здатність максимально точно, але не надмірно, охарактеризувати накреслення символу. Точних правил відбору ознак не існує, тому класифікатори від різних розробників оперують різними наборами ознак.

      Цей тип класифікаторів вельми популярний у розробників OCR-систем. В системі ABBYY FineReader використовується признаковая класифікатор з числом ознак N \u003d 224. Його призначення - той же, що у реєстрового класифікатора - швидке породження списку попередніх гіпотез. Точність використовуваної різновиди за першими трьома варіантами списку гіпотез становить 99,81% , Точність за першим варіантом 99,13% .

      Контурний класифікатор.
      Відособлена різновид признакового класифікатора. Відрізняється від останнього тим, що для вилучення ознак використовує контури, попередньо виділені на зображенні символу. Принципи функціонування, основні переваги та недоліки збігаються з названими вище.

      Цей класифікатор призначений для розпізнавання тексту, набраного декоративними шрифтами (наприклад, стилізованого під готичний, старорусский стиль, і т.п.). Працює трохи повільніше звичайного простору ознак класифікатора. Точність контурного класифікатора за першими трьома варіантами 99,30% , Точність за першим варіантом 95,10% .

      Признаковая диференційний класифікатор.
      Призначений для розрізнення схожих один на одного об'єктів, таких, наприклад, як буква «m» і поєднання «rn». Аналізує тільки ті області зображення, де може перебувати інформація, що дозволяє віддати перевагу одному з варіантів. Так, у випадку з «m» і «rn» ключем до відповіді служить наявність і ширина розриву в місці торкання передбачуваних букв.

      Признаковая диференційний класифікатор (ГДК) п редставляет собою набір прізнакових класифікаторів. Ці останні оперують еталонами, отриманими для кожної пари схожих символів. Для всіх пар використовується один і той же набір ознак, аналогічний наявному у відповідного простору ознак класифікатора. ГДК відрізняється хорошою швидкодією. Використовується в різних системах розпізнавання символів.

      В процесі навчання цього класифікатора проводиться аналіз зображень з навчальної бази. Обчислювані при цьому значення ознак інтерпретуються як координати точки в N-вимірному просторі. Відповідно, для двох різних символів виходить два «хмари» точок, розташовані на деякій відстані один від одного. Коли накопичена інформація про достатню кількість точок, виконується обчислення координат гиперплоскости. Вона повинна розділити простір таким чином, щоб «хмари» опинилися по різні боки і приблизно на одній відстані від гиперплоскости.


      Рис.8. Спрощена геометрична модель навчання
      диференціального класифікатора.

      Набір величин, відповідний координатам гиперплоскости, використовується при розпізнаванні як еталон для даної пари символів. Для отриманих при аналізі зображення значень обчислюється оцінка, геометричний сенс якої - місцезнаходження точки щодо гиперплоскости. Слід зазначити, що для кожної пари символів необхідно ретельно вибрати область, в якій будуть обчислюватися ознаки (іноді для цих цілей беруться схожі на звичайні ознаки з признакового і контурного класифікаторів). Через це побудова еталонів для ГДК надзвичайно трудомістким, і загальна їх кількість досить обмежена.

      Вхідними даними для ГДК служить не тільки зображення, але і список гіпотез, сформований на ранній стадії розпізнавання. Від того, в якому півпросторі і на якій відстані від гиперплоскости виявиться точка, залежить, вага якої гіпотези буде збільшений класифікатором. Сам ГДК не висуває нових гіпотез, але змінює ваги вже наявних в списку, в тому випадку, якщо серед представлених в списку є пари гіпотез, для яких існують еталони. При цьому використовується алгоритм так званої бульбашкового сортування. Гіпотези перебираються з кінця списку і послідовно «спливають» після порівняння з менш ймовірними, при цьому проводиться коригування ваги. Такий алгоритм гарантує, що правильна гіпотеза виявиться на першому місці тоді і тільки тоді, коли диференціальне порівняння з усіма вищими гіпотезами дає позитивний результат.

      Точність ГДК не може бути обчислена методом, що застосовувався для вищеописаних видів, проте може бути оцінена побічно. На рис.9 представлена \u200b\u200bсхема распознавателя, що використовується в системах ABBYY. Растровий (РК) і просторі ознак (ПК) класифікатори використовуються для швидкого породження попереднього списку гіпотез. У тому випадку, якщо впевненість гіпотези з найбільшою вагою P 1 не перевищує заданого порогового значення P поріг, контурний класифікатор (КК) висуває ряд додаткових гіпотез. Список надходить на вхід ГДК, який робить сортування. Настільки складна схема запуску класифікаторів дозволяє оптимізувати співвідношення якості і швидкості розпізнавання. Точність цього засобу розв'язання за першими трьома варіантами становить 99,87% , Точність за першим варіантом 99,26% .


      Рис.9. Узагальнена блок-схема алгоритму розпізнавання (перший рівень).

      Структурно-диференційний класифікатор.
      Був розроблений і спочатку застосовувався для обробки рукописних текстів. Як і п різнаково-диференційний, цей класифікатор вирішує завдання розрізнення схожих об'єктів. Вхідними даними для структурно-диференціального класифікатора (КФОР) також є ранжируваних список гіпотез і зображення символу.

      Для кожної пари гіпотез СДК обчислює значення ознак, аналізуючи відповідні фрагменти зображення. Ознаки, заздалегідь певні розробниками, дозволяють розрізняти кожну конкретну пару символів, спираючись на відомості, накопичені при навчанні класифікатора. При цьому точність розпізнавання суттєво зростає, коли для кожної пари символів обрані індивідуальні ознаки.

      Наприклад, для розрізнення Cі Gкласифікатор аналізує область зображення, відповідну нижнього правого кута символу. Одним з індивідуальних для даної пари ознак буде наявність (або відсутність) двох горизонтальних відрізків, що розходяться від кінця зверненої донизу дуги. Сама ця дуга, як нескладно бачити, присутній в обох символах.

      Структурно-диференційний класифікатор працює повільніше, ніж всі вищеназвані, а процес його навчання ще більш трудомісткий, ніж для ГДК. Тому СДК використовується в основному для обробки тих пар символів, які не вдалося добре розрізнити простору ознак диференціальним класифікатором. Важливою перевагою СДК є його вельми висока точність. Аналогічно ГДК, цей класифікатор використовує алгоритм бульбашкового сортування списку. Стійкий майже до всіх випадковим спотворень форми символу, за винятком запечатування.

      Застосовується тільки в системах розпізнавання компанії ABBYY. Точність распознавателя (рис.9) при додаванні на виході структурно-диференціального класифікатора збільшується до 99,88% за першими трьома варіантами і до 99,69% за першим варіантом.

      Структурний класифікатор.
      Одна з революційних розробок компанії ABBYY. Спочатку був створений і використовувався для розпізнавання рукопечатного тексту (ICR), потім був успішно застосований і для обробки.

Уявіть, вам треба оцифрувати журнальну статтю або роздрукований договір. Звичайно, ви можете провести кілька годин, передруковуючи документ і виправляючи помилки. Або ви можете перевести всі необхідні матеріали в редагований формат за кілька хвилин, використовуючи сканер (або цифрову камеру) і програму для оптичного розпізнавання символів (OCR).

Що мають на увазі під технологією оптичного розпізнавання символів

Оптичне розпізнавання символів (англ. Optical Character Recognition - OCR) - це технологія, яка дозволяє перетворювати різні типи документів, такі як відскановані документи, PDF-файли або фото з цифрової камери, в редаговані формати з можливістю пошуку.

Припустимо, у вас є паперовий документ, наприклад, стаття в журналі, брошура або договір в форматі PDF, присланий вам партнером по електронній пошті. Очевидно, для того щоб отримати можливість редагувати документ, його недостатньо просто відсканувати. Єдине, що може зробити сканер, - це створити зображення документа, що представляє собою всього лише сукупність чорно-білих або кольорових крапок, тобто растрове зображення.

Для того щоб копіювати, витягувати і редагувати дані, вам знадобиться програма для розпізнавання символів, яка зможе виділити в зображенні букви, скласти їх в слова, а потім об'єднати слова в пропозиції, що в подальшому дозволить отримувати доступ до вмісту вихідного документа.

Які принципи лежать в основі технології FineReader OCR?

Найбільш досконалі системи розпізнавання символів, такі як ABBYY FineReader OCR, роблять акцент на використанні механізмів, створених природою. В основі цих механізмів лежать три фундаментальних принципи: цілісність, цілеспрямованість і адаптивність (принципи IPA).

Зображення, згідно з принципом цілісності, буде інтерпретовано як якийсь об'єкт, тільки якщо на ньому присутні всі структурні частини цього об'єкта і ці частини знаходяться в відповідних відносинах. Інакше кажучи, ABBYY FineReader не намагається приймати рішення, перебираючи тисячі еталонів в пошуках найбільш підходящого. Замість цього висувається ряд гіпотез щодо того, на що схоже виявлене зображення. Потім кожна гіпотеза цілеспрямовано перевіряється. І, допускаючи, що знайдений об'єкт може бути буквою А, FineReader буде шукати саме ті особливості, які повинні бути у зображення цієї літери. Як і слід чинити, виходячи з принципу цілеспрямованості. Принцип адаптивності означає, що програма повинна бути здатна до самонавчання, тому перевіряти, чи вірна висунута гіпотеза, система буде, спираючись на накопичені раніше відомості про можливі накресленнях символу в даному конкретному документі.

Яка технологія лежить в основі OCR?

Компанія ABBYY, спираючись на результати багаторічних досліджень, реалізувала принципи IPA в комп'ютерній програмі. Система оптичного розпізнавання символів ABBYY FineReader - єдина в світі система OCR, яка діє відповідно до вищеописаними принципами на всіх етапах обробки документа. Ці принципи роблять програму максимально гнучкої та інтелектуальної, гранично наближаючи її роботу до того, як розпізнає символи людина. На першому етапі розпізнавання система посторінково аналізує зображення, з яких складається документ, визначає структуру сторінок, виділяє текстові блоки, таблиці. Крім того, сучасні документи часто містять всілякі елементи дизайну: ілюстрації, колонтитули, кольоровий фон або фонові зображення. Тому недостатньо просто знайти і розпізнати виявлений текст, важливо з самого початку визначити, як влаштований розглянутий документ: чи є в ньому розділи та підрозділи, посилання і виноски, таблиці і графіки, зміст, проставлені чи номери сторінок і т. Д. Потім в текстових блоках виділяються рядки, окремі рядки діляться на слова, слова на символи.

Важливо відзначити, що виділення символів і їх розпізнавання також реалізовано у вигляді складових частин єдиної процедури. Це дозволяє в повній мірі використовувати переваги принципів IPA. Виділені зображення символів надходять на розгляд механізмів розпізнавання букв, званих класифікаторами.

В системі ABBYY FineReader застосовуються класифікатори наступних типів: растровий, признаковая, контурний, структурний, признаковая-диференційний і структурно-диференційний. Растровий і просторі ознак класифікатори аналізують зображення і висувають кілька гіпотез про те, який символ на ньому представлений. В ході аналізу кожної гіпотези присвоюється певна оцінка (так званий вага). За підсумками перевірки ми отримуємо список гіпотез, проранжувати за вагою (тобто за ступенем впевненості в тому, що перед нами саме такий символ). Можна сказати, що в даний момент система вже «здогадується», на що схожий розглянутий символ.

Після цього відповідно до принципів IPA ABBYY FineReader проводить перевірку висунутих гіпотез. Це робиться за допомогою диференціального признакового класифікатора.

Крім того, слід зазначити, що ABBYY FineReader підтримує 192 мови розпізнавання. Інтеграція системи розпізнавання зі словниками допомагає програмі при аналізі документів: розпізнавання відбувається більш точно і спрощує подальшу перевірку результату з урахуванням даних про основне мовою документа і словникової перевірки окремих припущень. Після докладної обробки величезного числа гіпотез програма приймає рішення і надає користувачеві розпізнаний текст.

Розпізнавання цифрових фотографій

Зображення, отримані за допомогою цифрової камери, відрізняються від відсканованих документів або PDF, що представляють собою зображення.

У них часто можуть бути певні дефекти, наприклад спотворення перспективи, засвічення від фотоспалаху, вигини рядків. При роботі з більшістю додатків такі дефекти можуть істотно ускладнити процес розпізнавання. У зв'язку з цим останні версії ABBYY FineReader містять технології попередньої обробки зображення, які успішно виконують завдання з підготовки зображень до розпізнавання.

Як користуватися OCR-програмами

Технологія ABBYY FineReader OCR проста у використанні - процес розпізнавання в цілому складається з трьох етапів: відкриття (або сканування) документа, розпізнавання і збереження в найбільш підходящому форматі (DOC, RTF, XLS, PDF, HTML, TXT і т. Д.) Або перенесення даних безпосередньо в офісні програми, такі як Microsoft® Word®, Excel® або додатки для перегляду PDF.

Крім того, остання версія ABBYY FineReader дозволяє автоматизувати завдання з розпізнавання та конвертації документів за допомогою програми ABBYY Hot Folder. За допомогою нього можна налаштовувати однотипні або повторювані завдання по обробці документів і збільшити продуктивність роботи.

Які переваги ви отримуєте від роботи з OCR-програмами

Висока якість технологій розпізнавання тексту ABBYY OCR забезпечує точну конвертацію паперових документів (сканів, фотографій) і PDF-документів будь-якого типу в редаговані формати. Застосування сучасних OCR-технологій дозволяє заощадити багато сил і часу при роботі з будь-якими документами. З ABBYY FineReader OCR ви можете сканувати паперові документи і редагувати їх. Ви можете отримувати цитати з книг і журналів і використовувати їх без передруку. За допомогою цифрової фотокамери і ABBYY FineReader OCR ви можете моментально зробити знімок побаченого постера, банера, а також документа або книги, коли під рукою немає сканера, і розпізнати отримане зображення. Крім того, ABBYY FineReader OCR можна використовувати для створення архіву PDF-документів з можливістю пошуку.

Весь процес перетворення з паперового документа, зображення або PDF займає менше хвилини, а сам розпізнаний документ виглядає в точності як оригінал!

У практичній діяльності часто зустрічаються ситуацій, коли необхідно перевести в електронний вигляд документ, надрукований на папері. В цьому випадку можна просто набрати документ на комп'ютері, що досить трудомістким, або скористатися сканером і OCR-системою.

Системи оптичного розпізнавання тексту (Optical Character Recognition - OCR-системи) призначені для автоматичного введення друкованих документів в комп'ютер.

Сучасні програми розпізнавання тексту не тільки помиляються рідше, ніж жива людина, але і забезпечують перевірку орфографії, автоматичне форматування тексту і масу інших додаткових зручностей.

В останні роки провідні позиції на російському ринку «распознавалок» утримують програми FineReader і CuneiForm. Незважаючи на свої хитромудрі назви, обидві програми вітчизняного виробництва і цілком хорошої якості.

Найчастіше для сканування використовують планшетний сканер, як найбільш доступний для рядового користувача. При скануванні необхідно дотримуватися певних вимоги , Від яких залежить успішність подальше розпізнавання тексту:

1. Вибираючи оригінал для сканування необхідно пам'ятати, що чим краще якість оригіналу, тим краще будуть результати сканування і подальшого розпізнавання.

2. Перевіряти будь-яке зображення (для подальшого розпізнавання) краще в відтінках сірого - кольорове зображення при розпізнавання дає додаткові похибки. Глибина кольору великого значення не має, краще вибирати 8bit, так як при більшій глибині збільшується розмір файлу, а, отже, зменшиться швидкість обробки зображення програмою розпізнавання.

3. Дозвіл повинен бути не менше 300dpi

На даний момент існує більше 20-ти програм, основна функції яких - розпізнавання тексту.

Однією з популярних комерційних програм оптичного розпізнавання текстів є програма FineReader (Http://www.abbyy.ru/finereader/), створена компанією ABBYY Software House.

FineReader- шріфтонезавісімая система оптичного розпізнавання текстів. Це означає, що вона дозволяє розпізнавати тексти, набрані практично будь-якими шрифтами. Особливостями програми FineReader є висока точність розпізнавання і мала чутливість до дефектів друку, що досягається завдяки застосуванню технології цілісного цілеспрямованого адаптивного розпізнавання.



Програма відповідає вимогам сумісності з новими операційними системами Microsoft, Macintosh, Linux і інших ОС.

Таблиця 9. Порівняння мовної функціональності продуктів FineReader для різних ОC

Програма дозволяє розпізнавати з високою точністю тексти на 198 мовах. Серед них природні мови (російська, англійська та ін.), Штучні мови (ідо, інтерлінгва, окциденталь, есперанто), мови програмування (Basic, JAVA, Pascal, Fortran, C / C ++, прості хімічні формули). Версія програми для Mac OS не підтримує штучні мови і дає найменшу кількість мов для роботи. Максимальне число мов дає версія програми для ОС на базі ядра Linux. Програма дозволяє виводити на друк вихідне зображення і розпізнаний текст, зберігати відскановане зображення в різних форматах, налаштовувати панелі інструментів програми.

На думку розробників поліпшення, внесені в одинадцяту версію ПО дозволили збільшити швидкість обробки документа на 20%, покращилася якість обробки окремих елементів (картинок, графіків, штрих-кодів, таблиць, колонтитулів, заголовок, текст на полях та ін.).

Завдяки застосуванню технології Adaptive Document Recognition Technology ( цілісного цілеспрямованого адаптивного розпізнавання) ABBYY FineReader 11 чудово зберігає вихідну структуру багатосторінкових документів, включаючи розташування тексту, таблиць, колонтитулів, приміток, нумерацію сторінок, змісту, змісту та ін.

У новій версії з'явилася можливість форматувати документи безпосередньо в програмі. Покращений режим перевірки результату розпізнавання дозволить швидко виправити помилки в тексті.

Крім звичних форматів в новій версії з'явилася можливість зберігати результати розпізнавання в популярні формати електронних книг (fb2, ePub і ін.), Що допоможе швидко зробити електронну копію для портативного пристрою - бук-рідера, планшета, смартфона, і ін.

Крім продукту, що вимагає установки на комп'ютер, існує on-line сервіс, що надається на сайті розробника (http://finereader.abbyyonline.com/ru). Потрібна реєстрація на сайті. На даний момент в день можна розпізнавати безкоштовно по 4 сторінки. На цьому ж сайті представлений хмарний ресурс ABBYY Cloud OCR SDK, надає можливість розпізнавання документів на сервері компанії. (Http://www.ocrsdk.com/). Надається пробний період (90 днів) протягом якого сервісом можна користуватися безкоштовно, проте розпізнати можна не більше 50-ти сторінок. У разі необхідності розпізнати більшу кількість сторінок, то на сайті пропонуються комерційні пакети.

технологія розпізнавання

Складність машинного розпізнавання текстів полягає в тому, що його неможливо побудувати за чітким алгоритмом хоча б тому, що для написання однієї і тієї ж букви існує безліч варіантів написання (шрифт, накреслення). Для того, щоб отримати коректний результат система повинна їх «осмислити». Іншими словами, для розпізнавання тексту потрібно моделювання міркувань людини в подібній ситуації, а це прийнято позначати терміном «штучний інтелект».

Виходячи з принципу цілісності распознаваемое зображення розглядається як єдиний об'єкт, що складається з частин, пов'язаних між собою просторовими співвідношеннями. За принципом цілеспрямованості розпізнавання будується як процес висування і цілеспрямованої перевірки гіпотез про об'єкт, а принцип адаптивності має на увазі здатність системи до самонавчання.

Для висунення гіпотез про те, що може являти собою зображення, застосовуються так звані прізнаковие класифікатори. Вони використовують ряд ознак, на основі яких програма обчислює ступінь близькості розпізнається зображення і відомих їй класів зображень, після чого видає список відповідних класів, т. Е. Гіпотезу про належність об'єкта до того чи іншого класу. Крім того, прізнаковие класифікатори застосовуються також і для підвищення точності розпізнавання зображень з дефектами.

Отриманий набір класів послідовно перевіряється структурним класифікатором, які аналізують кожен символ. Скажімо, якщо FineReader вважає, що на сторінці зображена буква «Ф», він спеціально перевіряє ті ознаки, які повинні бути саме у літери «Ф», а не у будь-якої іншої, порівнюючи цей символ зі структурним еталоном. Структурний стандарт визначає символ як комбінацію структурних елементів (відрізок, дуга, кільце, точка), що знаходяться в певних відносинах між собою. Процес розпізнавання ділиться на етапи виділення структурних елементів в зображенні і зіставлення їх з еталоном.

Якщо в остаточний список потрапило більш як гіпотези вони попарно порівнюються за допомогою диференціальних класифікаторів. Якщо структурний класифікатор при розпізнаванні символів не може однозначно вибрати одну з двох букв зі схожим написанням, між цими конкуруючими гіпотезами робиться диференційний вибір. Наприклад, є дві гіпотези: розпізнається символ представляв собою малу літеру "ь" або "ь". Щоб зробити вибір, FineReader цілеспрямовано проаналізує лівий верхній кут літери, де є єдина відмітна деталь між цими буквами.

Із завершенням роботи диференціального класифікатора закінчується розпізнавання і починається етап перевірки підсумкового списку гіпотез. Остаточна стадія розпізнавання здійснюється системою контексту - при наявності певної кількості розпізнаних літер з слова програма, використовуючи словник, може «здогадатися», що це за слово.

Базові принципи цілісності, цілеспрямованості і адаптації залишаються незмінними від версії до версії програми FineReader, адже саме вони дозволяють комп'ютеру наблизитися до логіки мислення людини.

Крім описаної вище програми існують і інші програми.

Microsoft пропонує користувачам ПО, яке може допомогти в перекладі тексту в електронний варіант: Microsoft Office Document Imaging входить до складу пакета Microsoft Office, дозволяв розпізнавати відскановані документи. Чи не доступний в версії Microsoft Office 2010. ПО може читати невеликі зображення формату TIFF. Точність розпізнавання невисока, пред'являє дуже високі вимоги до якості і орієнтації відсканованого документа.

Вільно розповсюджувана відкрита OCR-система CuneiForm (Http://www.cuneiform.ru/), яка є попередницею систем промислового розпізнавання і розуміння документів. Багато технологічні нововведення, результати наукових досліджень, покладені в основу CuneiForm, успішно застосовуються і удосконалюються донині в комерційних продуктах Cognitive Technologies. До 2009 року поширювалася як комерційна, з цього моменту зупинився процес оновлення.

Результати роботи програми можна редагувати в офісних програмах та текстових і зберігати в популярних форматах, проводити по ним повнотекстовий пошук. Розпізнавання документів можливо на 20 мовах. Для підвищення якості розпізнавання в програмі використовується словникова перевірка. При цьому стандартний словник можна розширити за рахунок імпорту нових слів з текстових файлів.

Розмір: px

Починати показ зі сторінки:

транскрипт

1 Л екция 1 3 СИСТЕМИ ОПТИЧНОГО РОЗПІЗНАВАННЯ ІНФОРМАЦІЇ У практичній діяльності часто зустрічаються ситуації, коли необхідно перевести в електронний вигляд документ, надрукований на папері. В цьому випадку можна просто набрати документ на комп'ютері, що досить важко, або скористатися сканером пристроєм, спеціально призначеним для перекладу документів в електронний вигляд. Для організації сканування зображення крім безпосередньо сканера потрібно одна зі спеціальних програм систем оптичного розпізнавання тексту. Системи оптичного розпізнавання тексту (Optical Character Recognition OCRсістеми) призначені для автоматичного введення друкованих документів в комп'ютер. Сучасні програми розпізнавання тексту не тільки помиляються рідше, ніж жива людина, але і забезпечують перевірку орфографії, автоматичне форматування тексту і масу інших додаткових зручностей. Останні роки провідні позиції на російському ринку «распознавалок» утримують програми FineReader і CuneiForm. Незважаючи на свої хитромудрі назви, обидві програми вітчизняного виробництва цілком хорошої якості. За своїми можливостями і сервісу вони приблизно рівноцінні. МОЖЛИВОСТІ ПРОГРАМИ FINEREADER Однією з популярних програм оптичного розпізнавання текстів є програма FineReader, створена компанією ABBYY Software House. FineReader омніфонтовая система оптичного розпізнавання текстів. Це означає, що вона дозволяє розпізнавати тексти, набрані практично будь-якими шрифтами. Особливістю програми FineReader є висока точність розпізнавання І мала чутливість до дефектів друку, що досягається завдяки застосуванню технології «цілісного цілеспрямованого адаптивного розпізнавання». Програма дозволяє розпізнавати з високою точністю тексти більш ніж на 175 мовах, виводити на друк вихідне зображення і розпізнаний текст, зберігати відскановане зображення в різних форматах, налаштовувати панелі інструментів програми, а також відповідає вимогам сумісності з новими операційними системами Microsoft і Macintosh. Версія програми FineReader 6.0 Professional сумісна з Windows-2000, -ХР, a FineReader 5.0 Pro for Mac призначена для власників комп'ютерів Apple Macintosh. Крім того, відсканований файл можна відразу ж відправити електронним листом або завантажити в браузер у вигляді Web-стра- нічки. Програма FineReader, починаючи з третьої версії, виявилася настільки вдалою, що завоювала широке визнання і в Росії, і за її межами. Саме в зв'язку з виходом на світову арену фірма отримала своє нове ім'я ABBYY, раніше називаючись Bit Software. Програмні продукти ABBYY FineReader представлені в даний час наступними програмами: FineReader Sprint, FineReader 6.0 Professional, FineReader 6.0 Corporate Edition і ABBYY FineReader 5.0 Pro for Mac. FineReader Sprint поставляється в комплекті зі сканерами. Це продукт для тих, хто тільки починає працювати з системами розпізнавання OCR. Версія володіє обмеженою функціональністю в порівнянні з версіями Professional і Corporate Edition. FineReader 6.0 Corporate Edition розроблена з урахуванням запитів корпоративних клієнтів і підтримує такі функції, як робота в локальній мережі, пакетний пошук і

2 індексування, розпізнавання штрих-кодів і розбивка зображень. FineReader Scripting Edition дозволяє створювати інтегровані рішення, що володіють всіма можливостями Corporate Edition. Інтерфейс програми ABBYY FineReader 5.0 Pro for Mac, включаючи панелі управління, піктограми і діалогові вікна, створювався безпосередньо для Mac OS. Підтримані всі основні технології Apple, включаючи QuickTime, Speech, Drag and Drop і Navigation Services. Продукт розроблений компаніями ABBYY Software House і Sound & Vision.Inc. Для автоматизації введення платіжних документів в банківських системах випускається програма FineReader Банк, що дозволяє значно підвищити ефективність роботи. При створенні платіжного документа програма генерує і друкує штрих-код, що дозволяє при отриманні в банку документа і скануванні коду додатково ідентифікувати дані. У комплект ABBYY FineReader 6.0 Professional крім дистрибутивного компакт-дисків входять керівництво користувача і ліцензійний договір. Для установки програми необхідний комп'ютер, що відповідає наступним вимогам: ПК з процесором Pentium 200 або більш потужним; операційна система Microsoft Windows XP / 2000 / NT 4.0 (SP6 або вище), Windows МЕ / 98/95 (для роботи з локалізованим інтерфейсом операційна система повинна забезпечувати необхідну мовну підтримку); розмір оперативної пам'яті для Windows ХР / Мбайт, Windows ME / 98/95 / NT Мбайт; 160 Мбайт вільного місця на жорсткому диску, включаючи 90 Мбайт для установки системи в мінімальній конфігурації і 70 Мбайт для роботи системи; браузер Microsoft Internet Explorer 5.0 або вище (на компакт-диску знаходиться дистрибутив MS IE 5.5); 100% -й Twain-сумісний сканер, цифрова камера або факс-модем; дисковод для компакт-дисків; дисковод 3,5 дюйма або можливість провести активацію продукту через Інтернет, по електронній пошті або по телефону. Майстер установки FineReader гранично простий користувачеві пропонується вибрати мову інтерфейсу, варіант установки і каталог для файлів програми. Для інсталяції на диску повинно бути вільно 90 Мбайт. Для видалення програми з комп'ютера є засоби деінсталяції. ТЕХНОЛОГІЯ РОЗПІЗНАВАННЯ Складність машинного розпізнавання текстів полягає в тому, що його неможливо побудувати за чітким алгоритмом хоча б тому, що для написання однієї д тієї ж букви існує безліч варіантів написання. Значить, щоб комп'ютер коректно прочитав символи, він повинен їх «осмислити». Іншими словами, для розпізнавання тексту потрібно моделювання міркувань людини в подібній ситуації, а це прийнято позначати терміном «штучний інтелект». Вперше вони були сформульовані і застосовані на практиці в кінці 80-х рр. XX ст. А. Шаміса в системі розпізнавання «Графіт». Виходячи з принципу цілісності распознаваемое зображення розглядається як єдиний об'єкт, що складається з частин, пов'язаних між собою просторовими співвідношеннями. За принципом цілеспрямованості розпізнавання будується як процес

3 висунення і цілеспрямованої перевірки гіпотез про об'єкт, а принцип адаптивності передбачає здатність системи до самонавчання. Яким чином будується розпізнавання символів? Для висунення гіпотез про те, що може являти собою зображення, застосовуються так звані прізнаковие класифікатори. Вони використовують ряд ознак, на основі яких програма обчислює ступінь близькості розпізнається зображення і відомих їй класів зображень, після чого видає список відповідних класів, т. Е. Гіпотезу про належність об'єкта до того чи іншого класу. Крім того, прізнаковие класифікатори застосовуються також і для підвищення точності розпізнавання зображень з дефектами. Отриманий набір класів послідовно перевіряється структурним класифікатором, які аналізують кожен символ. Скажімо, якщо FineReader вважає, що на сторінці зображена буква «Ф», він спеціально перевіряє ті ознаки, які повинні бути саме у літери «Ф», а не у будь-якої іншої, порівнюючи цей символ зі структурним еталоном. Структурний стандарт визначає символ як комбінацію структурних елементів (відрізок, дуга, кільце, точка), що знаходяться в певних відносинах між собою. Процес розпізнавання ділиться на етапи виділення структурних елементів в зображенні і зіставленні їх з еталоном. Якщо в остаточний список потрапило більш як гіпотези, вони попарно порівнюються за допомогою диференціальних класифікаторів. Якщо структурний класифікатор при розпізнаванні символів не може однозначно вибрати одну з двох букв зі схожим написанням, то між цими конкуруючими гіпотезами робиться диференційний вибір. Наприклад, є дві гіпотези: розпізнається символ являє собою малу літеру «твердий знак» або «м'який знак». Щоб зробити вибір, FineReader цілеспрямовано проаналізує лівий верхній кут літери, де є єдина відмітна деталь між цими буквами. Із завершенням роботи диференціального класифікатора закінчується розпізнавання і починається етап перевірки підсумкового списку гіпотез. Остаточна стадія розпізнавання здійснюється системою контексту при наявності певної кількості розпізнаних літер з слова програма, використовуючи словник, може «здогадатися», що це за слово. Базові принципи цілісності, цілеспрямованості і адаптації залишаються незмінними від версії до версії програми FineReader, адже саме вони дозволяють комп'ютеру наблизитися до логіки мислення людини. ОРГАНІЗАЦІЯ РОБОТИ В FINEREADER Основою роботи FineReader є так званий пакет, що містить всю інформацію про розпізнається документі. Пакет являє собою набір сторінок документа і може містити близько тисячі сторінок. В один пакет для зручності роботи рекомендується об'єднувати зображення, логічно пов'язані між собою, наприклад сторінки однієї книги. Користувач імпортує в пакет зображення сторінок зі сканера або безпосередньо з файлів графічних форматів. У вікні Пакет видно список сторінок, що входять у відкритий пакет. Для перегляду сторінки потрібно клацнути мишею по її зображенню або номеру, при цьому відкриються файли, якими ця сторінка представлена \u200b\u200bв пакеті. Сторінки в вікні Пакет можуть бути представлені піктограмами або зменшеним зображенням сторінки. Імпортовані зображення піддаються графічній обробці. Якщо вихідне зображення є негатив, воно може бути інвертований, далі

4 проводиться очищення від «сміття» дрібних дефектів зображення. Якщо не потрібна кольоровість, то кольорові зображення зводяться до чорно-білим, що економить місце на диску і прискорює процес розпізнавання. Наступний крок аналіз макета сторінок пакета, т. Е. Виділення областей, що підлягають розпізнаванню. На цьому етапі FineReader аналізує орієнтацію сторінки і перевертає зображення, якщо це необхідно, а також виділяє блоки області, які при подальшому аналізі будуть інтерпретуватися як текст, таблиці або малюнки. Після аналізу макета сторінок, що входять в пакет, проводиться власне розпізнавання тексту і таблиць. Саме технологія розпізнавання є «серцем» FineReader і забезпечує її унікальність, однак цей процес абсолютно непомітний користувачеві він бачить тільки біжить по тексту виділення і типову рядок стану, що вказує, скільки інформації оброблено, а скільки залишилося. Далі проводиться перевірка правопису, після чого «на суд» користувача виносяться слова, яких немає в словнику системи, а також символи, в точності розпізнавання яких програма не впевнена, при цьому такі слова і букви виділяються кольором. Завершальний етап роботи програми збереження і експорт результатів розпізнавання. Насправді, в збереженні результатів немає потреби, оскільки вся інформація, включаючи розпізнаний текст і його форматування, автоматично зберігаються в пакеті разом з вихідним зображенням і відомостями про макеті сторінок. Користувач може просто закрити FineReader, не побоюючись втрати даних, проте окремо збережений текст можна імпортувати в різні формати для подальшої роботи з ним в інших додатках. Це цікаво Кожен з описаних кроків імпорт зображень, аналіз документа і розпізнавання, перевірка орфографії і збереження результатів представлені кнопками в панелі інструментів програми, чтозначітельноупрощаетработу. Розглянемо основні етапи роботи з програмою FineReader на прикладі версії FineReader 5.0 для ОС Windows. ГОЛОВНЕ ВІКНО ПРОГРАМИ FINEREADER Програма щодо проста у використанні (особливо якщо врахувати складність виконуваної нею завдання). Відключаються панелі інструментів забезпечені спливаючими підказками, інформативна рядок стану пояснює призначення всіх елементів управління, є потужна довідкова система. Після запуску програми FineReader (Пуск / Програми / ABBYY FineReader) відкривається Головне вікно (рис. 9.1) програми. У верхній частині Головного вікна знаходиться меню системи, під ним панелі інструментів. У програмі є чотири панелі інструментів: Стандартна, Форматування, Зображення і Scan & Read. Включити або виключити відображення панелей інструментів можна через меню Вид / Панелі інструментів або за допомогою контекстного меню, яке відкривається клацанням правої кнопки миші на одній з інструментальних панелей. Панелі, які видно на екрані, будуть відзначені галочкою. Внизу вікна розташована інформаційна панель, яку називають також рядком стану. Вона відображає інформацію про стан програми та вироблених нею операціях, а також коротку довідку про функції пунктах меню і кнопках. Інший простір Головного вікна займають в міру своєї появи робочі вікна програми:

5 облік руху товарів на складі тощо) ш ^ комп'ютера Якщо ви керівник, то пробл думка про придбання кишенькового комп'ютери Офіціанту здався б зручний нательш причиною можег бути: набір текстів для з * підключення до всесвітньої мережі Інтернет, мул ви - бухгалтер, то природне бажання авт: може бути вагомою причиною придбання кс І обов'язково знайдуться комп'ютери, а будуть вони зовсім різні Тому спочатку дас маються на продаясе Види комп'ютерів Все комп'ютери можна розділити на НЕ мобільні комп'ютери - кишенькові і блок * комп'ютери і телефони-комп'ютери, базові настхчтькие ПК - універсальні Вікна із зображенням поточної сторінки взаємопов'язані: два показують загальний і великий плани картинки, третє містить розпізнаний текст. Коли ви ставите курсор на символ в текстовому вікні, програма автоматично виділяє відповідну деталь на крупному плані. При виникненні проблем з розпізнаванням FineReader видає досить осмислені повідомлення, пропонуючи змінити параметри сканування або точніше вказати мову документа. Текстове вікно дозволяє форматувати і редагувати документ. У вікні Крупний план за замовчуванням показується чорно-біле зображення незалежно від того, яке саме зображення має оригінал кольорове, сіре або чорно-біле. Якщо ваше зображення кольорове і ви хочете, щоб показуване в вікні Крупний план зображення також було кольоровим, слід змінити налаштування. Для цього у вікні Параметри (меню Сервіс / оп ції) на вкладці Вид зніміть позначку з пункту чорно-білий палітра у вікні Крупний план (рис. 9.2). Взаємне розташування вікон на екрані можна змінювати. Процес введення документа в комп'ютер складається з етапів сканування і розпізнавання зображення, після чого виробляються перевірка і збереження отриманого електронного документа.

6 9.5. ЯК ВВЕСТИ ДОКУМЕНТ ЗА ОДНУ ХВИЛИНУ Перед початком сканування необхідно включити сканер, якщо він має окреме від комп'ютера джерело живлення, включити комп'ютер і запустити програму FineReader. Перед вами відкриється вікно програми. Вставте в сканер сторінку, яку ви хочете розпізнати, натисніть на стрілку праворуч від кнопки Scan & Read 3 s \\ - в меню, виберіть пункт Маг Scan & Read. Програма викликає спеціальний режим Маг Scan & Read, при якому весь процес сканування супроводжується підказками системи (рис. 9.3). Майстер Scan & Read дозволяє відсканувати і розпізнати сторінку або відкрити і розпізнати графічне зображення. При роботі з майстром слід виконувати його вказівки СКАНУВАННЯ ЗОБРАЖЕНЬ На першому етапі сканер відіграє роль «ока» вашого комп'ютера при цьому отримане зображення є ні чим іншим, як набором чорних, білих або кольорових крапок, картинкою, яку неможливо відредагувати в жодному текстовому редакторі. FineReader взаємодіє зі сканером через стандартні драйвери, що забезпечує йому сумісність практично з усіма сучасними сканерами. Для сканування зображення документа кладемо на скло сканера сторінку з текстом або книгу і натискаємо кнопку Сканувати (Scan) або в меню Файл виберемо пункт Сканувати. Через деякий час в Головному вікні програми FineReader з'явиться вікно Зображення з "фотографією" вставленого в сканер сторінки. Якість розпізнавання багато в чому залежить від того, наскільки гарне зображення отримано при скануванні, що досягається установкою основних параметрів сканування типу зображення, роздільної здатності та яскравості (рис. 9.4). Сканування в сірому типі зображення (256 градацій) є оптимальним режимом для системи розпізнавання, і підбір яскравості здійснюється автоматично. Чорно-білий тип зображення забезпечує більш високу швидкість сканування, але при цьому втрачається частина інформації про літери, що може привести до погіршення якості розпізнавання на документах середньої і низької якості друку. Якщо ви хочете, щоб наявні в документі кольорові елементи (картинки, колір літер і фону) були передані в електронний документ зі збереженням кольору, необхідно вибрати кольоровий тип зображення. В інших випадках використовуйте сірий тип зображення для текстів з дрібним шрифтом (9 і менше пунктів) точок на дюйм. У більшості випадків при скануванні підходить середнє значення яскравості 50%, і тільки на деяких документах при скануванні в чорно-білому режимі може знадобитися додаткове регулювання параметрів яскравості. Для зручності сканування великої кількості сторінок в програмі передбачений спеціальний режим Сканувати декілька сторінок. Він дозволяє відсканувати декілька сторінок в циклі, потім їх розпізнати в один прийом і зберегти в обраному форматі. Якщо у вас немає сканера, ви можете розпізнавати графічні об'єкти наступних форматів: BMP, PCX, JPEG, TIFF, PNG. Розпізнається, може бути сильно «засмічене», тобто містити багато зайвих крапок, що виникли в результаті сканування документа середнього або поганої якості. Щоб зменшити кількість зайвих крапок, можна скористатися опцією Очистити від сміття в меню Зображення. Ряд налаштувань можна зробити ще перед початком сканування в налаштуваннях можна вказати програмі інвертування зображення, очищення його від «сміття», автоматичне визначення орієнтації тексту на зображенні, для чого в меню Сервіс / Параметри на закладці Сканування / Відкриття слід зазначити відповідні позиції.

7 Можна також зменшити дозвіл кольорового зображення або зображення у відтінках сірого (до 100 dpi), що дозволить сильно зменшити розмір пакета за рахунок зниження якості зображень. При розпізнаванні зображення повинно мати стандартну орієнтацію, т. Е. Текст повинен читатися зверху вниз і рядки повинні бути горизонтальними. За замовчуванням програма при розпізнаванні визначає і коригує орієнтацію зображення автоматично, але є можливість повернути зображення вручну. Після завершення сканування зображення виявиться включеним в кінець пакета, якщо не активна опція Запитувати номер сторінки під час додавання її в пакет, а його піктограма відобразиться на панелі пакета (вертикальна панель зліва на екрані). Якщо клацнути мишею по цій піктограмі, можна побачити всі вікна FineReader, при цьому основне місце на екрані буде займати вікно зображення і тексту, в лівій частині якого розташовано зображення сторінки, а в правій буде знаходитися розпізнаний текст. Кожна з цих двох частин головного вікна програми забезпечена стандартними інструментами управління масштабом, а зліва від вікна зображення є ще і невелика панель інструментів роботи з зображенням. Якщо придивитися уважно, то на зображенні сторінки можна побачити невелику пунктирну рамку з лупою. Та частина зображення, яка потрапить в цю рамку, відображається у вікні великого плану. Клік миші по певній частині зображення перемістить центр збільшується області в вказане місце. АНАЛІЗ МАКЕТА СТОРІНОК Перш ніж FineReader приступить до власне розпізнавання тексту, він повинен «знати», які саме галузі підлягають розпізнаванню, як розташовані рядки. Визначення орієнтації тексту при встановленні відповідної опції проводиться автоматично, хоча можна зробити це і вручну шляхом повороту вихідного зображення. Виділення областей розпізнавання тексту вирішує ще два завдання: по-перше, окремими блоками виділяються таблиці і малюнки, кото риє не підлягають розпізнаванню; по-друге, чітке виділення блоків дозволяє максимально коректно зберегти макет вихідної сторінки при передачі розпізнаного документа в зовнішні додатки (такі, як MS Word і Adobe Acrobat). Отже, натискаємо кнопку Розпізнати, при цьому різні частини нашого зображення, що містять текст, таблиці або малюнки, виявилися обведені рамками різних кольорів і позначені цифрами в кутку кожної рамки. Колір служить для позначення типу блоку в стандартних настройках зелений колір для тексту, червоний для малюнків і синій для таблиць. Кольорове кодування можна при бажанні змінити. Блоки це взяті в рамки ділянки зображення. Блоки виділяють для того, щоб вказати програмі, які ділянки відсканованої сторінки потрібно розпізнавати і в якому порядку. Також по них відтворюється вихідне оформлення сторінки. При обробці зображень виділяються блоки наступних типів: зона розпізнавання, текст, таблиця, картинка і штрих-код (тільки у версії Office). Зазвичай автоматичний аналіз макета сторінки працює досить коректно, проте іноді доводиться підправляти FineReader. Найчастіше це буває необхідно, якщо потрібно розпізнати тільки частина тексту, розташованого на сторінці, або включити в кінцевий документ не всі малюнки. Іноді доводиться редагувати макет табличних блоків, оскільки деякі таблиці виявляються занадто складними за своєю структурою. Ще однією причиною, яка змушує користувача редагувати макет, є малюнки оригіналу, що містять текст, наприклад графіки з підписами осей. У таких випадках FineReader віддає перевагу тексту і виділяє підписи як текстовий блок, залишаючи сам графік без уваги або ж виділяючи як малюнок будь-яку його частину.

8 Природним рішенням цієї проблеми буде виділення всього графіка як малюнка без розпізнавання підписів. Більш специфічним випадком ручного редагування макета є складні математичні або хімічні формули. Внутрішній формат тексту в FineReader дуже близький до формату RTF, тому він не вміє коректно працювати з текстом, розташованим не в рядок (виняток становлять надрядкові символи і літери). При роботі з документами, що містять такі формули, їх доводиться виділяти як малюнки. Ну, і зовсім окремо стоять випадки поганого оригіналу. FineReader відчуває природні труднощі при виділенні неякісного макета на неякісних зображеннях, що містять багато сторонніх елементів. Зокрема, FineReader не любить коментарі, написані від руки на полях оригіналу, оскільки ухитряється вгледіти там знайомі символи, виділити ^ х як текстовий блок і розпізнати, чим порушує загальну структуру основного тексту. Багато подібні помилки можуть бути виправлені саме на етапі роботи з макетом, оскільки зробити це простіше, ніж згодом редагувати готовий текст. Змінювати розміри або форму існуючих блоків можна, потягнувши мишею за їх межі. Змінити тип блоку дозволяє «спливаюче» меню, що з'являється після клацання мишею по піктограмі в кутку блоку, що позначає його тип. Для більш складного редагування макета використовуються панелі інструментів, розташовані зліва від вікна зображення. Вони дозволяють намалювати нові блоки заданого типу, додати або видалити частину блоку, хоча видалити блок можна також за допомогою клавіатури натисканням на клавішу після його виділення. Отже, при автоматичному аналізі макета сторінок оригінальні зображення досить коректно розбиваються на блоки. Неточності, які програма все-таки допускає, можна легко відредагувати за допомогою панелі інструментів. РОЗПІЗНАВАННЯ ТЕКСТУ Після створення макета і його редагування можна приступити до розпізнавання. Завдання розпізнавання полягає в тому, щоб перетворити відскановане зображення в текст, зберігши при цьому оформлення сторінки. І перше, на що слід звернути увагу мову розпізнавання, адже FineReader підтримує більше сотні мов. Мова, на якому буде проводитися розпізнавання, вибирається на основній панелі інструментів. Крім мови оригіналу, модуль розпізнавання враховує і тип друку, який за замовчуванням визначається автоматично, але при необхідності може бути встановлений і вручну. При розпізнаванні текстів, надрукованих на матричному принтері в чорновому режимі або на друкарській машинці, можна домогтися вищої якості розпізнавання, встановивши правильний тип друку. Виділяються два специфічних типу друку: матричний принтер і друкарська машинка (Сервіс / Параметри / Тип друку). Символи, надруковані на матричному принтері, складаються з окремих точок, іноді добре помітних навіть на око, а символи друкарської машинки, як правило, мають однакову ширину (моноширинних). Саме ці дві особливості повинен враховувати FineReader при розпізнаванні. На звичайних друкарських шрифтах тип друку повинен бути встановлений в Auto.

9 ПЕРЕВІРКА ПРАВОПИСУ І ЗБЕРЕЖЕННЯ РЕЗУЛЬТАТІВ РОБОТИ Модуль розпізнавання аналізує не тільки окремі символи, а й цілі слова, використовуючи при цьому вбудований словник. Крім того, цей модуль особливим чином позначає «невпевнено розпізнані» символи. Робота зі словами, невідомими системі, і з невпевнено розпізнаними символами здійснюється в модулі перевірки правопису. Він викликається кнопкою Перевірити правопис. На рис. 9.5 ви бачите правопис FineReader за роботою. Він пропонує варіанти, один з яких треба вибрати і натиснути кнопку Замінити. Можна поправити помилку прямо в вікні Спеллер, а можна залишити слово, як воно є, якщо це правильне, але не відоме Спеллер слово, і тоді скористаємося кнопкою Пропустити. Весь розпізнаний текст видно в вікні тексту головного вікна програми. Воно являє собою нескладний текстовий редактор, що дозволяє вільно змінювати і гарнітуру шрифту, і його накреслення. До того ж в цьому вікні кольором будуть відзначені невпевнено розпізнані символи. Після закінчення перевірки правопису слід визначити, в якому форматі зберігати отримані результати (кнопка Зберегти), наприклад RTF, DOC, PDF, HTML, DBF, XLS (рис. 9.6). Як видно з наведеного списку, FineReader дозволяє передавати результати розпізнавання практично в усі широко використовувані додатки, такі як MS Word, MS Excel, а також використовувати автоматичне введення для публікації в Web і для заповнення баз даних. Така універсальність часом виявляється просто незамінною.


Системи оптичного розпізнавання символів. Практичне застосування. На прикладі програми FineReader Виконала студентка 111гр Асмаловская І.П. Квітень 2014 Необхідність в системах розпізнавання символів

Лабораторна робота 6 ТЕМА ЗАНЯТТЯ: Система оптичного розпізнавання символів НАВЧАЛЬНІ ЗАПИТАННЯ: 1. Загальні відомості про систему оптичного розпізнавання символів. Панелі інструментів і меню. 2. Отримання

Керівництво користувача Зміст Введення ... 1 ВАЖЛИВІ ПРИМІТКИ ... 1 Офіційні повідомлення ... 2 Установка і настройка ... 3 Системні вимоги... 3 Установка ... 3 Активація ... 6 Автоматичне оновлення ...

Відкритий урок Тема: Системи оптичного розпізнавання документів. Практична робота 4 «Сканування паперового і розпізнавання електронного текстового документа». Були присутні: - учні: Бережнов

Вміст цього посібника Microsoft Зовнішній вигляд програми Microsoft істотно відрізняється від Excel 2003, і \u200b\u200bце керівництво покликане прискорити знайомство з новою версією програми. прочитайте дане

RasterID 3 КЕРІВНИЦТВО ЗІ ВСТАНОВЛЕННЯ І ЛІЦЕНЗУВАННЮ CSoft Development 2010 Зміст Установка RasterID ... 3 Системні вимоги ... 3 Програмна і апаратна захист ... 3 Установка RasterID ... 3 Ліцензування

Лабораторна робота 12 ТЕМА: «Системи масового введення паперових документів» Мета роботи: освоїти технологію сканування і розпізнавання текстових документів. Теоретичні відомості Найважливішою частиною електронного

ABBYY МОНІТОРИНГ КЕРІВНИЦТВО АДМИНИСТРАТОРА ПУНКТУ ПРОВЕДЕННЯ ІСПИТУ ABBYY Моніторинг 2017 ABBYY. Всі права захищені. Даний посібник містить інформацію про використання платформи ABBYY Моніторинг

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ СХІДНО-Сибірський державний технологічний університет Бурятський Регіональний Центр Федерації Інтернет-освіти Методичні вказівки щодо вивчення теми: «Програма

1. Вставка і створення таблиць в Word 2007 Таблиці Word застосовуються для структурування вмісту сторінки. Крім того, таблиці використовуються для обчислень. У Word використовується технологія вставки і створення

Робота з програмою ABBYY FineReader Банк 7 Керівництво користувача ABBYY 2013 рік Обробка документів в програмі ABBYY FineReader Банк складається з чотирьох етапів: Завантаження Розпізнавання Перевірка Вивантаження

Призначення програми Автоматизація всіх видів дій з текстами. Функції створення, редагування, форматування, збереження, обробка і виведення на друк. Word2007 професійний текстовий редактор,

Призначення програми Автоматизація всіх видів дій з текстами. Функції створення, редагування, форматування, збереження, обробка і виведення на друк. Word 2007 професійний текстовий редактор,

Урок 1: Інтерфейс Excel * Версия 2010 * 1.0 Введення Дані в Excel розташовуються в «осередках», які в свою чергу утворюють стовпці та рядки. Це допомагає нам краще сприймати ці дані і дозволяє

О.В. Спиридонов РОБОТА В MICROSOFT WORD 2010 Лекція 1. Інтерфейс Microsoft Word 2010 Лекція знайомить користувача з інтерфейсом Microsoft Word 2010. Представлені основні елементи інтерфейсу. Особливу увагу

Робота з табличним процесором Microsoft Excel Короткі теоретичні відомості Додаток Windows Excel дозволяє формувати і виводити на друк документи, представлені в табличному вигляді, виконувати розрахунки

РОБОТА З ДОКУМЕНТОМ В WORD 2010 Розробник внесли чимало змін в Microsoft Office Word 2010 хоча зовні його інтерфейс мало відрізняється від Word 2007. Почавши працювати з Word 2007, багато користувачів

Робота з шаблонами типових документів Керівництво користувача Cognitive Technologies Москва, 2015 2 АНОТАЦІЯ У цьому документі наводяться відомості про використання в програмному комплексі «Е1 Євфрат»

Т.В. Глотова Методичні вказівки для виконання практичних і самостійних робіт розділ Основи роботи з офісним пакетом OpenOffice.org 3.2 Частина 6 Історія OpenOffice.org. Платформи і системні вимоги

Використання веб-служб для сканування по мережі (Windows Vista з пакетом оновлень 2 (SP2) або пізнішої, Windows 7 і Windows 8) Протокол веб-служб дозволяє користувачам Windows Vista (з пакетом

Керівництво користувача Зміст Введення ... 1 ВАЖЛИВІ ПРИМІТКИ ... 1 Офіційні повідомлення ... 3 Установка і настройка ... 5 Системні вимоги ... 5 Установка ... 5 Активація ... 7 Автоматичне оновлення ...

Короткий посібник користувача Цей короткий довідник допоможе встановити додаток Readiris TM і приступити до роботи з ним. Див. Докладні відомості про всі можливості Readiris TM в файлі довідки

Короткий посібник Копіювання Отримання копій Виконання прискореного копіювання вниз на скло 2 Вирівняйте напрямні для паперу під час завантаження документа в УАПД. Примітка. переконайтеся,

Заповнення форми у програмі StForm. 1.1 Запуск. Сценарії роботи Для запуску програми на локальному комп'ютері зайдіть в меню Пуск -\u003e НИПИстатинформ -\u003e Форми статзвітності (підприємства). Основне вікно

2.4.2. Друк документа Перед друкуванням таблиць необхідно встановити параметри сторінки за допомогою вкладки Розмітка сторінки. Параметри сторінки Встановлюється орієнтація і розмір аркуша паперу, масштаб

Вміст цього посібника Microsoft Зовнішній вигляд програми Microsoft OneNote 2010 істотно відрізняється від OneNote 2007, і це керівництво покликане прискорити знайомство з новою версією програми.

Microsoft Office Word є популярної прикладної програмою для створення і редагування текстових документів, яка має безліч можливостей настільної видавничої системи по роботі з текстами

ABBYY FineReader 14 Посібник користувача ТОВ Аби Продакшн, 2017. Всі права захищені. Інформація, що міститься в цьому документі, може бути змінена без попереднього повідомлення, і компанія ABBYY

Менеджер бібліотеки стандартних компонентів CSoft Development, 2009. Всі права захищені Зміст Менеджер бібліотеки стандартних компонентів ... 2 Зауваження по безпеці ... 4 Запуск Менеджера бібліотеки

Вміст цього посібника Зовнішній вигляд програми Microsoft Word 2010 істотно відрізняється від Word 2003, і \u200b\u200bце керівництво покликане прискорити знайомство з новою версією програми. прочитайте дане

Короткий посібник з використання Системи редагування сайту Зміст 1. Введення ... 3 2. Знайомство з основними елементами системи редагування ... 4 3. Панель управління основними командами ...

СУПУТНИКОВА ІНФОРМАЦІЙНО-ПОШУКОВА СИСТЕМА Reef GSM 3000 Опис програми визначення місцезнаходження автомобіля ЗМІСТ Передмова ................................... ..............................

Практичне заняття 12 Робота з текстовим редактором, вставка об'єктів з навчальної дисципліни «Інформатика і ІКТ» Тема: Поняття про інформаційні системи та автоматизації інформаційних процесів. мета:

ТЕКСТОВІ ОНЛАЙН - РЕДАКТОРИ Виконала: Бєлобородова Марія ЛУ-23 2014 р ПОВСЯКДЕННОМУ ЖИТТІ БУДЬ КОРИСТУВАЧУ КОМП'ЮТЕРА ДОВОДИТЬСЯ ПРАЦЮВАТИ З ТЕКСТОМ. ТЕКСТ був і є ТРАДИЦІЙНИМ НОСІЄМ

Лабораторна робота 4 1. ТЕМА: «Налаштування текстового процесора Microsoft Word» 2. СПІЛЬНА МЕТА РОБОТИ: отримати навички виконання первинних налаштувань текстового редактора; ознайомлення з елементами рядка

1 Призначення Програма «Слух» призначена для обробки, зберігання і виведення на друк результатів аудіометричних обстежень, отриманих на аудіометрі АА-02, і тімпанометріческіх обстежень, отриманих

Інструкція по наповненню сайту кафедри Культурологи і Соціології (Частина 2 «редактор наповнення сайту») 1 Зміст 1 Інтерфейс редактора, ... 3 2 Зміна розміру редактора, ... 4 3 Панель інструментів ...

Прийоми роботи з інструментом Відрізок 1 Мета роботи: Завдання 1. Робота 7 ПРИЙОМИ РОБОТИ З ІНСТРУМЕНТОМ ОТРЕЗОК Вивчення деяких прийомів роботи з інструментом Відрізок, методами побудови і видалення відрізків.

Вміст цього посібника Microsoft Зовнішній вигляд програми Microsoft PowerPoint 2010 істотно відрізняється від PowerPoint 2003 і це керівництво покликане прискорити знайомство з новою версією програми.

Вміст цього посібника Зовнішній вигляд програми Microsoft Access 2010 істотно відрізняється від Access 2003 і це керівництво покликане прискорити знайомство з новою версією програми. прочитайте дане

Потокове сканування Керівництво користувача ЗМІСТ 1. ТЕХНОЛОГІЧНА СХЕМА РОБОТИ З СИСТЕМОЮ «потокового сканування» ... 3 2. ДРУК ШТРИХ-КОДУ ... 3 3. ПІДГОТОВКА ДОКУМЕНТІВ ДЛЯ СКАНУВАННЯ ...

Практична робота 15 Введення, редагування, форматування і збереження тексту. Списки Мета роботи: отримати початкові навички роботи з текстовим документом, познайомитися з основними прийомами редагування

Управління аккаунтом в системі www.artsofte-lite.ru Керівництво користувача Ver. 1.0 I. Структура управління аккаунтом стор. 3 1. Вхід в систему стор. 3 2. Завантаження логотипу стор.4 3. Текстові статті стор.

Finereader 7 скачати безкоштовно повну версію \u003e\u003e\u003e Finereader 7 скачати безкоштовно повну версію Finereader 7 скачати безкоштовно повну версію Зручність роботи Навіть той, хто вперше працює з ABBYY FineReader,

Про пресу таблиць У Microsoft Excel можна друкувати всі дані листа або тільки певний діапазон комірок. При друку великих таблиць на декількох сторінках можна переносити назви рядків і стовпців таблиці

Ай Ті Ві Груп Керівництво по роботі з утилітою «ArpEdit» Версія 1.4 Москва, 2014 Зміст ЗМІСТ та ... 2 1 ВСТУП ... 4 1.1 Призначення документа ... 4 1.2 Призначення утиліти «ArpEdit» ... 4 2 ЗАГАЛЬНІ

Створення Web-сторінки MS Word можна використовувати для створення веб-сторінок. Безсумнівно, розробляти веб-сторінки набагато краще за допомогою спеціальних редакторів (наприклад, Microsoft FrontPage), проте

Лабораторна робота 8 Робота з графікою. Створення графічних примітивів Теоретична частина Додавання зображення з файлу При створенні текстового документа за допомогою OpenOffice.org Writer, часто буває

Керівництво по використанню візуального редактора інформаційного наповнення сайту http://pzi.ru П'ятигорського заводу Імпульс. П'ятигорськ 2011 Зміст 1 Інтерфейс редактора, ... 3 2 Зміна розміру редактора ... 4

Лабораторна робота 2 Створення форм бази даних «телефонний довідник» У той час як таблиці служать для зберігання даних, форми служать для їх відображення і маніпулювання ними в таблицях. форма є

2014 Electronics For Imaging. На інформацію в даному документі поширюється дія Юридичного повідомлення щодо даного вироби. 23 червня 2014 г. Зміст 3 Зміст ... 5 Доступ до програми ... 5

Лабораторна робота 1 «Мережеві офіси. Спільне редагування документів »Частина 1. Введення З розвитком мережі Інтернет з'являється можливість створювати своєрідний Інтернет-офіс, де можна зберігати, створювати

Ãëàâà 3 Ñïðàâî íàÿ ñèñòåìà Access 2007 У розділі Вікно Довідка: Access Довідка про елементи інтерфейсу діалогових вікон Пошук довідкової інформації в Інтернеті Резюме Тести Незалежно від того, на якому

Глава 1. Загальні відомості про програму Призначення програми і завдання, які вирішуються з її допомогою Прикладне рішення і «Конфігуратор» Початок роботи: запуск програми та вибір інформаційної бази Загальні прийоми та

Лабораторна робота 2 СТВОРЕННЯ ФОРМ В MS ACCESS Цілі роботи: вивчення основних способів створення форм засобами MS Access; створення обчислюваних полів в формах MS Access. Зміст теоретичного мінімуму.

КЕРІВНИЦТВО ПО РОБОТІ В ПРОГРАМІ LOCOBOOK Панфілов Е.О. викладач кафедри російської мови департаменту гуманітарної освіти студентів інженерно-технічних напрямків Ігні, керівник і куратор

Програмне забезпечення VISION Зміст Технічні умови 4 - Застосування 4 - Системні вимоги 4 - Установка програмного забезпечення 4 Опис програмного забезпечення 8 - Інтерфейс

Універсальне програмне забезпечення DpuScan 4.21 для кольорового і чорно-білого сканування DpuScan 4.21 представляє собою потужне програмний засіб, Призначене для сканування і дозволяє працювати

Лекція-1. ВСТУП. ПРИЗНАЧЕННЯ, СКЛАД І ОСНОВНІ ЕЛЕМЕНТИ ІНТЕРФЕЙСУ ПРИКЛАДНОГО ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ ДЛЯ ОБРОБКИ ДІЛОВОЇ ІНФОРМАЦІЇ Питання: 1. Поняття програмного забезпечення і його класифікація

Створення та редагування текстового документа в Microsoft Word 2003 Текстовий редактор це програма, яка дозволяє створити документ з текстовими даними. Текстовий процесор це програма для введення,

Робота в СУФД. Інтерфейс. Інтерфейс СУФД можна розділити на декількох основних елементів. У лівій частині (1) розміщена панель навігатора. У верхній частині навігатора знаходиться список, що розкривається доступних

НАЦІОНАЛЬНА БІБЛІОТЕКА РЕСПУБЛІКИ КОМИ ПРАКТИЧНИЙ ПОСІБНИК Оцифровка, обробка, ВЕРСТКА І ЗАПИС НА CD ВИДАНЬ Розроблено: Леонгард К. І., інженер-електронік Відділу електронного обслуговування Регіональний

Системи управління базами даних Microsoft Access 2003 Додаток Microsoft Access це настільна система керування базами даних (СКБД), призначена для роботи на автономному персональному

Покоління програм OCR

Перед тим як почати розгляд OCR-систем, давайте спочатку хоча б мінімально наведемо їх класифікацію для зручності розгляду. На даний момент виділяють OCR-системи, а також ICR-системи. Дещо спрощуючи суть відмінностей між ними, можна вважати, що ICR-системи - це наступне покоління в розвитку OCR-систем. У ICR набагато більш активно і серйозно використовуються можливості штучного інтелекту, зокрема, ICR-системи часто використовуються для розпізнавання рукописних текстів, декоративних непостійних шрифтів, а також, як найяскравіший приклад, подолання тих же систем по захисту від різних спамерських пошукових роботів - каптч ( captcha). Третій, поки ще тільки теоретичний рівень якості розпізнавання тексту, це IWR, в якій зчитуються і розпізнаються не окремі символи / точки, а зчитуються і розпізнаються фрази цілком.

Існує кілька систем, які зараховують себе до категорії ICR. Це, перш за все, FineReader, OmniPage Professional, Readiris Corporate, Type Reader Desktop. Давайте порівняємо їх всіх і розглянемо існуючі альтернативи.

Відомі вітчизняні продукти

Зараз в світі існує більше ніж 100 найрізноманітніших OCR-движків, ми спробували розглянути і порівняти тут лише найвідоміші і якісні з них. Серед них існує також безліч безкоштовних OCR-програм для прийому рівня, але їх якість розпізнавання істотно нижчою від їх комерційних аналогів. Для успішного вирішення бізнес завдань (і інших серйозних повсякденних завдань) краще орієнтуватися на комерційні системи ICR-класу.

 

 

Це цікаво: