Technologia OCR - rozpoznawanie pisma i tekstu

Zastosowanie technologii OCR (Optical Character Recognition - Optyczne Rozpoznawanie Znaków) pozwala uwolnić pracowników od żmudnej, odtwórczej pracy dając czas na realizowanie ich głównych zadań.

Aby uniknąć ręcznego przepisywania dokumentów wystarczy zeskanować dokument i przetworzyć go wykorzystując oprogramowanie klasy OCR. ABBYY FineReader 9.0 odczytuje pismo drukowane na zeskanowanym dokumencie i zapisuje tekst w postaci pliku edytowalnego. Odtworzony zostaje nie tylko tekst, ale również krój czcionek, formatowanie akapitów, przenoszone są elementy graficzne (ilustracje, wykresy). Dzieje się to w tempie nieosiągalnym dla człowieka przepisującego ręcznie, konwersja 1 strony A4 trwa około minuty. Poprawność rozpoznawania przekracza 99,9% co oznacza, że mniej niż jeden znak na 1000 rozpoznawany jest niepewnie.

Każda przetworzona automatycznie strona to oszczędność około 30 minut. Oszczędność tym większa, że koszt jednostanowiskowej wersji programu OCR wynosi kilkaset złotych.

Jeszcze większym usprawnieniem jest wykorzystanie systemów informatycznych do pobierania danych z formularzy - dokumentów o ustalonym układzie graficznym (wzorze), zwykle wypełnianych ręcznie i przetwarzanych masowo. Znajdują tu zastosowanie szybkie skanery automatyczne oraz technologia ICR (Intelligent Character Recognition) pozwalająca odczytywać blokowe pismo ręczne. Wykorzystanie programu ABBYY FormReader 6.5 skraca czas wprowadzania danych z formularzy, eliminuje błędy oraz obniża koszty. Wiele banków oraz instytucji publicznych korzysta z specjalizowanych systemów tworzonych na zamówienie. Dostępne są także gotowe aplikacje "pudełkowe", tanie i łatwe w eksploatacji, realizujące cały proces przechwytywania danych z formularzy i zapisu do plików lub baz. Już przy przetwarzaniu kilkudziesięciu formularzy dziennie warto zainwestować we wdrożenie technologii OCR/ICR. System o dziennej wydajności 1000 stron przynosi w skali miesiąca oszczędność rzędu 500 EUR.

Automatyczne przetwarzanie dokumentów zdobywa coraz szersze zastosowania. Ilość przetwarzanych dokumentów sprawia, że system OCR staje się nie luksusem lecz koniecznością we współczesnym biurze.

Technologia IPA

Proces rozpoznawania obrazu przez FineReader'a obejmuje analizę pliku przekazywanego przez skaner (analiza układu strony) oraz rozpoznawanie każdego znaku. Proces analizy układu strony (zaznaczenie obszarów rozpoznawanych, tabelek, grafiki, linii i pojedynczych znaków) oraz rozpoznawania dokumentu są mocno z sobą powiązane: analiza układu strony używa informacji o rozpoznanym tekście w celu zapewnienia najwyższego poziomu poprawności analizy.

Jak wspomniano powyżej, rozpoznawanie obrazu oparte jest o technologię IPA.

  • Integrity - rozpoznawany obiekt jest opisany jako całość przez zbiór elementów i relacji między nimi.
  • Purposefulness - rozpoznawanie jest procesem generowania hipotez i sprawdzania ich prawdopodobieństwa.
  • Adaptivity - to umiejętność systemu do uczenia się i bycia trenowanym.

Te trzy elementy stoją u podstaw działania systemu. System generuje hipotezę na temat rozpoznawanego obiektu (znak, część znaku, kilka zlepionych znaków - ligatura), a następnie akceptuje je lub odrzuca, próbując krok po kroku znaleźć wszystkie elementy struktury znaku i relacje między nimi. Te elementy struktury są komputerowymi odpowiednikami fragmentów znaków odpowiedzialnych za ich rozpoznawanie przez człowieka (łuki, okręgi, kropki, itp.). Następnie program dopasowuje je do tekstu - używając informacji uzyskanych podczas rozpoznawania pierwszych poprawnie rozpoznanych znaków. Wyszukiwanie informacji o kontekście znaku pozwala systemowi rozpoznać nawet mocno uszkodzone znaki, dzięki czemu jest prawie niewrażliwy na błędy druku.

Efektem końcowym jest rozpoznany tekst, który możesz zobaczyć w okienku Tekst. Tekst ten możesz edytować i zapisać w jakiejkowiek potrzebnej Ci formie.

Generalny dystrybutor oprogramowania FineReader w Polsce: AutoID Polska S.A.
ABBYY Country Partner