Jak OCR funguje? Vysvětleno jednoduchým a srozumitelným způsobem
V tomto článku vysvětlujeme, jak funguje OCR. OCR je zkratka pro „Optical Character Recognition“ a je v němčině jednoduše označována jako rozpoznávání textu. To znamená, že počítač dokáže rozpoznat text naskenovaného obrázku pomocí OCR a poté jej převést na jednoduchý textový dokument.
Takto funguje OCR
Představte si, že jste od kolegy dostali papírovou prezentaci. Nyní je chcete upravovat na PC, protože se vám nelíbí jednotlivé pasáže. Takže to naskenujte a přejděte do svého programu OCR. Nyní se stane následující:
- Software nejprve provede tzv. Analýzu rozložení. Za tímto účelem se podívá na rozvržení stránky a odděluje obrázky od textu. Také si všimne jejich pozice na stránce. Poté se spočítá počet odstavců a uloží se jednotlivé prvky, například čísla stránek.
- Nyní přichází těžká část. Software prohlíží jednotlivé textové bloky a rozdělí je na věty. Věty jsou pak rozděleny na jednotlivá slova a slova na písmena.
- Software OCR obsahuje vzory písmen a znaků. Program nyní porovnává naskenovaná písmena s těmito vzory. Pokud jsou podobné 99%, algoritmus rozhodne, že to pravděpodobně musí být toto písmeno. Je to velmi přesné, protože dokáže porovnat mnoho vzorů v krátkém čase. Tímto způsobem úspěšně rozlišuje mezi „8“ a „B“.
- Takže písmena a postavy jsou postupně rozpoznávány. Pak se znovu spojí jako slova a vrátí se zpět na místo ve větě. Jakmile je software hotový, je celá věc uložena v normálním dokumentu, který pak můžete upravit. Hotovo!
Chcete vyzkoušet své softwarové znalosti? Zúčastněte se našeho velkého softwarového kvízu!