Nyílt forráskódú lett a Tesseract

2006, szeptember 5 - 09:29

Az optikai karakterfelsimerő (OCR) programok segítségével a beszkennelt dokumentumainkat meg tudjuk értetni a számítógéppel, elektronikus, könnyen szerkeszthető formában kezelhetjük őket tovább. Az effajta szoftverek meglehetősen drágák, épp ezért ugrottam ki a bőrömből, mikor a Slashdot-on megjelent a Tesseract-ról szóló hír.


A HP 1985-ben kezdte el fejleszteni a Tesseract-ot, és tíz éven keresztül csiszolgatta. Mivel a HP kivonult az optikai karakterfelismerők piacáról, a projectet egész egyszerűen félretette. Egy-két évvel ezelőtt néhány HP mérnöknek eszébe jutott eme kiváló termék, és úgy döntöttek, lefújják róla a port, hisz kár lenne érte, hogy csak ott rohadjon a raktárban.


Szerencsére az elhatározást tett is követte, így elővették a raktárból a programot, kijavítottak benne egy rakás bugot, helyrepofozták, és kicsit alakítottak rajta, hogy a mai kor kövételményeinek is megfeleljen.


Eme kis feljavítás után úgy döntöttek, hogy nyílt forráskódúvá tehető az anyag, így remélhetőleg hamarosan megjelennek az egyes platformokra (Windows, Linux, MacOSX) fordított változatok.


Bízom benne, hogy a közösség csak jobbá teheti ezt a terméket, mint ahogy általában a nyílt foráskódú projecteknél lenni szokott, és a magyar karakterekkel is szépen el fog boldogulni.


Majd ha sikerült feltelepítenem, készítek egy tesztet is.

2842 olvasás |

Hozzászólás

A mező tartalma nem nyilvános.