Softueri i njohjes së tekstit

Si rregull, kur bëhet fjalë për programet për njohjen e teksteve të skanuara (OCR, njohja e karakterit optik), shumica e përdoruesve kujtojnë produktin e vetëm - ABBYY FineReader, që padyshim është lider në mesin e softuerëve të tillë në Rusi dhe një nga liderët në botë.

Megjithatë, FineReader nuk është zgjidhja e vetme e këtij lloji: ka programe falas për njohjen e tekstit, shërbime online për të njëjtat qëllime dhe, për më tepër, funksionet e tilla janë gjithashtu të pranishme në disa programe të njohura që tashmë mund të instalohen në kompjuterin tuaj . Unë do të përpiqem të shkruaj për gjithë këtë në këtë artikull. Të gjitha programet e shqyrtuara funksionojnë në Windows 7, 8 dhe XP.

Udhëheqësi i njohjes së tekstit - ABBYY Finereader

Rreth FineReader (shqiptuar si Fine Reader) dëgjuar, ndoshta, shumica prej jush. Ky program është më i miri ose më i miri për njohjen e teksteve me cilësi të lartë në gjuhën ruse. Programi paguhet dhe çmimi i licencës për përdorim në shtëpi është pak më pak se 2000 rubla. Është gjithashtu e mundur të shkarkoni versionin e gjyqit të FineReader ose të përdorni njohjen online të tekstit në ABBYY Fine Reader Online (ju mund të njihni disa faqe falas, pastaj - për një tarifë). E gjithë kjo është në dispozicion në faqen zyrtare të zhvilluesit //www.abbyy.ru.

Instalimi i versionit të testimit të FineReader nuk shkaktoi probleme. Softueri mund të integrohet me Microsoft Office dhe Windows Explorer në mënyrë që të bëjë më të lehtë për të drejtuar njohjen. Nga kufizimet e versionit të provës falas - 15 ditë përdorimi dhe aftësia për të njohur jo më shumë se 50 faqe.

Screenshot për testimin e softuerit të njohjes

Meqë nuk kam një skaner, kam përdorur një fotografi nga një telefon me cilësi të dobët të kamerës, në të cilën unë redaktova pak kontrastin, për të kontrolluar. Cilësia nuk është e mirë, le të shohim se kush mund ta trajtojë atë.

Menuja FineReader

FineReader mund të marrë një imazh grafik të tekstit direkt nga skaneri, nga skedarët grafik ose kamera. Në rastin tim, ishte e mjaftueshme për të hapur dosjen e imazhit. Isha i kënaqur me rezultatin - vetëm disa gabime. Unë do të them menjëherë se ky është rezultati më i mirë i të gjitha programeve të testuara kur punoni me këtë mostër - një cilësi e ngjashme e njohjes ishte vetëm në shërbimin falas online OCR Free Online (por në këtë përmbledhje ne flasim vetëm për softuer, jo njohje online).

Rezultati i njohjes së tekstit në FineReader

Sinqerisht, FineReader ndoshta nuk ka konkurrentë për tekstet cirilike. Përparësitë e programit nuk janë vetëm cilësinë e njohjes së tekstit, por edhe funksionalitetin e gjerë, mbështetjen e formatimit, eksportin kompetent në shumë formate, përfshirë Word docx, pdf dhe karakteristika të tjera. Kështu, nëse detyra e OCR është diçka që ju hasni vazhdimisht, atëherë mos u vjen keq për një sasi relativisht të vogël të parave dhe do të paguani: do të kurseni një sasi të madhe kohe, shpejt duke marrë rezultate cilësore në FineReader. Nga rruga, unë nuk reklamoj asgjë - me të vërtetë mendoj se ata që duhet të njohin më shumë se një duzinë faqe duhet të mendojnë për blerjen e softuerit të tillë.

CuneiForm është një program i njohjes së lirë të tekstit.

Në vlerësimin tim, programi i dytë më popullor OCR në Rusi është CuneiForm i lirë, i cili mund të shkarkohet nga faqja zyrtare //cognitiveforms.ru/products/cuneiform/.

Instalimi i programit është gjithashtu shumë i thjeshtë, nuk përpiqet të instalojë ndonjë softuer të palëve të treta (si shumë softuer të lirë). Ndërfaqja është koncize dhe e qartë. Në disa raste, mënyra më e lehtë për të përdorur magjistarin, e cila është e para e ikonave në meny.

Me mostrën që kam përdorur në FineReader, programi nuk u përball, ose, më saktë, dha diçka të keqe të lexueshme dhe fragmente të fjalëve. Përpjekja e dytë është bërë me një screenshot të tekstit nga faqja e këtij programi, i cili megjithatë duhet të rritet (ajo ka nevojë për skanime me një rezolucion 200dpi dhe më të lartë, nuk lexon screenshots me gjerësi të linjës së shkronjave prej 1-2 pixels). Këtu ajo bëri mirë (disa nga teksti nuk u njohën, pasi qe vetëm rusja u zgjodh).

Njohja e tekstit CuneiForm

Kështu, ne mund të supozojmë se CuneiForm është diçka që duhet të provoni, veçanërisht nëse keni faqe të skanuara me cilësi të lartë dhe doni të njihni falas.

Microsoft OneNote - një program që mund të keni

Në Microsoft Office, duke filluar me versionin 2007 dhe duke përfunduar me versionin aktual, 2013, ekziston një program për të marrë shënime - OneNote. Gjithashtu ka veçori të njohjes së tekstit. Për ta përdorur atë, thjesht ngjiteni skedarin e skanuar ose ndonjë tekst tjetër të tekstit në shënim, klikoni me të djathtën mbi të dhe përdorni menynë e kontekstit. Vërej se parazgjedhja për njohjen është vendosur në gjuhën angleze.

Njohja në Microsoft OneNote

Unë nuk mund të them se teksti është i njohur në mënyrë të përkryer, por, për aq sa unë mund të them, është disi më i mirë se sa në CuneiForm. Plus programi, siç është përmendur tashmë, është se me probabilitet të konsiderueshëm është instaluar tashmë në kompjuterin tuaj. Megjithëse, natyrisht, përdorimi i saj në rast të nevojës për të punuar me një numër të madh dokumentesh të skanuar nuk ka gjasa të jetë i përshtatshëm, por është i përshtatshëm për njohjen e shpejtë të kartave të biznesit.

OmniPage Ultimate, OmniPage 18 - duhet të jetë diçka shumë e freskët

Nuk e di se sa mirë është softueri i njohjes së tekstit OmniPage: nuk ka versione të provave, nuk dua ta shkarkoj diku. Por, nëse çmimi i tij është i justifikuar dhe do të kushtojë rreth 5.000 rubla në versionin për përdorim individual dhe jo Ultimate, atëherë kjo duhet të jetë diçka mbresëlënëse. Faqja e programit: //www.nuance.com/for-individuals/by-product/omnipage/index.htm

Çmimi i softuerit OmniPage

Nëse lexoni karakteristikat dhe rishikimet, duke përfshirë edhe ato në botimet në gjuhën ruse, ata vërejnë se OmniPage siguron me të vërtetë njohje të kualitetit të lartë dhe të saktë, duke përfshirë edhe në gjuhën ruse, është relativisht e lehtë të çmontohen jo skanimet me cilësi më të lartë dhe ofrojnë një sërë mjetesh shtesë. Nga të metat, ajo nuk është më e përshtatshme, sidomos për një përdorues rishtar, ndërfaqe. Sidoqoftë, në tregun perëndimor, OmniPage është një konkurrent i drejtpërdrejtë i FineReader dhe në vlerësimet në gjuhën angleze ata po luftojnë pikërisht mes tyre, dhe për këtë arsye mendoj se programi duhet të jetë i denjë.

Këto nuk janë të gjitha programet e këtij lloji, ka edhe opsione të ndryshme për programet e vogla të lira, por gjatë eksperimentimit me ta kam gjetur dy mangësi kryesore të qenësishme në to: mungesa e mbështetjes cirilike ose softuere të ndryshme dhe jo shumë të dobishme në kitin e instalimit dhe prandaj vendosi të mos i përmend ato këtu.