Njohja e tekstit në një skedar PDF në internet.


Nuk është gjithmonë e mundur të nxjerrim tekst nga skedari PDF duke përdorur kopjim konvencional. Shpesh faqet e dokumenteve të tilla janë përmbajtja e skanuar e versioneve të tyre të letrës. Për të kthyer skedarë të tillë në të dhëna plotësisht të përpunueshme të tekstit, përdoren programe speciale me funksionin e njohjes së karakterit optik (OCR).

Zgjidhje të tilla janë shumë të vështira për t'u zbatuar dhe prandaj kushtojnë shumë para. Nëse keni nevojë të njihni tekstin me PDF rregullisht, këshillohet të blini programin e duhur. Për raste të rralla, do të ishte më logjike të përdorni një nga shërbimet në dispozicion online me funksione të ngjashme.

Si të njohësh tekstin nga PDF në internet

Natyrisht, funksioni i funksioneve të shërbimeve online OCR është më i kufizuar në krahasim me zgjidhjet e plota desktop. Por mund të punoni me burime të tilla ose falas, ose për një tarifë nominale. Gjëja kryesore është që aplikacionet përkatëse të internetit të përballen me detyrën e tyre kryesore, përkatësisht njohjen e tekstit.

Metoda 1: ABBYY FineReader Online

Kompania e zhvillimit të shërbimit është një nga udhëheqësit në fushën e njohjes së dokumenteve optike. ABBYY FineReader për Windows dhe Mac është një zgjidhje e fuqishme për konvertimin e PDF në tekst dhe duke punuar me të.

Homologu i uebit të programit, natyrisht, është më inferior ndaj tij në funksionalitet. Megjithatë, shërbimi mund të njohë tekstin nga skanimet dhe fotot në më shumë se 190 gjuhë. Mbështet konvertimin e skedarëve PDF në dokumente Word, Excel etj.

ABBYY FineReader Online shërbim online

  1. Para se të filloni të punoni me mjetin, krijoni një llogari në vend ose futuni në llogarinë tuaj Facebook, Google ose Microsoft.

    Për të shkuar te dritarja e identifikimit, klikoni mbi butonin. "Login" në shiritin e sipërm të menusë.
  2. Pasi të regjistroheni, importoni dokumentin e dëshiruar PDF në FineReader duke përdorur butonin "Ngarkoni skedarët".

    Pastaj kliko "Zgjidh numrat e faqeve" dhe specifikoni hapësirën e dëshiruar për njohjen e tekstit.
  3. Tjetra, zgjidhni gjuhët e pranishme në dokument, formatin e skedarit që rezulton dhe klikoni mbi butonin "Njohin".
  4. Pas përpunimit, kohëzgjatja e të cilës varet tërësisht nga madhësia e dokumentit, mund të shkarkoni skedarin e përfunduar me të dhëna të tekstit thjesht duke klikuar mbi emrin e tij.

    Ose eksportoni në një nga shërbimet cloud në dispozicion.

Shërbimi dallohet, ndoshta, nga algoritmet më të sakta të njohjes së tekstit në imazhe dhe skedarë PDF. Por, për fat të keq, përdorimi i saj i lirë është i kufizuar në pesë faqe të përpunuara në muaj. Për të punuar me dokumente më voluminoze, duhet të blesh një abonim një vjeçar.

Megjithatë, nëse funksioni OCR është i nevojshëm shumë rrallë, ABBYY FineReader Online është një mundësi e mirë për nxjerrjen e tekstit nga skedarët e vegjël PDF.

Metoda 2: OCR pa pagesë në internet

Shërbim i thjeshtë dhe i përshtatshëm për digjitalizimin e tekstit. Pa nevojën për regjistrim, burimi ju lejon të njohni 15 faqe të plota PDF në orë. OCR falas online punon plotësisht me dokumentet në 46 gjuhë dhe pa autorizim mbështet tri formatet e eksportit të tekstit - DOCX, XLSX dhe TXT.

Gjatë regjistrimit, përdoruesi është në gjendje të përpunojë dokumente me shumë faqe, por numri i lirë i këtyre faqeve është i kufizuar në 50 njësi.

Shërbim online falas OCR në internet

  1. Për të njohur tekstin nga PDF si "mysafir", pa autorizim në burim, përdorni formën e duhur në faqen kryesore të faqes.

    Zgjidhni dokumentin e dëshiruar duke përdorur butonin "File", specifikoni gjuhën kryesore të tekstit, formatin e prodhimit, më pas prisni që skedari të ngarkojë dhe kliko "Convert".
  2. Në fund të procesit të digjitalizimit, klikoni "Shkarko skedarin e prodhimit" për të ruajtur dokumentin e përfunduar me tekstin në kompjuter.

Për përdoruesit e autorizuar, rendi i veprimeve është disi i ndryshëm.

  1. Përdorni butonin "Regjistrimi" ose "Login" në shiritin e sipërm të menusë, përkatësisht, krijoni një llogari OCR Free Online ose shkoni në të.
  2. Pas autorizimit në panelin e njohjes, mbajeni çelësin «CTRL», zgjidhni deri në dy gjuhë të dokumentit burimor nga lista e ofruar.
  3. Specifikoni opsionet e mëtejshme për nxjerrjen e tekstit nga PDF dhe klikoni butonin. "Zgjidh skedarin" për të ngarkuar dokumentin në shërbim.

    Pastaj, për të filluar njohjen, kliko "Convert".
  4. Pas përpunimit të dokumentit, klikoni në lidhjen me emrin e skedarit të prodhimit në kolonën përkatëse.

    Rezultati i njohjes do të ruhet menjëherë në kujtesën e kompjuterit tuaj.

Nëse keni nevojë për nxjerrjen e tekstit nga një dokument i vogël PDF, ju mund të përdorni në mënyrë të sigurtë mjetin e përshkruar më sipër. Për të punuar me skedarë të mëdhenj, do të duhet të blini simbole shtesë në OCR Free Online ose të përdorni një zgjidhje tjetër.

Metoda 3: NewOCR

OCR-shërbim plotësisht i lirë që ju lejon të nxjerrni tekst nga pothuajse çdo dokument grafik dhe elektronik si DjVu dhe PDF. Burimi nuk vendos kufizime mbi madhësinë dhe numrin e dosjeve të njohura, nuk kërkon regjistrim dhe ofron një gamë të gjerë funksionesh të ngjashme.

NewOCR mbështet 106 gjuhë dhe është në gjendje të trajtojë me saktësi edhe skanime dokumentash me cilësi të ulët. Mund të zgjidhni manualisht zonën për njohjen e tekstit në faqen e skedarit.

Shërbimi Online NewOCR

  1. Pra, mund të filloni të punoni menjëherë me burimet, pa pasur nevojë të bëni veprime të panevojshme.

    Direkt në faqen kryesore ekziston një formë për importimin e dokumentit në vend. Për të ngarkuar një skedar në NewOCR, përdor butonin "Zgjidh skedarin" në seksionin "Zgjidh skedarin tënd". Pastaj në fushë "Gjuhë (et) e njohjes" zgjidhni një ose më shumë gjuhë të dokumentit burimor, pastaj klikoni "Ngarko + OCR".
  2. Vendosni parametrat e preferuara të njohjes, zgjidhni faqen e dëshiruar për nxjerrjen e tekstit dhe klikoni butonin. «OCR».
  3. Shkoni poshtë pak dhe gjeni butonin. «Shkarko».

    Klikoni mbi të dhe në listën e drop-down zgjidhni formatin e dokumentit të kërkuar për shkarkim. Pas kësaj, skedari i përfunduar me tekstin e nxjerrë do të shkarkohet në kompjuterin tuaj.

Mjeti është i përshtatshëm dhe njeh të gjitha karakteret në një cilësi mjaft të lartë. Megjithatë, përpunimi i secilës faqe të dokumentit të importuar PDF duhet të lançohet në mënyrë të pavarur dhe të shfaqet në një skedar të veçantë. Natyrisht, mund të kopjoni menjëherë rezultatet e njohjes në clipboard dhe t'i bashkoni ato me të tjerët.

Sidoqoftë, duke pasur parasysh nuancën e mësipërme, sasi të mëdha të tekstit duke përdorur NewOCR janë shumë të vështira për t'u nxjerrë. Me të njëjtin shërbim të skedarëve të vogël copes "me një zhurmë".

Metoda 4: OCR.Space

Një burim i thjeshtë dhe i kuptueshëm për digjitalizimin e tekstit ju lejon të njohni dokumentet PDF dhe të jepni rezultatet në një skedar TXT. Nuk ka kufizime për numrin e faqeve. E vetmja kufizim është se madhësia e dokumentit të hyrjes nuk duhet të kalojë 5 megabajt.

OCR.Space shërbim online

  1. Regjistrohu për të punuar me mjet nuk është e nevojshme.

    Vetëm klikoni në linkun e mësipërm dhe ngarkoni dokumentin PDF në faqen e internetit nga kompjuteri juaj duke përdorur butonin "Zgjidh skedarin" ose nga rrjeti - sipas referencës.
  2. Në listën dropdown "Zgjidh gjuhën e OCR" zgjidhni gjuhën e dokumentit të importuar.

    Pastaj filloni procesin e njohjes së tekstit duke klikuar mbi butonin. "Filloni OCR!".
  3. Në fund të përpunimit të skedarëve, shihni rezultatin në "Rezultati OCR'ed" dhe kliko «Shkarko»për të shkarkuar dokumentin e përfunduar TXT.

Nëse vetëm duhet të nxjerrësh tekstin nga PDF dhe formatimi përfundimtar nuk është aspak i rëndësishëm, OCR.Space është një zgjedhje e mirë. Dokumenti i vetëm duhet të jetë "njëgjuhësor", pasi nuk është siguruar njohja e dy ose më shumë gjuhëve në të njëjtën kohë në shërbim.

Shih gjithashtu: Free analogues FineReader

Vlerësimi i mjeteve online të prezantuara në artikull, duhet të theksohet se FineReader Online nga ABBYY trajton funksionin e OCR më saktë dhe me saktësi. Nëse saktësia maksimale e njohjes së tekstit është e rëndësishme për ju, është mirë që ta konsideroni në mënyrë specifike këtë opsion. Por për të paguar për të, ka shumë të ngjarë, gjithashtu duhet të.

Nëse keni nevojë të digjitalizoni dokumente të vogla dhe jeni gati për të korrigjuar gabimet në shërbim, rekomandohet të përdorni NewOCR, OCR.Space ose OCR Free Online.