Ha bármilyen nyomtatott szöveget digitális szöveggé szeretne konvertálni, amelyet másolhat, beilleszthet, szerkeszthet és kereshet, akkor optikai karakterfelismerő (OCR) szkennereket kell használnia.
Ha a dokumentum szkennelését vagy fényképezését választja, a dokumentum JPEG vagy PDF formátumban kerül mentésre. OCR szoftver ezután felismeri a dokumentumokban található betűket és számokat, és átalakíthatja azokat kereshető PDF -fájlokká vagy fájlokká, amelyeket a Microsoft Word programokban szerkeszthet.
A probléma az, hogy egyes OCR -szkennerek sokkal jobban működnek, mint mások, és a legjobbak elég nehézek a pénztárcán.
Az Omnipage18 például 150 dollárba kerül, de különösen jól ismeri a különböző nyelveket. Adobe Acrobat Pro DC 400 dollárba kerül, de hihetetlen pontossággal rendelkezik. ABBYY FineReader 150 dollárba kerül, de fantasztikus az olyan dokumentumok, mint magazinok és brosúrák kereshető szöveggé történő átalakítása. Ebben a cikkben később teszteljük az ABBYY online kínálatát.
Ha azonban ingyenes alternatívákat keres, akkor megteheti Letöltés és Windows vagy OS X rendszeren használja, próbálja ki ezeket az OCR eszközöket. De ha inkább ingyeneset használ, online OCR eszköz, olvassa tovább, mivel kipróbáltuk az első néhányat, az alábbi eredményekkel.
A teszt
Úgy tűnik, a legtöbb ember most az okostelefonját használja a szkennelés elvégzéséhez, úgy döntöttem, hogy használni fogom Az Evernote szkennelhető alkalmazása (Ingyenes iOS -en és Androidon). Szkenneltem Richard Dawkin első oldalát A hegymászás valószínűtlen , hogy milyen eredményeket érhetünk el nagyon egyszerű formázással. Beolvastam Tim Ferriss oldalát is A 4 órás séf hogy kipróbálja a szkennereket némileg bonyolultabb formázással. Mindegyik fájlt PDF -ként mentettem.
Ezeket a dokumentumokat azután átnézték az állítólag legjobb online OCR -eszközök között, hogy lássák, milyen jól teljesítettek.
Ingyenes online OCR [már nem elérhető]
Szerencsére az ingyenes online OCR használatához nincs regisztráció szükséges. És duplán lenyűgözött, amikor megláttam az állításukat, hogy megtartják a dokumentum formázását és elrendezését.
Az oldal azt állítja, hogy képes támogatni a PDF, GIF, BMP, JPEG, TIFF és PNG formátumokat bemenetként. A kimenetek lehetnek DOC, PDF szöveges dokumentum, RTF és TXT. Sajnos nem tudtam kideríteni, hogy van -e fájlméretkorlátjuk.
Alapdokumentum PDF formátumba
Teljesen tökéletesen átalakítva. Nincs sok mondanivaló! Indulunk a nagyon jó kezdés.
Alapdokumentum a DOC -hoz
Úgy tűnik, hogy a tényleges szavak hibátlanul átalakultak, leszámítva a 'Mount Rushmore' 'valahogy' AWOL -t. A formázás azonban más történet. Sok vesszőt aláhúzásokkal helyettesítettek, és véletlenszerű szóközöket illesztettek be a dokumentum egészébe. Ha később látni fogja, hogy a prémium szoftver hogyan teljesített ebben a tesztben, ez nem rossz erőfeszítés egyáltalán .
Összetett dokumentum PDF formátumba
Összetett dokumentum a DOC -hoz
Ezúttal a konverzió mindössze 10 másodpercet vett igénybe, a szöveg ismét körülbelül 95% -os pontossággal lett átalakítva. Voltak furcsa térközproblémák, és a szoftvernek gondjai voltak a dokumentum jobb felső sarkában lévő betűtípus átalakításával, és itt -ott kihagyott néhány karaktert.
Ítélet
i2OCR
Az i2OCR lenyűgöző állításokat tesz. Az eszköz több mint 60 nyelvet ismer fel, képes kezelni a több oszlopos elrendezést (a formázás eltávolításával), nincs fájlméret-korlátozása, képes konvertálni a feltöltött fájlokat és URL -ekből. Az eszköz használatához sem kell regisztrálnia.
A szolgáltatás úgy működik, hogy egyszerűen kivonja a szöveget a képből, majd formázatlan szöveget ad ki. Gyorsan kijavíthatja a hibákat az egymás melletti nézetben, mielőtt másolja a szöveget más programokba, vagy letöltené DOC, PDF vagy HTML formátumban.
Megjegyzés: amikor megpróbáltam feltölteni PDF dokumentumaimat, az i2OCR elutasította ezeket, ezért ezeket JPEG formátumba kellett konvertálnom (képernyőképet készítve róluk, majd feltöltve a fájlokat).
Alapdokumentum egyszerű szövegként
Komplex dokumentum egyszerű szövegként
A szöveg nagy részét túl sok hiba nélkül konvertálták, leszámítva a címet és a receptet a jobb felső sarokban, amely nem volt olvasható ehhez az eszközhöz. Az oszlopok egyszerű szöveggé alakításának módja messze nem volt ideális. Ha ezt az átalakítást működőképessé szeretné tenni, sok időre lenne szükség a sorok koherens mondatokká történő átrendezéséhez.
Ítélet
Online OCR
Az online OCR jelenleg 46 különböző nyelvet támogat, és PDF, JPG, BMP, TIFF és GIF fájlokat Word, Excel vagy Plain Text formátumba konvertálhat. A webhely azt állítja, hogy „az átalakított dokumentumok pontosan úgy néznek ki, mint az eredeti - táblázatok, oszlopok és grafikák”.
A regisztráció nélkül használható verzió lehetővé teszi, hogy óránként akár 15 képet konvertáljon (5 MB korlát). Ha regisztrál egy fiókra, akkor további oldalakat vásárolhat ezen a korláton felül, ugyanakkor többoldalas dokumentumokat és ZIP-archívumokat is konvertálhat.
Alapdokumentum a DOC -hoz
Az alapdokumentum a római számtól eltekintve hibátlanul átalakult én nem veszik fel. Ahogy az oldal ígérte, a formázás pontosan olyan volt, mint a könyvben. Gratulálok ehhez az eszközhöz.
Összetett dokumentum a DOC -hoz
Miután csalódást okoztam a korábbi OCR eszközökben az összetett dokumentum konvertálásakor, hatalmas lenyűgözött az Online OCR. Az elrendezés majdnem tökéletes volt, ahogy fent láthatod. Még egyszer, a receptet nem vették túl jól, de minden más kisebb hiba elhanyagolható volt.
Ítélet
Teljesen fantasztikus eredmények az online OCR -től. Az egyetlen hátrányt látom, hogy nincs lehetőség letölteni a konvertált dokumentumokat PDF -ként, mivel az említett kimeneti formátumok csak a DOCX, XLSX és TXT formátumokat tartalmazzák.
ABBYY FineReader Online (10 oldalas próbaverzió)
Amint azt korábban említettük, az ABBYY az OCR szoftverek egyik piacvezetője, körülbelül 150 dollárba kerül a teljes, letölthető programért. Kínálnak egy 10 oldalas ingyenes próbaverzió online eszközükhöz (regisztráció szükséges). 5 dolláros előfizetés esetén online eszközük lehetővé teszi havi 200 oldal konvertálását.
Az elfogadott fájlok akár 100 MB méretűek lehetnek, a következő formátumok bármelyikében: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP és PNG. Az ABBYY közel 200 nyelvet is felismer. A kimenetek különösen lenyűgözőek, a DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 és EPUB lehetőségek közül választhat.
A próbaidő alatt kipróbálhat néhány BETA funkciót is. Az első lehetőség a dokumentum másik nyelvre történő lefordítása. A másik az exportált konvertált dokumentum a felhőalapú tárfiókjába, legyen az Dropbox, Google Drive, Evernote, Microsoft OneDrive vagy Box.
Alapdokumentum a DOCX -hoz
Összetett dokumentum a DOCX -hoz
Az átalakítás után nagyon kevés hiba volt a dokumentumban a szövegben (leszámítva az OCR -t, amely ismét a recept betűtípusával küzd!), De a formázás sok kívánnivalót hagyott maga után.
A három oszlop valahogy két oldalt vett fel, a középső oszloppal csak jelenik meg a második oldalon. Ha tulajdonképpen akarnád tedd bármit ezzel az átalakított dokumentummal, a végén kihúzza a haját.
Alapdokumentum PDF formátumba
Összetett dokumentum PDF formátumba
Ítélet
A végső eredmény
Ha a legtöbb emberhez hasonlóan csak néhány folyóiratcikket és néhány háztartási számlát szeretne beolvasni, akkor nem kell szerkesztenie ezeket a dokumentumokat. Ezért a közvetlen PDF formátumba konvertálás megfelelő lesz az Ön számára, mert továbbra is kereshet ezekben a dokumentumokban. Ehhez az ingyenes online OCR minden bizonnyal a legjobb ingyenes eszköz volt, amelyet teszteltünk. Mindezek ellenére, ha hajlandó havi 5 dollárt fizetni a tökéletességért, Az ABBYY FineReader Online szolgáltatása kicsit pontosabb volt.
Ami a dokumentumok DOC -ba való konvertálását illeti, nem sikerült tökéletes megoldást találnunk, de messze a legjobb eredmények származtak Online OCR . Az átalakítás nem volt tökéletes, de a formázás integritása nagyrészt érintetlen maradt, és a hibák elhanyagolhatóak voltak. Ha összehasonlítjuk ezeket az eredményeket az ABBYY „prémium” kínálatával, nem hagyhatja ki, hogy hatalmas benyomást tegyen.
Ebben a bejegyzésben nem szerepeltettük a Google Drive OCR képességeit; egy kicsit a Google mindenért, de inkább azért, mert ki akartunk próbálni néhány más ingyenes online OCR szolgáltatást.
Rajtad: Milyen más online OCR eszközöket ajánlanál olvasóinknak? És melyiket próbáltad, amit soha többé nem használnál?
Részvény Részvény Csipog Email Kezdő útmutató a beszéd animálásáhozA beszéd animálása kihívást jelenthet. Ha készen áll arra, hogy párbeszédet adjon hozzá a projekthez, akkor lebontjuk a folyamatot.
Az xbox one s nem fog csatlakozni a wifi -hezOlvassa tovább Kapcsolódó témák
- Internet
- Termelékenység
- Fájl konverzió
- OCR
Rob Nightingale az Egyesült Királyságban, a York -i Egyetemen szerzett filozófiai diplomát. Több mint öt éve dolgozik közösségi média menedzserként és tanácsadóként, miközben több országban tart workshopokat. Rob az elmúlt két évben technológiai író is volt, a MakeUseOf közösségi média menedzsere és hírlevél -szerkesztője. Általában a világon utazó, videószerkesztő és fotózó kísérletekkel találja őt.
Továbbiak Rob Nightingale -tőlIratkozzon fel hírlevelünkre
Csatlakozz hírlevelünkhöz, ahol technikai tippeket, értékeléseket, ingyenes e -könyveket és exkluzív ajánlatokat találsz!
Feliratkozáshoz kattintson ide