Heeft u een PDF-document of een afbeelding die u naar tekst wilt converteren? Onlangs stuurde iemand me een document in de e-mail dat ik moest bewerken en terugsturen met correcties. De persoon kon een digitale kopie niet vinden, dus kreeg ik de opdracht om al die tekst in digitaal formaat te krijgen.

Er was geen enkele manier om uren achter elkaar alles in te typen, dus nam ik een mooie foto van hoge kwaliteit van het document en brandde me vervolgens door een heleboel online OCR-services om te zien welke mij het beste zou geven resultaten.

In dit artikel zal ik een paar van mijn favoriete sites voor OCR doornemen die gratis zijn. Het is vermeldenswaard dat de meeste van deze sites een eenvoudige gratis service bieden en vervolgens betaalde opties hebben als u extra functies wilt, zoals grotere afbeeldingen, PDF-documenten met meerdere pagina's, verschillende invoertalen, enz.

Het is ook goed om van tevoren te weten dat de meeste van deze services niet in overeenstemming zijn met de opmaak van uw originele document. Deze zijn voornamelijk bedoeld voor het extraheren van tekst en dat is alles. Als u alles in een specifieke lay-out of indeling wilt hebben, moet u dat handmatig doen zodra u alle tekst uit de OCR hebt gehaald.

Bovendien zullen de beste resultaten voor het verkrijgen van de tekst afkomstig zijn van documenten met een resolutie van 200 tot 400 DPI. Als u een afbeelding met een lage DPI heeft, zijn de resultaten niet zo goed.

Ten slotte waren er veel sites die ik heb getest die gewoon niet werkten. Als je Google gratis online OCR gebruikt, zie je een aantal sites, maar verschillende sites in de top 10 resultaten hebben de conversie niet eens voltooid. Sommigen zouden een time-out krijgen, anderen zouden fouten geven en sommigen kwamen gewoon vast te zitten op de "converterende" pagina, dus ik nam niet eens de moeite om die sites te noemen.

Voor elke site heb ik twee documenten getest om te zien hoe goed de output zou zijn. Voor mijn tests gebruikte ik gewoon mijn iPhone 5S om een ​​foto van beide documenten te maken en deze vervolgens rechtstreeks naar de websites te uploaden voor conversie.

Als je wilt zien hoe de afbeeldingen eruit zagen die ik voor mijn test heb gebruikt, heb ik ze hier bijgevoegd: Test1 en Test2. Merk op dat dit niet de versies met volledige resolutie zijn van de afbeeldingen die vanaf de telefoon zijn gemaakt. Ik heb de afbeelding met volledige resolutie gebruikt bij het uploaden naar de sites.

OnlineOCR

OnlineOCR.net is een schone en eenvoudige site die zeer goede resultaten heeft opgeleverd in mijn test. Het belangrijkste dat ik er leuk aan vind, is dat het niet overal tonnen advertenties heeft, wat meestal het geval is met dit soort nicheservicesites.

gratis online ocr

Selecteer om te beginnen uw bestand en wacht tot het uploaden is voltooid. De maximale uploadgrootte voor deze site is 100 MB. Als u zich registreert voor een gratis account, krijgt u een paar extra functies, zoals de grotere uploadgrootte, pdf's met meerdere pagina's, verschillende invoertalen, meer conversies per uur, enz.

Kies vervolgens uw invoertaal en kies vervolgens het uitvoerformaat. Je kunt kiezen uit Word, Excel of Tekst zonder opmaak. Klik op de knop Converteren en u ziet de tekst onderaan in een vak samen met een downloadlink.

ocr-uitvoer

Als u alleen de tekst wilt, kopieert en plakt u deze vanuit het vak. Ik raad u echter aan het Word-document te downloaden omdat het verrassend goed is om de lay-out van het originele document te behouden.

Toen ik bijvoorbeeld het Word-document opende voor mijn tweede test, was ik verrast om te ontdekken dat het document een tabel met drie kolommen bevatte, net als in de afbeelding.

online ocr-uitvoer

Van alle sites was deze veruit de beste. Het is absoluut de moeite waard om je te registreren als je veel conversies moet doen.

Voor de volledigheid ga ik ook linken naar de uitvoerbestanden die door elke service zijn gemaakt, zodat u de resultaten zelf kunt zien. Hier zijn de resultaten van OnlineOCR: Test1 Doc en Test2 Doc.

Merk op dat wanneer u deze Word-documenten op uw computer opent, u een bericht krijgt in Word waarin staat dat het van internet komt en dat bewerken is uitgeschakeld. Dat is prima, want Word vertrouwt geen documenten van internet en u hoeft het bewerken echt niet in te schakelen als u alleen het document wilt bekijken.

i2OCR

Een andere site die behoorlijk goede resultaten opleverde, was i2OCR. Het proces lijkt erg op elkaar: kies uw taal, bestand en druk vervolgens op Extract Text.

i2ocr

Je zult hier een minuut of twee moeten wachten omdat deze site wat langer duurt. Zorg er in Stap 2 ook voor dat je afbeelding met de goede kant naar boven in het voorbeeld wordt weergegeven, anders krijg je een hoop gebrabbel als uitvoer. Om een ​​of andere reden werden de afbeeldingen van mijn iPhone in portretmodus op mijn computer weergegeven, maar liggend toen ik naar deze site uploadde.

i2ocr-uitvoer

Ik moest de afbeelding handmatig openen in een app voor fotobewerking, deze 90 graden draaien, vervolgens weer terug naar portret draaien en vervolgens opnieuw opslaan. Als je klaar bent, scrol je naar beneden en je ziet een voorbeeld van de tekst samen met een downloadknop.

Deze site deed het redelijk goed met de uitvoer voor de eerste test, maar deed het niet zo goed met de tweede test met de kolomlay-out. Hier zijn de resultaten van i2OCR: Test1 Doc en Test2 Doc.

FreeOCR

Free-OCR.com neemt uw afbeeldingen en zet ze om in platte tekst. Het heeft geen optie om naar Word-formaat te exporteren. Kies uw bestand, selecteer een taal en klik vervolgens op Start.

De site is snel en je krijgt de output vrij snel. Klik gewoon op de link om het tekstbestand naar uw computer te downloaden.

freeocr

Net als bij NewOCR hieronder vermeld, maakt deze site gebruik van alle T's in het document. Ik heb geen idee waarom het dat zou doen, maar om een ​​of andere vreemde reden hebben deze site en NewOCR dit allebei gedaan. Het is niet erg om het te veranderen, maar het is een vervelend proces dat je echt niet hoeft te doen.

Hier zijn de resultaten van FreeOCR: Test1 Doc en Test2 Doc.

ABBYY FineReader Online

Om FineReader Online te gebruiken, moet u zich registreren voor een account, waarmee u een gratis proefperiode van 15 dagen krijgt voor OCR tot 10 pagina's gratis. Als u slechts een eenmalige OCR voor een paar pagina's hoeft te doen, kunt u deze service gebruiken. Zorg ervoor dat u na het registreren op de verificatielink in de bevestigingsmail klikt.

finereader online

Klik bovenaan op Herkennen en klik vervolgens op Uploaden om uw bestand te selecteren. Kies uw taal, uitvoerformaat en klik onderaan op Herkennen. Deze site heeft een overzichtelijke interface en ook geen advertenties.

In mijn tests kon deze site de tekst uit het eerste testdocument halen, maar het was absoluut enorm toen ik het Word-document opende, dus ik deed het uiteindelijk opnieuw en koos platte tekst als het uitvoerformaat.

Voor de tweede test met de kolommen was het Word-document leeg en kon ik de tekst niet eens vinden. Ik weet niet zeker wat daar is gebeurd, maar het lijkt niet in staat om iets anders te verwerken dan eenvoudige alinea's. Hier zijn de resultaten van FineReader: Test1 Doc en Test2 Doc.

NewOCR

De volgende site, NewOCR.com, was in orde, maar lang niet zo goed als de eerste site. Ten eerste heeft het advertenties, maar gelukkig geen ton. U selecteert eerst uw bestand en klikt vervolgens op de knop Voorbeeld.

afbeelding uploaden

Vervolgens kunt u de afbeelding roteren en het gebied aanpassen waar u naar tekst wilt scannen. Het lijkt een beetje op hoe het scanproces werkt op een computer met een aangesloten scanner.

ocr afbeelding

Als het document meerdere kolommen heeft, kunt u de analyse-knop Paginalay-out aanvinken en wordt geprobeerd de tekst in kolommen op te splitsen. Klik op de OCR-knop, wacht een paar seconden totdat deze is voltooid en scrol vervolgens naar beneden wanneer de pagina wordt vernieuwd.

In de eerste test kreeg het alle tekst correct, maar om de een of andere reden werd elke T in het document met een hoofdletter geschreven! Geen idee waarom het dat zou doen, maar het deed het. In de tweede test met ingeschakelde pagina-analyse kreeg de meeste tekst, maar de lay-out was volledig uitgeschakeld.

Hier zijn de resultaten van NewOCR: Test1 Doc en Test2 Doc.

Gevolgtrekking

Zoals je kunt zien, geeft gratis helaas niet altijd erg goede resultaten. De eerste genoemde site is veruit de beste, omdat het niet alleen uitstekend is om alle tekst te herkennen, maar ook het formaat van het originele document heeft behouden.

Als u echter alleen tekst nodig heeft, zouden de meeste van de bovenstaande websites dat voor u moeten kunnen doen. Als je vragen hebt, reageer dan gerust. Genieten!