Ertu með PDF skjal eða mynd sem þú vilt breyta í texta? Nýlega sendi mér einhver skjal í póstinum sem ég þurfti að breyta og senda til baka með leiðréttingum. Viðkomandi gat ekki fundið stafrænt eintak, svo mér var falið að fá allan þennan texta á stafrænu sniði.

Það var engin leið að ég ætlaði að eyða tíma í að slá allt inn aftur, svo ég endaði með því að taka fallega vandaða mynd af skjali og brenndi mér síðan í gegnum fullt af OCR þjónustu á netinu til að sjá hver myndi veita mér það besta niðurstöður.

Í þessari grein mun ég fara í gegnum nokkrar af uppáhalds síðunum mínum fyrir OCR sem eru ókeypis. Þess má geta að flestar þessar síður bjóða upp á grunn ókeypis þjónustu og hafa síðan greidda valkosti ef þú vilt auka eiginleika eins og stærri myndir, fjögurra blaðsíðna PDF skjöl, mismunandi innsláttartungumál osfrv.

Það er líka gott að vita fyrirfram að flestar þessar þjónustur geta ekki passað við snið upprunalega skjalsins. Þetta er aðallega til að vinna úr texta og það er það. Ef þú þarft allt til að vera í ákveðnu skipulagi eða sniði verðurðu að gera það handvirkt þegar þú hefur fengið allan textann frá OCR.

Að auki mun bestur árangur til að fá textann koma frá skjölum með 200 til 400 DPI upplausn. Ef þú ert með lága DPI mynd verða niðurstöðurnar ekki eins góðar.

Að síðustu, það voru fullt af síðum sem ég prófaði sem virkuðu bara ekki. Ef þú Google frjálsir OCR á netinu sérðu fullt af síðum en nokkur vefsvæða í topp 10 niðurstöðunum kláruðu ekki einu sinni viðskiptin. Sumir myndu tímast út, aðrir myndu gefa villur og sumir festust bara á „umbreytingar“ síðunni, svo ég nennti ekki einu sinni að minnast á þessar síður.

Fyrir hverja síðu prófaði ég tvö skjöl til að sjá hversu vel framleiðsla væri. Fyrir prófin mín notaði ég einfaldlega iPhone 5S minn til að taka mynd af báðum skjölunum og lagði þau síðan beint inn á vefsíðurnar til umbreytingar.

Ef þú vilt sjá hvernig myndirnar litu út eins og ég notaði í prófinu mínu, þá hef ég fest þær hér: Test1 og Test2. Athugaðu að þetta eru ekki útgáfur í fullri upplausn myndanna sem teknar voru úr símanum. Ég notaði myndina í fullri upplausn þegar ég var hlaðið inn á síðurnar.

OnlineOCR

OnlineOCR.net er hrein og einföld síða sem skilaði mjög góðum árangri í prófinu mínu. Það helsta sem mér líkar við það er að það eru ekki með fjöldann allan af auglýsingum út um allt, sem er venjulega raunin með þessar tegundir þjónustuþjónusta fyrir sess.

ókeypis á netinu ocr

Til að byrja skaltu velja skrána og bíða þar til henni lýkur. Hámarks upphleðslustærð fyrir þessa síðu er 100 MB. Ef þú skráir þig fyrir ókeypis reikning færðu nokkra auka eiginleika eins og stærri upphleðslustærð, fjögurra blaðsíðna PDF skjöl, mismunandi innsláttartungumál, fleiri viðskipti á klukkustund o.s.frv.

Veldu næst innsláttartungumálið og veldu síðan framleiðslusniðið. Þú getur valið úr Word, Excel eða Plain Text. Smelltu á Umbreyta hnappinn og þú munt sjá textann sem birtist neðst í reitnum ásamt niðurhleðslutengli.

ocr framleiðsla

Ef allt sem þú vilt er textinn, afritaðu hann og límdu hann úr reitnum. Hins vegar legg ég til að þú halir niður Word skjalinu vegna þess að það gerir furðu frábært starf við að halda útliti upprunalega skjalsins.

Til dæmis þegar ég opnaði Word skjalið fyrir mitt annað próf kom mér á óvart að skjalið var með töflu með þremur dálkum, rétt eins og á myndinni.

framleiðsla á ocr á netinu

Út af öllum síðunum var þessi langbesti. Það er algerlega þess virði að skrá sig ef þú þarft að gera mikið af viðskiptum.

Til að fullnægja, ætla ég líka að tengja við framleiðsluskilin sem eru búin til af hverri þjónustu svo þú getir séð árangurinn sjálfur. Hér eru niðurstöðurnar frá OnlineOCR: Test1 Doc og Test2 Doc.

Athugaðu að þegar þú opnar þessi Word skjöl á tölvunni þinni færðu skilaboð í Word þar sem fram kemur að þau séu af internetinu og klippingu hafi verið gerð óvirk. Það er fullkomlega í lagi vegna þess að Word treystir ekki skjölum af internetinu og þú þarft virkilega ekki að gera kleift að breyta ef þú vilt skoða skjalið.

i2OCR

Önnur síða sem skilaði ágætum árangri var i2OCR. Ferlið er mjög svipað: veldu tungumál, skrá og ýttu síðan á Extract Text.

i2ocr

Þú verður að bíða í eina mínútu eða tvær hér vegna þess að þessi síða tekur aðeins lengri tíma. Í skrefi 2 skaltu einnig ganga úr skugga um að myndin þín birtist hægra megin upp í forsýningunni, annars færðu fullt af rusli sem framleiðsla. Einhverra hluta vegna voru myndirnar frá iPhone minn sýndar í andlitsmynd á tölvunni minni, en landslag þegar ég sendi inn á þessa síðu.

i2ocr framleiðsla

Ég þurfti að opna myndina handvirkt í ljósmyndvinnsluforriti, snúa henni 90 gráður, snúa henni síðan aftur í andlitsmynd og vista hana síðan aftur. Þegar því er lokið skrunaðu niður og það sýnir þér forsýningu á textanum ásamt niðurhnappi.

Þessi síða gekk ágætlega með afköstin í fyrsta prófinu en gekk ekki svo vel með seinna prófið sem var með dálkaútlitið. Hér eru niðurstöður úr i2OCR: Test1 Doc og Test2 Doc.

FreeOCR

Free-OCR.com mun taka myndirnar þínar og breyta þeim í venjulegan texta. Það hefur ekki möguleika á að flytja út í Word snið. Veldu skrána þína, veldu tungumál og smelltu síðan á Start.

Þessi síða er hröð og þú munt fá framleiðsluna nokkuð fljótt. Smelltu bara á hlekkinn til að hlaða niður textaskránni í tölvuna þína.

freeocr

Eins og með NewOCR sem getið er hér að neðan, þá er þessi síða notuð til að nota öll T-skjölin í skjalinu. Ég hef ekki hugmynd um af hverju það myndi gera það, en af ​​einhverjum einkennilegum ástæðum gerðu bæði þessi síða og NewOCR þetta. Það er ekki mikið mál að breyta því en það er leiðinlegt ferli sem þú ættir í raun ekki að þurfa að gera.

Hér eru niðurstöðurnar frá FreeOCR: Test1 Doc og Test2 Doc.

ABBYY FineReader á netinu

Til þess að nota FineReader Online þarftu að skrá þig fyrir reikning sem fær þér 15 daga ókeypis prufutíma til OCR allt að 10 blaðsíður ókeypis. Ef þú þarft aðeins að gera einu sinni OCR í nokkrar síður, þá getur þú notað þessa þjónustu. Gakktu úr skugga um að smella á staðfestingartengilinn í staðfestingarpóstinum eftir að þú hefur skráð þig.

finereader á netinu

Smelltu á Viðurkenna efst og smelltu síðan á Hlaða til að velja skrána. Veldu tungumál, framleiðsla snið og smelltu síðan á Viðurkenna neðst. Þessi síða er með hreint viðmót og engar auglýsingar líka.

Í prófunum mínum tókst þessi síða að grípa textann úr fyrsta prófunarskjalinu, en það var alveg svakalegt þegar ég opnaði Word skjalið, svo ég endaði með því að gera það aftur og valdi venjulegan texta sem framleiðslusnið.

Í seinna prófinu með dálkunum var Word skjalið tómt og ég gat ekki einu sinni fundið textann. Ekki viss um hvað gerðist þar, en það virðist ekki geta höndlað neitt annað en einfaldar málsgreinar. Hér eru niðurstöðurnar frá FineReader: Test1 Doc og Test2 Doc.

NewOCR

Næsta síða, NewOCR.com, var í lagi, en ekki nærri eins góð og fyrsta vefsíðan. Í fyrsta lagi er það með auglýsingar, en sem betur fer ekki tonn. Þú velur skrána þína fyrst og smellir síðan á Preview hnappinn.

senda inn mynd

Þú getur síðan snúið myndinni og aðlagað svæðið þar sem þú vilt leita að texta. Það er nokkurn veginn eins og skannaferlið virkar á tölvu með meðfylgjandi skanni.

ocr mynd

Ef skjalið er með marga dálka geturðu athugað hnappinn á greiningum á síðuútliti og það mun reyna að skipta textanum upp í dálka. Smelltu á OCR hnappinn, bíddu í nokkrar sekúndur þar til hann lýkur og skrunaðu síðan niður til botns þegar síðan endurnýjast.

Í fyrsta prófinu fékk það allan textann rétt, en af ​​einhverjum ástæðum nýttir allir T í skjalinu! Engin hugmynd hvers vegna það myndi gera það, en það gerði það. Í seinna prófinu þar sem greining blaðsíðna var gerð virk, fékk það flestan textann, en skipulagið var alveg slökkt.

Hér eru niðurstöður frá NewOCR: Test1 Doc og Test2 Doc.

Niðurstaða

Eins og þú sérð gefur ókeypis ekki raunverulega mjög góðan árangur oftast. Fyrsta vefsíðan sem nefnd er er langbest því hún gerði ekki aðeins frábært starf við að þekkja allan textann, heldur tókst það að halda sniði upprunalega skjalsins.

Ef þú þarft bara texta, þá ættu flestir vefsíðurnar hér að ofan að geta gert það fyrir þig. Ef þú hefur einhverjar spurningar, ekki hika við að tjá sig. Njóttu!