The Best Arabisk OCRs

The Best Arabisk OCRs


Mange utfordringer står arabisk optisk tegngjenkjenning programvare, ikke minst som er den relative mangelen på interesse i forhold til europeiske språk. Men skriften selv tilbyr betydelige hindringer, inkludert variabel karakter former og den tilkoblede natur bokstavene. Betydningen av små prikker og andre diakritiske tegn for å skille ellers likelydende brev har også vist seg problematisk, krever skannere for å være ekstremt følsom og programvaren mer kresne enn det som er nødvendig for vestlige skript. Likevel er det noen profesjonelle pakker tilgjengelig, flere lovende OCRs i utvikling og mange småskala OCRs utviklet av akademikere.

Readiris Pro 12 Middle East

Langt unna de mest vellykkede arabisk OCR-programvare på markedet, har det mye bedre funksjonalitet enn noen av de andre alternativene som er i stand til å generere en rekke dokumenttyper, og det gir filkomprimering. Det er også ganske nøyaktig i å lese arabisk skrift, selv om språket er urdu eller farsi. Imidlertid er denne programvaren en del av en pakke med mange andre språk inkludert, og det gir en lavere nøyaktighet lesing i disse språkene enn andre OCRs tilgjengelig.

Automatisk Reader gull eller platina

Noe mindre kjent, men betydelig mer spesialisert, er AramediA automatiske Reader. Den har færre bjeller og fløyter, men det inkluderer mye bedre naturlig språk prosessering spesielt for arabisk. Bakgrunnen for utviklere involvert i å lage denne programvaren inneholder noen tungvektere i språk prosessering teknologi, slik at dette kan komme som liten overraskelse. Den støtter arabisk som standard, og en plug-in er tilgjengelig for å støtte farsi, Jawi, pashto og urdu, noe som gir et bredere spekter av støttede arabisk skrift språk enn Readiris Pro.

OCRs Utviklet av Akademik

Det finnes en rekke arabisk språk og script OCRs tilgjengelig, ofte på liten eller ingen kostnad, noe som kan være en stor fordel i forhold til de faglige pakker. Noen av disse har også fordelen av å år - noe mer enn et tiår - av utvikling, samt en vekt på nøyaktighet og leser språk forståelse. Men disse er også generelt ganske treg og mangler i andre funksjoner. Nyere seg spesielt har vært nyter godt av en stor database med håndskrevne prøver - kjent som ARABASE - og utviklingen i kunstig intelligens teknologi.

OCRs i utvikling

En håndfull lovende arabisk OCRs er satt til å bli utgitt i 2011 eller 2012, som omfatter det beste av profesjonell programvare og siste faglige utviklingen. Hvis du tar kontakt med selskapene direkte, kan du være i stand til å få en betaversjon. Det er to spesielt lovende OCRs i denne kategorien - en basert på ORAN system, utviklet ved Kong Fahds i Saudi-Arabia, og ett kjent som Clever Page, på grunn ut i november 2011, og støttes av en egyptisk Informasjonsteknologi Academia Samarbeid fondet.