Mi az optikai karakterfelismerés (OCR)?

by Renée Lynn Midrack

Az optikai karakterfelismerés (OCR) olyan szoftverre vonatkozik, amely a nyomtatott, gépelt vagy kézzel írott dokumentum digitális verzióját hozza létre, amelyet a számítógépek elolvashatnak anélkül, hogy manuálisan beírnák vagy be kellene írniuk a szöveget. Az OCR-t általában PDF formátumú, beolvasott dokumentumokban használják, de létrehozhat egy számítógépen olvasható szöveget egy képfájlban.

Mi az OCR?

Az OCR, amelyet szövegfelismerésnek is neveznek, olyan szoftvertechnológia, amely a nyomtatott vagy írásos dokumentumokból, például számokból, betűkből és írásjelekből (más néven glyphs) átírja az elektronikus formátumot, amely könnyebben felismerhető és olvasható számítógéppel és más szoftverprogramokkal. Bizonyos OCR-programok ezt a dokumentumot szkennelik vagy fényképezik digitális fényképezőgéppel, mások pedig ezt a folyamatot alkalmazhatják az olyan dokumentumokra, amelyeket korábban szkenneltek vagy fényképeztek OCR nélkül. Az OCR lehetővé teszi a felhasználók számára, hogy PDF dokumentumokban keressenek, szövegeket szerkesztenek, és újra formázzák a dokumentumokat.

Mi az OCR?

Gyors, napi beolvasási igények esetén az OCR nem lehet nagy ügy. Ha nagy mennyiségű szkennelést végez, a PDF-fájlok kereséséhez, hogy megtalálja a pontos leírást, időt takaríthat meg, és fontosabbá teheti az OCR funkciót a szkennerprogramban. Íme néhány más dolog, amellyel az OCR segít:

Automatizált adatfeldolgozás és adatbevitel (Példa: Álláskeresõ nyomkövetõ rendszerek folytatásához)
Beolvasott könyvek kereshetővé tétele
A kézzel írott beolvasások számítógéppel olvashatóvá válnak
A dokumentumok felhasználhatósága olyan olvasóprogramok számára, amelyek segítik a látássérült felhasználókat
Történelmi dokumentumok és újságok megőrzése, ugyanakkor kereshetővé tétele is
Adattovábbítás és számviteli programokba való átutalás (Példa: bevételek és számlák)
Indexelő dokumentumok a keresőmotorok számára
A vezető-rendszámtáblák felismerése sebességmérő kamerával és piros fényű fényképezőgép szoftverrel
Beszédszintetizátorok olyan emberek számára, akik nem tudnak beszélni - elméleti fizikus, Stephen Hawking talán a beszédszintetizáló program legelismertebb felhasználója

Miért használja az OCR-t?

Miért nem csak egy képet készítesz, ugye? Mert nem tudsz szerkeszteni semmit, vagy nem keresi a szöveget, mert csak egy kép lenne. A dokumentum beolvasása és az OCR szoftver futtatása a fájlt módosíthatja és kereshetővé teheti.

Az OCR története

Míg a legkorábbi szövegfelismerés 1914-re nyúlik vissza, az OCR-technológiák széles körben elterjedt fejlesztése és használata az 1950-es években komolyan kezdődött, különösen olyan egyszerűsített betűkészletek létrehozásával, amelyek könnyebben konvertálhatók a digitálisan olvasható szövegekké. Az első ilyen egyszerűsített betűkészletet David Shepard hozta létre, és az OCR-7B néven ismert. Az OCR-7B még ma is használatban van a pénzügyi ágazatban a hitelkártyákon és betéti kártyákon használt szabványos betűtípuson. Az 1960-as években a postai szolgáltatások számos országban elkezdték használni az OCR technológiát, hogy jelentősen felgyorsítsák az e-mailek válogatását, beleértve az Egyesült Államokat, Nagy-Britanniát, Kanadát és Németországot. Az OCR még mindig az a legfontosabb technológia, amellyel a postai küldeményeket világszerte rendezik. 2000-ben az OCR technológia korlátainak és lehetőségeinek kulcsfontosságú ismerete volt a CAPTCHA programok kifejlesztésére, amelyek a robotok és a spammerek megállítását szolgálják.

Az évtizedek során az OCR pontosabb és kifinomultabbá vált a kapcsolódó technológiai területeken, például a mesterséges intelligencia , a gépi tanulás és a számítógépes elképzelések terén. Ma az OCR szoftver a mintafelismerést, a funkciófelderítést és a szövegbányászatot használja a dokumentumok gyorsabb és pontosabb feldolgozására, mint valaha.

Mi az OCR?

Mi az OCR?

Miért használja az OCR-t?

Az OCR története

Alike posts

See Newest

Sapid posts