Optiese karakter herkenning (OCR) is die vertaling van opties geskandeerde bitmaps van gedrukte of geskrewe teks karakters in karakter kodes, soos ASCII. Dit is 'n doeltreffende manier om hard-kopie materiaal te omskep in data lêers wat kan verander word en andersins gemanipuleer op 'n rekenaar. Dit is die tegnologie wat gebruik word deur 'n lang biblioteke en regeringsagentskappe maak lang dokumente vinnig elektronies beskikbaar te stel. Vooruitgang in OCR-tegnologie het die toenemende gebruik aangespoor deur ondernemings. Vir baie dokument insette take, OCR is die mees koste-effektiewe en spoedige metode beskikbaar. En elke jaar, die tegnologie bevry hektaar van stoorplek keer gegee om oor te liasseerkabinette en bokse vol papier dokumente. Voordat OCR kan gebruik word, moet die bron materiaal geskandeer word met behulp van 'n optiese skandeerder (en soms 'n gespesialiseerde circuit board in die PC) te lees in die bladsy as 'n bitmap ('n patroon van kolletjies). Sagteware die beelde te erken word ook vereis.
Ons sagteware pakket stel die klassifikasie van geïsoleerde handgeskrewe karakters en syfers van die Uji Pen karakters Datastel gebruik van neurale netwerke op te los. Die data bestaan uit monsters van 26 karakters en 10 syfers geskryf deur 11 skrywers op 'n tablet PC. Die karakters (in die standaard UNIPEN formaat) is geskryf in beide die boonste en onderste geval en daar is 'n hele twee stel karakters per skrywer. So die uitset moet in een van die 35 klasse. Die uiteindelike doel is die bou van 'n skrywer onafhanklike model vir elke karakter.
Die keuse van waardevolle eienskappe is noodsaaklik in karakter erkenning, dus 'n nuwe en betekenisvolle stel van die funksies, die Uniform Differensiële genormaliseerde Coordinates (UDNC), wat deur C. Agell, aangeneem word. Hierdie eienskappe word getoon die erkenning koers met 'n eenvoudige klassifikasie algoritmes sodat hulle word gebruik om die trein 'n neurale netwerk en toets sy prestasie op Uji Pen karakters datastel te verbeter.
Indeks Terme:. Matlab, bron, kode, OCR, optiese karakter erkenning, geskandeer teks, geskrewe teks, ascii, geïsoleerde karakter
Vereistes :
Matlab
Kommentaar nie gevind