OCR adalah pengenalan karakter optik atau juga dikenal dalam bahasa Spanyol sebagai pengenalan karakter optik. OCR adalah perangkat lunak yang memungkinkan pengenalan teks, menghasilkan gambar untuk mengubahnya menjadi serangkaian karakter, dan kemudian menyimpannya dalam format tertentu yang dapat digunakan dalam program pengeditan teks tersebut. Dengan kata lain, berkat teknologi baru ini, semua jenis teks atau dokumen, termasuk file PDF, kertas yang dipindai, atau bahkan gambar yang diambil dari kamera digital, dapat diubah menjadi data agar dapat diedit.
Perangkat lunak ini bekerja sebagai berikut, pertama menganalisis setiap bagian dari gambar dokumen yang bersangkutan; mendistribusikan halaman dalam potongan-potongan seperti tabel, gambar, blok teks antara lain; kemudian garis-garis tersebut didistribusikan dalam kata-kata untuk kemudian menjadi karakter; dan karena karakter telah ditunjukkan, perangkat lunak membuat perbandingan dengan sekelompok gambar pola. Kemajuan ini sesuai dengan rangkaian hipotesis tentang apa itu masing-masing karakter; dan berdasarkan hipotesis ini, ia menganalisis varian yang berbeda dari memecah baris menjadi kata dan kata menjadi karakter. Dan setelah sejumlah besar analisis dan pemrosesan hipotesis, program akhirnya menyajikan teks yang sudah dikenali dan diubah dengan format baru..
Perlu dicatat bahwa saat ini terdapat serangkaian program yang ditawarkan pasar komputer berbasis OCR seperti OmniPage, Abbyy Fine Reader atau READiris. YY yang memiliki kemampuan, tidak hanya menganalisis dan mengenali teks itu sendiri, tetapi juga mengenali format dan gayanya, tetapi dengan keterbatasan tertentu, sehingga mengharuskan teks tersebut setelah dianalisis diedit untuk melakukan penyesuaian yang diperlukan. memerlukan.