Istilah Unicode mengacu pada sistem karakter standar yang dibuat untuk memudahkan penanganan komputasi, visualisasi dan transmisi tulisan dari berbagai bahasa dan disiplin teknis, tetapi juga mencakup teks klasik dari bahasa yang sudah mati. Dengan kata lain, dan dengan cara yang lebih spesifik, Unicode adalah format karakter umum, yang berisi setiap karakter keyboard dari sebuah komputer. Menurut apa yang dikemukakan, istilah tersebut berasal dari tiga tujuan yang dikejar yaitu universalitas, keunikan dan keseragaman.
Unicode secara khusus menyediakan nomor unik untuk setiap karakter, tanpa implikasi platform, bahasa, program, yang memfasilitasi transfer antara sistem dan platform pengkodean yang berbeda. Seperti yang Anda lihat , Unicode tidak hanya mencakup huruf, tetapi ada juga simbol, angka, dan lainnya.
Pengkodean karakter mendefinisikan tabel yang mewakili karakter sebagai angka. Setiap karakter dikaitkan dengan angka. Di Unicode, nomor ini disebut titik kode. Pendahulu Unicode dikenal sebagai "ASCII", dengan perbedaan bahwa yang terakhir hanya menyertakan karakter yang digunakan dalam bahasa Inggris.
Standar tersebut didukung oleh akronim UTC untuk Komite Teknis Unicode, terintegrasi ke dalam Unicode Consortium, sebuah organisasi nirlaba, di mana perusahaan besar dan terkenal seperti Apple, Microsoft, Google, Yahoo, Adobe menjadi bagian dengan tingkat implikasi yang berbeda. , IBM, SAP, Oracle, atau entitas seperti Universitas Berkeley yang bergengsi serta para profesional dan akademisi. Konsorsium Unicode memelihara hubungan yang sangat erat dengan ISO / IEC, yang sejak 1991 telah memiliki perjanjian untuk menyinkronkan standarnya yang berisi karakter dan poin kode yang sama.