Laboratorio Informatico Web DW3

Il mio blog contiene ricerche sulla progettazione di siti WEB usabili e accessibili

Monday, February 20, 2006

Unicode (UTF-8)

ISO
ISO è una sigla che sta per International Standard Organization, quindi Organizzazione Internazionale per la Standardizzazione. Fu istituita nel 1947 a Ginevra. Composto da rappresentanti di organi nazionali, è un organismo per la definizione degli standard industriali e commerciali a livello mondiale, al fine di favorire il commercio di beni e servizi, sviluppando la standardizzazione nel mondo. I partecipanti comprendono un organismo di standardizzazione per ogni paese membro e per le principali corporazioni. Inoltre l’ISO collabora con la IEC, Commissione Elettronica Internazionale, responsabile per la standardizzazione degli equipaggiamenti elettrici. Gli standard ISO sono numerati, e hanno un formato del tipo "ISO 99999:yyyy: Titolo" dove "99999" è il numero dello standard, "yyyy" è l'anno di pubblicazione, e "Titolo" descrive l'oggetto. Per esempio tutti i computer con lettori CD-ROM e DVD-ROM usano l’estensione ISO per indicare il filesystem standard ISO 9660.
UNICODE
Unicode è un sistema di codifica utilizzato per rappresentare i caratteri di tutti i differenti linguaggi del mondo. È un set di caratteri completo che fornisce un numero univoco (una combinazione di bit) per ogni carattere indipendentemente dalla piattaforma, dal programma e dal linguaggio utilizzato. Ogni numero di 2 byte rappresenta un unico carattere, dunque un numero per carattere ed esattamente un carattere per numero.
Unicode, basandosi sulla precedente codifica ASCII che consentiva la rappresentazione di 256 caratteri sufficiente per gli alfabeti dell’Europa Occidentale e del Nord America, va molto oltre; codifica i caratteri usati in tutte le lingue vive e in alcune lingue morte. Comunque bisogna specificare che Unicode non riesce ancora a rappresentare tutti i caratteri esistenti al mondo, anche se si pensa che in futuro arriverà a coprirli tutti. Unicode si basa su una codifica a 16 bit che da la possibilità di codificare 65.536 caratteri coprendo i principali caratteri impiegati nelle principali lingue del mondo.
Adesso lo standard Unicode si è ulteriormente evoluto, infatti supporta tre forme di codifica che condividono un repertorio comune di caratteri ma possono essere estese fino a rappresentarne circa un milione.
Questi formati vengono chiamati UTF, che sta per Unicode Transformation Formats, e possono essere a 8, 16 o 32 bit. L’UTF è dunque un sistema per mappare i caratteri definiti nella codifica Unicode in cifre binarie di lunghezza fissa.
L’UTF-8 usa 1 byte per tutti i caratteri ASCII, 2 per i caratteri ISO Latin-1, 3 o 4 o 5 o 6 byte per gli alfabeti orientali.Utilizzando dunque UTF-8 si possono avere nella stessa pagina più lingue.
L'Unicode viene supportato dai moderni standard della programmazione, del markup come XML, XHTML e HTML 4.0, Java, JavaScript e da vari sistemi operativi.
SITI DI RIFERIMENTO

0 Comments:

Post a Comment

<< Home