[Linuxtrent] Re: una domanda al giorno leva il bug di torno...

  • From: Flavio Stanchina <flavio@xxxxxxxxxxxxx>
  • To: linuxtrent@xxxxxxxxxxxxx
  • Date: Thu, 12 Oct 2006 18:31:05 +0200

Daniele Nicolodi wrote:
> [...] Da qualche anno si sta
> cercando di unificare tutti gli encoding esistenti in un unico encoding
> detto "unicode" ed in particolare nella sua rappresentazione binaria piÃ
> efficente detta "utf-8". Per informazioni http://www.unicode.org.

Cosà per fare il pignolo... ;)

La codifica UTF-8 à pià efficiente dell'Unicode puro, in termini di spazio
occupato, solo finchà trattiamo testo principalmente ASCII con qualche
carattere accentato -- tipicamente le lingue europee. Il primo livello di
codifica multibyte, nella forma "110xxxxx 10xxxxxx", contiene undici bit
utili quindi puà rappresentare al massimo 2048 caratteri: all'interno di
questo intervallo rientrano[1] gli alfabeti cirillico, armeno, ebreo, arabo,
siriano e Tahana (non ho idea di che cosa sia :), mentre tutti gli alfabeti
indiani, il cinese, il giapponese, tutti gli altri "disegnini" orientali ed
una serie di alfabeti pià o meno oscuri richiedono 3 byte o piÃ.

----------
1. vedere http://www.unicode.org/charts/lastresort.html

-- 
Ciao, Flavio
-- 
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: