On 19/03/2014 19:49, Lele Gaifax wrote: []
Inoltre non ho capito cosa intendi con "combinazione dei due caratteri UTF “a” e “`”, anziché il singolo carattere accentato “à”", o meglio come fai ad apprezzare la differenza.
Ciao, Vedi per esempio: http://en.wikipedia.org/wiki/Precomposed_character Un hd mostra il tutto: echo Å | hd; echo Å | hd 00000000 c3 85 73 74 72 c3 b6 0a |..str...| 00000008 00000000 c3 85 0a |...| 00000003 Per arrivare ad una rappresentazione canonica/normalizzata (sono più d’una o io non ho capito i dettagli...) si può usare in pipe: uconv -f utf-8 -t utf-8 -x '::nfkc;' Di più a: http://www.unicode.org/reports/tr15/ o man uconv Qualche implicazione di sicurezza: https://www.schneier.com/blog/archives/2005/02/unicode_url_hac_1.html Per altro tutte e due le rappresentazioni sono UTF, ed anch’io fatico a capire cosa *veramente* chieda la domanda iniziale. Buona serata, Daniele -- Per iscriversi (o disiscriversi), basta spedire un messaggio con OGGETTO "subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx