[Linuxtrent] Re: ottenere da file .tex PDF con caratteri *veramente* UTF

  • From: Daniele Pizzolli <ors@xxxxxxxx>
  • To: linuxtrent@xxxxxxxxxxxxx
  • Date: Wed, 19 Mar 2014 22:48:10 +0100

On 19/03/2014 19:49, Lele Gaifax wrote:

[]

Inoltre non ho capito cosa intendi con "combinazione dei due caratteri
UTF “a” e “`”, anziché il singolo carattere accentato “à”", o meglio
come fai ad apprezzare la differenza.

Ciao,

Vedi per esempio:
http://en.wikipedia.org/wiki/Precomposed_character

Un hd mostra il tutto:

echo Å | hd; echo Å | hd
00000000  c3 85 73 74 72 c3 b6 0a                           |..str...|
00000008
00000000  c3 85 0a                                          |...|
00000003

Per arrivare ad una rappresentazione canonica/normalizzata (sono più
d’una o io non ho capito i dettagli...)  si può usare in pipe:

uconv -f utf-8 -t utf-8 -x '::nfkc;'

Di più a: http://www.unicode.org/reports/tr15/ o man uconv

Qualche implicazione di sicurezza:

https://www.schneier.com/blog/archives/2005/02/unicode_url_hac_1.html


Per altro tutte e due le rappresentazioni sono UTF, ed anch’io fatico
a capire cosa *veramente* chieda la domanda iniziale.

Buona serata,
Daniele
--
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: