[successivo] [precedente] [inizio] [fine] [indice generale] [indice ridotto] [indice analitico] [volume] [parte]


Capitolo 418.   Programmi informativi sulla codifica

Alcuni programmi sono importanti per avere sotto mano, rapidamente, informazioni utili su alcune codifiche, o su qualche carattere particolare.

418.1   Utilizzo di «ascii»

Il programma ascii (1) consente di ottenere facilmente informazioni su un certo carattere appartenente alla codifica ASCII, ovvero ai primi 127 punti di codifica.

ascii [opzioni] [carattere]...

Generalmente, si utilizza il programma specificando nella riga di comando uno o più caratteri, di cui si vogliono maggiori informazioni. I caratteri possono essere indicati letteralmente (ammesso che ciò sia possibile), oppure attraverso una forma alternativa, purché sia stata prevista.

Tabella 418.1. Alcune modalità con cui si può indicare un carattere nella riga di comando.

Forma Descrizione
x
Se possibile, il carattere può essere indicato in forma letterale.
^x
La maggior parte dei caratteri di controllo può essere specificata secondo la forma ^x.
\x
Alcuni caratteri di controllo possono essere rappresentati in questo modo, che si rifà alle convenzioni del linguaggio C.
nome
I caratteri di controllo possono essere indicati per nome.
0xn
xn
\xn
Si tratta di forme equivalenti per indicare il punto di codifica del carattere in esadecimale.
0dn
dn
\dn
Si tratta di forme equivalenti per indicare il punto di codifica del carattere in decimale.
0on
on
\on
Si tratta di forme equivalenti per indicare il punto di codifica del carattere in ottale.
0bn
bn
\bn
Si tratta di forme equivalenti per indicare il punto di codifica del carattere in binario.

Le opzioni della riga di comando non vengono descritte; si veda eventualmente la pagina di manuale ascii(1). Vengono mostrati alcuni esempi.

418.2   Utilizzo di «unicode»

Il programma unicode (2) consente di ottenere facilmente informazioni su un certo carattere, secondo la classificazione della codifica universale.

unicode [opzioni] [carattere_o_stringa]...

Gli argomenti finali della riga di comando possono essere caratteri singoli, oppure stringhe; l'indicazione di una stringa implica la richiesta di avere informazioni su tutti i caratteri che contiene. I caratteri cercati possono essere indicati letteralmente, oppure attraverso altre forme, come documentato nella pagina di manuale unicode(1), ma generalmente conviene limitarsi all'uso della notazione tipica per Unicode: U+n, dove n è un numero del punto di codifica espresso in esadecimale.

Tabella 418.7. Alcune modalità con cui si possono indicare i caratteri nella riga di comando.

Forma Descrizione
x
Se possibile, il carattere può essere indicato in forma letterale.
U+n
n
Rappresenta il punto di codifica in esadecimale.
U+n..U+m
n..m
Rappresenta un intervallo di punti di codifica e si usa per ottenere la tabella dei codici relativi.

Sono disponibili delle opzioni, che generalmente non è necessario utilizzare; eventualmente si può consultare la pagina di manuale unicode(1). Vengono mostrati alcuni esempi.

418.3   Gucharmap

Attraverso il sistema grafico X è possibile utilizzare Gucharmap, (3) con il quale si ottengono informazioni sui codici dei caratteri, secondo la codifica universale, in modo pratico.

gucharmap

Il programma gucharmap si avvia senza opzioni particolari e si interagisce con lui, attraverso un'interfaccia grafica.

Figura 418.11. Gucharmap con la selezione del punto di codifica U+0D24.

malayalam ta

Figura 418.12. Gucharmap con le informazioni dettagliate del punto di codifica U+0D24.

malayalam ta

Una volta selezionato il gruppo di codici di proprio interesse, è facile copiare i caratteri desiderati trascinandoli nella riga di testo che appare nella parte inferiore della finestra, come si vede nella figura 418.13. Da lì è poi possibile copiarli nell'applicazione di proprio interesse, utilizzando i metodi consueti per le operazioni di «taglia-copia-incolla».

Figura 418.13. Copia di alcuni caratteri nella riga inferiore.

malayalam text

I caratteri della codifica universale possono essere classificati in base alla scrittura (script), oppure in base ai blocchi utilizzati nella codifica stessa. La figura 418.14 mostra una porzione del blocco cirillico (da U+0400 a U+04FF).

Figura 418.14. Classificazione dei codici secondo i blocchi della codifica universale.

U+0400..U+04FF

Appunti di informatica libera 2007.02 --- Copyright © 2000-2007 Daniele Giacomini -- <daniele (ad) swlibero·org>


1) Ascii   GNU GPL

2) Unicode   GNU GPL

3) Gucharmap   GNU GPL


Dovrebbe essere possibile fare riferimento a questa pagina anche con il nome programmi_informativi_sulla_codifica.htm

[successivo] [precedente] [inizio] [fine] [indice generale] [indice ridotto] [indice analitico]

Valid ISO-HTML!

CSS validator!