Uno dei problemi più comuni per gli sviluppatori consiste nella gestione dei cosiddetti caratteri speciali all’interno delle pagine web. Per quanto riguarda HTML, il problma è facilmente risolvibile mediante il ricoprso alle cosiddette entità… ma in Javascript come è possibile gestire accenti e caratteri speciali all’interno delle stringhe?
Lettere accentate e Javascript: facciamo un esempio
Supponiamo, ad esempio, di dover scrivere, all’interno di una variabile Javascript, la frase "Qual’è la tua città di nascita?", stringa che poi dovremo stampare a video con un classico document.write oppure all’interno di un alert o di una finestra generata mediante il metodo confirm o prompt.
Se provassimo semplicemente ad utilizzare un codice come questo all’interno di un documento HTML con encoding UTF-8, infatti, otterremo dei caratteri strani al posto delle nostre lettere accentate:
var str = "Qual'è la tua città di nascita?";
alert(str);
L’errore è dovuto, appunto, alla errata gestione delle lettere accentate nel contento del charset della pagina web. L’utilizzo delle entità HTML, ovviamente, non è risolutivo se si tratta di variabili plain text (all’interno di un alert, ad esempio, non può essere usato codice HTML). Come risolvere, quindi, il problema delle lettere accentate in Javascript?
Conversione in Unicode
Per risolvere il problema e gestire correttamente accenti e caratteri speciali in Javascript è necessario ricorrere alla conversione dei caratteri in formato Unicode. Ad esempio la lattera accentata è deve essere sostituita con la seguente sequenza di caratteri \u00E8, mentre la lettera à deve essere sostituita con \u00E0. Alla luce di quanto appena detto possiamo rivedere il nostro codice d’esempio in questo modo:
var str = "Qual'\u00E8 la tua citt\u00E0 di nascita?";
alert(str);
Prova il codiceSe proviamo ad eseguire questo codice otterremo, differentemente dall’esempio precedente, un alert con un testo ben formattato.
Lettere accentate in formato Unicode
Di seguito una semplice tabella con l’elenco delle lettere accentate utilizzate più di frequente nella lingua italiana e delle rispettive rappresentazioni Unicode:
Accenti gravi
Carattere | Unicode |
---|---|
à | \u00E0 |
è | \u00E8 |
ì | \u00EC |
ò | \u00F2 |
ù | \u00F9 |
Accenti acuti
Carattere | Unicode |
---|---|
á | \u00E1 |
é | \u00E9 |
í | \u00ED |
ó | \u00F3 |
ú | \u00FA |
Per convertire facilmente un testo contenente caratteri speciali ed accenti in Unicode, infine, vi invito ad utilizzare questo utilissimo strumento disponibile all’interno della nostra raccolta su Toolset.it