Magazine

Caratteri speciali e problemi negli URL

30/06/2020
Caratteri speciali e problemi negli URL
PartnerPMIProfessionisti
Da tempo si discute se l’inserimento dei caratteri speciali nelle URL possa dare o meno problemi di visualizzazione o di posizionamento di una pagina web.
Nella maggior parte dei casi gli esperti del settore si sono mostrati poco favorevoli all’utilizzo di caratteri non ASCII all’interno di una URL che dovrebbe essere quanto più possibile breve e diretta.
Il Codice ASCII (pronunciato ASKI) acronimo di American Standard Code for Information Interchange (Standard americano per lo scambio di informazioni) è la rappresentazione numerica di un carattere che rende possibile trasferire dati da un computer ad un altro.
Inizialmente era un codice a 7 bit e codificava 128 caratteri a cui successivamente è stato aggiunto un bit, che ha reso possibile codificare 256 caratteri.

Perché evitare caratteri speciali

URL è l’acronimo di Uniform Resource Locator, in pratica si tratta di una sequenza di caratteri alfanumerici che identifica in modo univoco l’indirizzo di una risorsa presente on line. Detto in altri termini l’URL è l’elemento che consente a un sito web di essere raggiungibile attraverso un browser.
Un URL quindi è una risorsa con un doppio intento comunicativo, se da un lato descrivendo sinteticamente il contenuto della pagina riesce a dare subito informazioni utili all’utente, dall’altro può portare vantaggi anche indirettamente per quanto riguarda il posizionamento organico sui motori di ricerca.
Di conseguenza un URL dovrebbe evitare l’utilizzo di caratteri speciali in quanto lo renderebbero poco chiaro e non sempre facile da ricordare. Per caratteri speciali si intendono tutti quei caratteri che non sono né lettere né numeri, per esempio i simboli della punteggiatura o i segni matematici.
Per esempio negli URL le parole sono divise da un trattino:

www.nomesito.it/perchè-evitare-caratteri-speciali

Se al posto del trattino nello stesso URL viene inserito un carattere non ASCII come ad esempio uno spazio, la visualizzazione apparirà confusa e poco comprensibile in quanto i caratteri non ASCII verranno spesso sostituiti da un altro simbolo come %20.
Ad esempio:

www.nomesito.it/perché%20evitare%20caratteri%20speciali

Va da sé che nel secondo caso l’indirizzo oltre che apparire illeggibile è decisamente difficile da scrivere e ricordare.
Per evitare che l’URL del sito venga visualizzato in questo modo è sufficiente mettere un po’ di attenzione nella sua realizzazione evitando di inserire spazi, segni di punteggiatura o altri simboli che potrebbero dare problemi.

CMS e caratteri speciali

I CMS, come WordPress, ormai sono tra i più utilizzati per la creazione e la gestione di un sito web anche da persone meno esperte. (Se vuoi approfondire tematiche legate a WordPress, seguendo questo link trovi la categoria del Magazine dedicata al CMS)

Proprio per rendere le cose più semplici anche a chi vuole muovere i primi passi nel web, i CMS sono in grado di decodificare senza alcun problema anche i caratteri non ASCII ad esempio eliminando l’apostrofo e sostituendo lo spazio con il trattino.
In questo modo anche chi è alle prime armi avrà un blog con URL chiari e leggibili.

Caratteri speciali e problemi tecnici

Ad ogni modo, sebbene oggi sia tutto più facile, cerca sempre di evitare caratteri anomali come apostrofi, apici, lettere accentate, simboli come quello del marchio registrato e via dicendo, perché il problema degli url contenenti questi caratteri non riguarda solo la difficoltà di memorizzazione dell’indirizzo, ma può comportare serie difficoltà di visualizzazione della risorsa che ad esso è collegata. Sul versante legato al codice, possono esserci problemi quando si utilizzano caratteri non ASCII in url serviti come percorsi relativi e non assoluti. I percorsi relativi sono quelli che stampano nel codice il solo URI, cioè l’indirizzo limitatamente a ciò che esiste dopo lo slash successivo all’estensione. In questo caso addirittura gli spider di Google possono ricomporre percorsi diversi e sbagliati e mandare un link interno in errore 404, da pagina non trovata.

In conclusione ricorda sempre che indipendentemente dagli aspetti trattati fin qui, esistono sempre tre elementi per i quali deve passare un URL: un sistema operativo, un browser e un device. Evitare i caratteri speciali è uno dei criteri di base che favoriscono la portabilità di una risorsa web che deve poter essere richiamata sempre in modo corretto nell’intersezione tra altri software e/o hardware con caratteristiche diverse.

E la faccenda si complica, quindi meglio non correre rischi.