Sitemap: impara ora a crearla e a inviarla a Google

Google non sempre è in grado di trovare tutte le pagine del tuo sito web, per questo esistono le Sitemap, delle vere e proprie mappe che elencano tutte le url del tuo sito web.

Cos’è una Sitemap?

Una sitemap, una mappa del sito, non è altro che una pagina web che contiene tutte le pagine di un sito web, particolarmente importante per i crawler dei motori di ricerca.

Tutte le pagine che vuoi far indicizzare a Google dovrebbero essere contenute in una sitemap.

Quali sono i formati in cui creare una Sitemap?

Se parliamo di Google, possiamo usare 3 diversi tipi di formati per creare le nostre sitemap:

  • XML
  • TESTO
  • RSS, mRSS e Atom 1.0

In qualsiasi caso è necessario utilizzare il formato Standard che potete trovare in www.sitemaps.org, limitandosi ad un massimo di 50 MB e di 50.000 url per ciascuna Sitemap. Questo limite è facilmente superabile utilizzando una sitemap index con all’interno più sitemap.

Sitemap XML

Questo è il formato più comune in cui troverete le sitemap e proprio quello di cui parleremo oggi. Generalmente le sitemap xml sono strutturate così:

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

  <url>

    <loc>http://www.example.com/foo.html</loc>

    <lastmod>2018-06-04</lastmod>

  </url>

</urlset>

Ma cosa significa tutto questo? Ora lo vedremo assieme riga per riga.

<?xml version=”1.0″ encoding=”UTF-8″?>

Questa prima riga comunica che si tratta di un file XML, la versione e il codice di codifica utilizzato.

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9“>

Qui diciamo allo spider qual è il protocollo che stiamo utilizzando, lo standard Sitemap 0.90, supportato da Google, Yahoo!, Microsoft e molti altri motori di ricerca.

<url>

    <loc>http://www.example.com/foo.html</loc>

    <lastmod>2018-06-04</lastmod>

</url>

 

Ora veniamo alle pagine del sito, per ogni url è necessario il tag parent e si deve specificare la location del’URL in un nested tag <loc>.

Inoltre si possono aggiungere delle proprietà opzionali come:

<lastmod>2018-06-04</lastmod>

Specifica la data in cui il file è stato modificato l’ultima volta, ma questi sembrano essere ignorati da Google.

A cosa serve una Sitemap XML?

Grazie alla sitemap possiamo comunicare correttamente quali sono le pagine del nostro sito che vogliamo vengano indicizzate. Se non le inseriamo in questo elenco è possibile che non vengano raggiunte dai motori di ricerca e quindi nemmeno indicizzate.

Come creare una sitemap XML?

Il metodo più semplice è quando il CMS o un plugin crea dinamicamente la sitemap, questo perché ogni volta che ci sarà un aggiornamento le url verranno modificate automaticamente.

Se oggi ad esempio eliminate una pagina dal sito web, questa verrà automaticamente rimossa dall’elenco delle url presenti nella sitemap xml. Se questa però non è dinamica dovrete essere voi a modificare manualmente l’elenco.

Se il vostro CMS non ve lo permette dovrete necessariamente creare la sitemap manualmente.

Se il vostro sito non ha molte pagine potete semplicemente aprire un editor di testo e seguire le indicazioni sopracitate. In alternativa potete servirvi di uno strumento di scansione come Screaming Frog per recuperare tutte le pagine del vostro sito ed esportare una sitemap completa.

Inviare la sitemap a Google?

Si avete capito bene, una volta raccolte tutte le pagine indicizzabili del vostro sito web e compilato la sitemap, potete inviarla direttamente a Google tramite la Google Search Console.

Nella barra laterale troverete Indice > Sitemap > Aggiungi una nuova Sitemap > Invia

Per rendere ulteriormente semplice a Google trovare la tua sitemap ti suggeriamo anche di aggiungere l’indirizzo della sitemap xml alla fine del tuo file robots.txt.

Un altro metodo è lo strumento di ping. Puoi inviare una richiesta GET nel browser a questo indirizzo, inserendo l’URL completo della Sitemap. Ad esempio:

https://www.google.com/ping?sitemap=https://example.com/sitemap.xml

Quali sono le differenze in una Sitemap XML per e-commerce?

Quando parliamo di ottimizzazioni SEO per e-commerce ci sono sempre delle accortezze in più rispetto agli altri siti web, quindi è logico chiedersi se anche nel caso delle sitemap xml ci siano delle differenze. In realtà no, anche se si tratta di e-commerce la procedura di creazione e invio è la medesima.

Sitemap per contenuti multimediali

È possibile creare le sitemap anche per i tipi di contenuti multimediali come file video, immagini e altri contenuti del tuo sito difficili da analizzare, così da facilitarne l’indicizzazione.

Puoi creare una Sitemap dedicata solo per i video, oppure inserire i tag all’interno di una Sitemap esistente. La struttura dovrà essere:

<url>

  <!– URL of the host page –>

  <loc>https://example.com/mypage</loc>

  <!– Information about video 1, like the title and URL for the video’s media file –>

  <video:video>

    <video:title>Grilling steaks for summer</video:title>

    <video:content_loc>

      http://streamserver.example.com/video123.mp4</video:content_loc>

  </video:video>

  <!– As many additional <video> entries as you need –>

  <video></video>

</url>

 

Facciamo un veloce riepilogo delle caratteristiche che deve avere la tua Sitemap:

  • Inserisci solo URL canonici;
  • Non includere ID sessione di URL contenuti nella tua Sitemap;
  • Puoi segnalare la presenza di versioni in altre lingue di un URL usando le annotazioni hreflang;
  • Utilizza la codifica UTF-8;
  • Gli URL devono contenere i caratteri di escape appropriati;
  • Utilizza solo caratteri non alfanumerici e non latini.
  • Suddividi le Sitemap di grandi dimensioni in più Sitemap;
  • Crea Sitemap dedicate per indirizzare contenuti multimediali come video, immagini e notizie;
  • Non è necessario usare i valori <priority> e <changefreq>.
  • La posizione di un URL in una Sitemap non è importante

Infine ricordiamo che le Sitemap sono solo un consiglio relativo alle pagine che ritieni importanti; Google non garantisce la scansione di ogni URL presente.

Fissa un appuntamento