Come indicizzare un sito web

Come indicizzare un sito wordpress?

Come mai si farà ad indicizzare un sito web su Google? Dove posso trovare un professionista che può aiutarmi nell’indicizzazione del sito? Quanto mi può costare?

Rispondo subito a queste domande con tre risposte semplici:

  1. È più facile di quel che credi
  2. Non devi chiamare nessuno, lo puoi fare da solo
  3. È gratuito, se qualcuno vuol farti pagare questo servizio, stai lontano da lui

Detto questo, se se qui è perché vuoi saper come indicizzare un sito su Google, giusto?
probabilmente la tua domanda sarà ancora più precisa, cioè come indicizzare un sito wordpress.

L’indicizzazione di una pagina web è essenziale perché appaia in SERP (Search Engine Result Page) quando un utente digita una query pertinente su Google, ma sia chiaro, essere indicizzati non significa essere posizionati.

Per farti capire meglio vediamo come funziona Google ed i motori di ricerca in generale.

Come funziona Google?

La sottile differenza tra indicizzazione e posizionamento

Per capire perché è necessario indicizzare un sito web bisogna infatti capire almeno minimamente cos’è e come funziona un motore di ricerca.
I motori di ricerca sguinzagliano i loro bot (o spider, o crawler, in ogni caso sono dei software, quello di google si chaima Googlebot) per il web per intercettare nuovi siti o modifiche a siti esistenti, in modo da aggiornare continuamente l’indice del loro database che contiene una parte dei siti web del mondo (già, solo una parte).

Per semplicità, immaginate Google come una immensa biblioteca.

Il crawler di Google arriva al vostro sito, segue i link interni, scansiona i dati, li analizza, li usa per indicizzare le singole pagine per categorie e poi, solo poi, decide il posizionamento sulla serp in base a tutta una serie di fattori.

Hai capito ora la differenza tra indicizzazione e posizionamento?
Un conto è essere presente nell’indice del motore di ricerca, un conto è apparire tra le prime posizioni della SERP.
Una volta che un sito ha le pagine principali indicizzate bisogna poi lavorare di content strategy, scrivere articoli in ottica SEO, fare continuamente keyword research per scovare nuove nicchie dove poter infilarsi, ed ovviamente far si che le nuove pagine vengano continuante scansionate ed indicizzate dal motore di ricerca.

Posizionare un sito web comporta un analisi costante delle SERP, scrivere contenuti pertinenti e fare un ottima keyword research. Se non sai come fare leggi l’articolo dedicato a come fare keyword research

Indicizzare un sito wordpress: cosa significa che una pagina viene indicizzata per categorie?
Semplicissimo, e te lo spiego con un esempio:

Se il tuo sito wordpress tratta ricette, la pagina che tratta la ricetta “risotti con i funghi” può appartenere alla categoria “primi piatti“, ma anche alla categoria “risotti“, come alla categoria “ricette con i funghi“.
Per tornare alla biblioteca, uno stesso libro potrebbe finire su più scaffali di diverse categorie.

Cosa controlla google nelle mie pagine?

Alcune righe di codice in particolare:

  • Tag title (quello blu sulla serp)
  • Meta tag –> description, keywod, ecc.
  • Alt tag –> vedi articolo “come ottimizzare le immagini
  • Microdati
  • Tag H1
  • Opengraph, ecc.

Poi, ovviamente, i contenuti.
Inutile avere un sito ben costruito tecnicamente se non avete contenuti utili per gli utenti, la frase “content is king” è valida ancora oggi.

Indicizzazione su Google: regole base ed errori da non fare

Per poter indicizzare una pagina web su Google bisogna prima assicurarsi di aver seguito alcune regole basilari

Voglio fare un preambolo, cioè spiegare meglio cosa dovete fare PRIMA di indicizzare una pagina, e questo per due motivi principali:

  1. Per non indicizzare pagine inutili e dannose per il vostro sito (pagine vuote, di test, ecc.)
  2. Perché il web è già abbastanza pieno di spazzatura, non ti ci mettere anche tu.

L’indicizzazione sui motori di ricerca può sembrare una cosa banale, molti proprietari di siti web manco sanno cosa sia, altri la confondono con il posizionamento, la quale è ben altra cosa e l’ho spiegato poco fa.
Poi ci sono quelli che per non sbagliare propongono a Google qualsiasi cosa, dalle pagine di test a pagine vuote, passando per pagine di categoria, tag, archivi per nome e per data, ecc.

Diciamo più che altro che non sanno cosa sia la SEO, cosa significhi indicizzare una pagina, quali sono le implicazioni di una errata indicizzazione e cosa è bene controllare PRIMA di chiederne l’indicizzazione.

URL Seo friendly

L’URL di una pagina deve essere al contempo sintetico e sufficientemente descrittivo, così come lo devono essere il titolo H1 ed il tag title di pagina. A volte capita di trovare siti web con URL simili a questi:

  • https://www.nomesito.it/wp-content/uploads/2017/12/nomesito.it_Menu_2015.pdf
  • https://www.bibione.com/it/vendita/35443-condominio-xyz/
  • https://www.nomesito.com/it/article/v7m83j/pizzerie-al-trancio-città
  • http://www.nomesito.it/index.php/ct-menu-item-15/ct-menu-item-39

Ne ho presi 3 a caso dal web, ho cambiato i riferimenti reali ma lasciando gli errori palesi che vedete.
Quali errori?

Allora, il primo URL è un upload diretto di un PDF, con un po’ di sforzo si poteva renderlo un link più parlante, cioè più chiaro e semplice in modo che chi legge (Google e gli utenti)capisce subito su che pagina arriverà, ma soprattutto è un PDF, difficilmente posizionabile per vari motivi.

Ad esempio i PDF non sono mobile friendly, non sono pagine navigabili con menu e sono pagine che verrano scansionate dai motori di ricerca molto raramente perché si sa già in partenza che non verranno mai modificate.

Se poi guardate bene gli altri URL di esempio, capirete da soli che non sono “ben leggibili”.
Insomma, per capire se un URL può funziona basta solo usare il buon senso.

Pagine simili? Canonical!

Landing page, pagine di servizio simili, versioni AMP, tutto questo può portare a produrre pagine dai contenuti duplicati o molto simili, il che rende pericolosa l’indicizzazione.
Sia chiaro, ormai Google non “penalizza” nessuno per cose come questa, ma rischi seriamente che una delle pagine venga segnata come duplicata e quindi non indicizzata.

INDICIZZAZIONE SEO-pagina-duplicata-o-canonica

In questi casi, cioè di pagine simili ma che necessitano entrambe di essere indicizzate (landing per le Google Ads e pagine del sito, ad esempio), è utile e necessario rendere canonica (rel=canonical) la pagina che secondo voi è quella “ufficiale” per quell’argomento.

Se invece una delle due o più pagine non ha più senso di esistere (una vecchia landing, ad esempio), potete fare un bel redirect 301 alla pagina già dichiarata precedentemente come canonica.

Come dichiarare una pagina canonica?
per dichiarare la pagina web canonica a cui ci si riferisce, basta inserire una semplice riga di codice HTML nell’head della pagina

<link rel=”canonical” href=”URL-pagina-canonica/” />

Se poi avete WordPress un qualsiasi plugin SEO vi può aiutare.
Nel caso di Yoast andate in modifica pagina e in fondo, nella parte dedicata alla SEO on page trovate il menu avanzate dove poter impostare l’URL canonical:

Yoast-impostare-pagina-canonica
impostazione del rel=canonical con Yoast SEO

Usare correttamente il file robots.txt

Il file robots.txt è un semplicissimo file di testo che serve a dare alcune indicazioni ai bot dei motori di ricerca. In particolare è utile per indicare a Google il disallow (non ammettere) di determinate pagine ma anche per indicare la sitemap del sito (conviene indicarlo anche e soprattutto in Search Console).

Attenzione a come si usa il disallow, perché mi è capitato di trovare un sito web di un cliente con tutta la lingua inglese non indicizzata a causa di un errore sul file robots. Fortunatamente il sito andava totalmente rifatto.

Attenzione anche al fatto che il file robots è di dominio pubblico, quindi dovete sapere che chiunque potrebbe leggerlo. Se intendete usarlo per nascondere a Google e agli utenti delle pagine (es. l’area riservata ai clienti con login), sappiate che in realtà chiunque potrebbe arrivarci leggendo le vostre indicazioni.

indicazioni-mappa-cartelli

Sitemap

la Sitemap è un file in formato XML dove vengono inserite alcune info basilari sulle pagine, sui video e le immagini del sito, come ad esempio la data dell’ultima modifica, lingua, title, ecc., ma questo dipende dal metodo con cui viene costruita.

Più sitenticamente, la Sitemap serve per indicare a Google le pagine principali e più importanti del tuo sito, che non necessariamente devono essere tutte.

La Sitemap è sempre necessaria?
No, necessaria no, ma molto utile sicuramente si, perché se il sito ha un menu ben strutturato, la navigazione permette di raggiungere in profondità il sito, e tutte le pagine sono interconnesse tra loro tramite i link interni, allora i motori di ricerca riescono lo stesso a trovare le tue pagine e ad indicizzare i relativi contenuti.

la sitemap, però,come dice anche il nome riassume più velocemente la “mappa del sito”, permettendo una migliore e più semplice scansione del sito web da parte dei bot.
È un po’ come andare a Gardaland con o senza mappa del parco, sicuramente nell’arco della giornata lo esplori tutto, ma con la mappa fai molto prima e senza camminare a caso. Ecco, forse questo è proprio lo scopo principale della sitemap, cioè non far consumare inutilmente risorse a Google.

Inoltre, con la Sitemap dai una certa priorità (e periodicità) di scansione alla pagine in essa presenti.

Redirect 301 contro gli errori 404

Questo articolo è vecchio di 4 anni, sarebbe da aggiornare e porta pochi utenti, cancelliamolo”, ecco una tipica frase di un “manager” che non capisce molto di SEO, e questo per due motivi.

  1. Se l’articolo tratta un argomento evergreen ma necessita di aggiornamento, aggiornalo! Ti spiego meglio il concetto in questo altro mio articolo.
  2. Se cancelli un articolo o una pagina, crei in automatico un errore 404, cioè una pagina indicizzata ma inesistente.

A volte è utile e necessario potare un sito web da vecchie pagine o articoli inutili, ma in tal caso ricorda di fare sempre un redirect 301 (reindirizzamento definitivo) verso una pagina similare o al massimo verso l’home page.

Poi, dal momento che qualche disattenzione può sempre capitare, sarebbe il caso di creare anche una bella pagina 404 personalizzata, tipo questa di brandcrowd.com, ad esempio

pagina-404-divertente

Contenuti di qualità e tecnicamente curati

Google non indicizza tutto, questo perché anche “lui” non ha risorse infinite e vuole cercare di proporre solo contenuti validi, di qualità, non duplicati.

Cosa significa contenuti di qualità? semplice, che devi scrivere bene!
Una pagina ha senso di esistere (per Google) quando esprime un concetto e lo tratta in maniera completa, senza andare fuori tema, senza scrivere troppo solo per allungare il brodo, senza fare keyword stuffing (scrivere la keyword principale millemilavolte come 20 anni fa).

Insomma, argomenta bene il servizio che proponi, cerca di essere esaustivo nell’articolo che stai scrivendo, crea contenuti che diano risposte agli utenti (mettiti nei loro panni, cosa vorresti trovare in pagina?)

Per approfondire meglio questo tema, se vuoi capire come o cosa scrivere, leggiti questo mio articolo “come scrivere per il web“.

Una volta che hai preparato i contenuti li devi anche sistemare in maniera leggibile, con un layout ben studiato, e devi impostare bene:

  • Il titolo (H1)
  • Il title di pagina
  • la metadescription
  • l’URL (vedi inizio articolo)
  • Le immagini con nomi SEO friendly e ALT tag impostati
  • Una Table Of Content (TOC) se hai tante sezioni di pagina o paragrafi di articolo.

Come si indicizza una pagina web

Ci sono vari metodi per indicizzare correttamente una pagina web o un sito wordpress, vediamo brevemente quali sono i più usati:

  • Usare Google Search Console
  • Usare una sitemap
  • Plugin SEO o apposito

Indicizzare un sito con Google Search Console

Il primo e forse miglior metodo per indicizzare un sito è quello di registrarlo su Search Console (ex strumenti per webmaster).
La registrazione è molto facile, basta avere una gmail, andare alla pagina ufficiale del tool e registrare il proprio sito con uno dei metodi suggeriti da google stesso.

aggiungere-sito-GSC

Uno dei più semplici è quello di scaricare un piccolo file che google ti fornisce ed inserirlo via ftp nella cartella di installazione del tuo sito.
In tal modo google riconoscerà il dominio ed inizierà a tenerne conto da li in avanti.
Lo spider di Google, infatti, una volta scoperto il tuo sito farà una scansione iniziale per indicizzare il tuo sito, ma poi verrà a ritrovarti di tanto in tanto per verificare eventuali aggiornamenti.

Inoltre, nel caso tu abbia un blog, quando pubblichi un nuovo articolo puoi anche decidere di accelerare il processo dando in pasto alla Search Console il singolo URL attraverso “Controllo URL“.

Questa funzione di GSC è utile anche nel caso tu avessi pubblicato una nuova pagina (nuovo URL) e desideri dare una accelerata all’indicizzazione, senza aspettare che Google si svegli insomma. Basta che incolli sulla barra in alto di controllo URL la pagina che vuoi verificare e poi richiederne l’indicizzazione:

Indicizzare-URL-Search-Console

Se la pagina è nuova o comunque non ancora indicizzata troverai questo risultato:

Controllo-URL-GSC

Ti consiglio di fare anche un TESTA URL PUBBLICATO (in alto a sx) per verificare che effettivamente la pagina non abbia problemi e sia indicizzabile:

Test-URL-GSC

Search console serve solo ad indicizzare una pagina web? Nò, serve anche e sporattutto a monitorare la salute del sito web, scovare errori di scansione, verificare problemi nella versione mobile del sito,trovare i link esterni (backlink), vedere le query con cui gli utenti ti hanno cercato, il rendimento in termini di visualizzazioni e molto altro.

In Italia, anche se il 95% degli utenti usa google, non è una malsana idea quella di registrare il sito anche su Bing Webmaster Tool, la “search console di Bing”.

Indicizzare un sito con la sitemap

La sitemap è un file che contiene la mappa delle pagine (URL) che compongono un sito web, e serve per elencare al motore di ricerca la struttura organizzativa del sito web.
Solitamente una volta creata la si da in pasto alla Search Console per aiutare il crawler ad indicizzare prima le pagine.

Con la sitemap infatti si forniscono informazioni allo spider, o crawler, di Google, con gerarchie e correlazione tra le pagine evidenziate da un punteggio. Inoltre nelle ultime versioni c’è anche la data dell’ultimo aggiornamento di una pagina, utile in termine di posizionamento sfruttando i cosidetti “contenuti freschi”.

Esistono 2 tipi di sitemap:

  • sitemap.html
  • sitemap.xml

Oggi come oggi si usa principalmente la versione XML, ed è buona norma indicarla anche dentro al file robots.txt

Per creare una sitemap si possono usare vari metodi:

  • Con tool esterni: può andare bene se il sito è statico, ma una volta creata la dovrai caricare via ftp
    Puoi usare un servizio online come ad esempio www.xml-sitemaps.com oppure XML Sitemap Generator, o ancora usare dei software appositi come sitemap generator.
  • Con un plugin: praticamente tutti i CMS hanno la possibilità di caricare plugin per le più svariate esigenze, compresa quella di creare una sitemap, per cui è il miglior metodo per indicizzare correttamente le pagine di un sito wordpress.

Nel caso dei plugin, i più utilizzati sono i plugin “SEO”, cioè quelli che ti aiutano a tenere in ordine il sito implementando alcune regole di base SEO e ricordanti di editare titoli e metadescription per le pagine/articoli creati.
Tra i più famosi troviamo YOAST SEO.

Sitemap-con-yoast

Indicizzare un sito con le Api Indexing di Google

In questa sede farò solo un breve accenno alle Api Indexing di Google, in quanto ho creato una apposita guida pratica su come indicizzare le pagine di un sito con le Google Indexing API.

Mi limito qui a riprendere le stesse parole usate da Google qui:

L’API di indicizzazione è un’interfaccia che consente ai proprietari di siti di notificare a Google l’aggiunta o la rimozione di pagine. Ciò consente a Google di indicizzare istantaneamente qualsiasi pagina web.

Ecco, la parola che dovrebbe farvi drizzare le antenne è “istantaneamente”. Leggete la mia guida completa per installare le Api Indexing anche sul vostro sito web.

Come verificare l’indicizzazione di un sito web?

Bene, hai fatto tutto, hai collegato il sito a Search Console, hai anche creato ed inviato una sitemap, ma come faccio a capire se ha funzionato?
Per prima cosa te lo dice la stessa Search Console dopo pochi minuti che gli hai inviato la sitemap se l’ha elaborata o meno, e se guardi il rapporto ti dice anche quali pagine ha indicizzato.

In secondo luogo puoi fare una verifica manuale, cioè puoi controllare in serp quali pagine del tuo sito sono presenti nell’indice di Google.
Per farlo basta utilizzare l’operatore “site”, con il comando site:nomesito, come l’esempio in figura:

operatore-site

Errori di indicizzazione sito wordpress

Capita a volte che alcuni si chiedano come mai un sito non viene indicizzato in quanto non riescono a trovare in SERP le loro pagine.
Quasi mai però l’errore è da parte di Google, ma dipende da un settaggio mal impostato da qualche parte del nostro sito web, soprattutto se si tratta di wordpress.

Infatti in wordpress esiste un settaggio che dice “scoraggia i motori di ricerca“, ed è fatto apposta per quando si inizia a costruire un sito e non si vuole indicizzare prima che sia terminato. Ecco, capita che ci si dimentichi di togliere il flag e di fatto google “non vede” le pagine da indicizzare perché wordpress inserisce una riga di comando dentro al file robots.txt.

scoraggia-motori-wordpress

Categorie e tag di wordpress che non si indicizzano?

Può capitare poi che creiamo delle categorie e dei tag nel nostro sito web dividendo quindi gli articoli pubblicati secondo tassonomie ben precise, ma le pagine di categoria o dei tag non si indicizzano.
In questo caso potrebbe benissimo essere un errore di impostazione del plugin SEO che state usando, sia esso YOAST SEO, RANK MATH o altri.
Controllate bene sotto la voce “tassonomie” che non vi sia qualche spunta errata del tipo “non indicizzare le categorie”

indicizzare-categorie-wordpress

Non voglio indicizzare una pagina

Mettiamo caso che non vogliate indicizzare una pagina o una cartella ben definita del vostro sito web, ad esempio una pagina dove inserite documenti da far vedere solo ai vostri clienti con accesso tramite password, e relativi documenti salvati in cartella.

In tal caso dovete aggiungere la cartella che vi interessa non indicizzare al file robots.txt in questo modo:

robots-non-indicizzare

Se invece la vostra necessità è quella di non indicizzare una singola pagina web, allora non dovete usare il file robots (sconsigliato anche da Google) ma usare il tag noindex nell’head della pagina.

Conclusione

Per concludere l’articolo vediamo brevemente un riassunto dei suggerimenti utili a rispondere alla domanda:

come indicizzare un sito web?

  • Accedete alla Google Search Console e richiedete l'indicizzazione delle singole pagine attraverso il "controllo URL".
  • Sfruttate la Sitemap, che serve per indicare a Google quali sono le pagine (URL) che compongono il tuo sito.
  • Usare correttamente il file robots.txt.
  • Scrivete contenuti di qualità, utili e non scopiazzati (Google apprezza i contenuti originali).
  • Indicizzate il sito con le Api Indexing di Google.
  • Verificate le impostazioni di Wordpress (scoraggia i motori di ricerca).
  • Evitate di indicizzare i TAG (almeno all'inizio).

Ora che hai imparato come fare per indicizzare un sito web puoi provare a verificare se il tuo sito è a posto ed eventualmente correggere alcuni errori.

Se invece hai bisogno di un consulente SEO a Padova e Vicenza, contattami!
Valuteremo insieme le azioni da compiere per posizionarti sui motori di ricerca.