Indicizzare un sito e-commerce consiste nell’effettuare una serie di operazioni relativamente semplici; nonostante ciò capita che alcuni passaggi fondamentali vengano talvolta trascurati. Per questo motivo, può succedere che alcune pagine del tuo sito non siano prontamente rilevate dai motori di ricerca o che vengano valutate negativamente dagli stessi. La conseguenza? Non le ritrovi nei risultati di Google.
Vediamo, dunque, quali sono gli step da seguire per indicizzare un e-commerce nel modo giusto, ma prima spieghiamo brevemente che cosa significa indicizzare un sito.
Contenuto
Cosa significa indicizzare un sito web
Ogni giorno Google riceve miliardi di “domande” da parte degli utenti del web. Per rispondere a queste domande, Google utilizza dei bot chiamati “Web Crawler” o “Spider”. I crawler scansionano l’intero archivio di Google, l’indice di ricerca, scegliendo le pagine web che rispondono meglio alle esigenze degli utenti e presentandole nella pagina dei risultati di ricerca (SERP) in ordine decrescente di pertinenza e qualità, secondo una valutazione fatta dal complesso algoritmo di Google. Bisogna fare attenzione, quindi, a non confondere il termine “indicizzazione” con il termine “posizionamento”.
Indicizzare un sito web, e nello specifico un e-commerce, significa semplicemente che Google viene a conoscenza dell’esistenza di un sito, una pagina o un contenuto web, e lo inserisce nel suo enorme archivio, definito indice, appunto.
Posizionare un sito web, invece, significa porre in essere una serie di azioni volte ad ottimizzare un contenuto affinché l’algoritmo di Google lo valuti positivamente rispetto ad una query digitata dagli utenti, e lo mostri più in alto nella SERP rispetto a quelli dei competitor che trattano lo stesso argomento o vendono il medesimo prodotto. È di questo che si occupa un’agenzia SEO specializzata nel posizionamento di siti web.
Come indicizzare un sito web
È importante dire in primo luogo che l’indicizzazione può essere un processo automatico, che avviene anche senza che siano compiute azioni dai proprietari di siti internet.
Nonostante ciò si può agevolare e velocizzare questo processo grazie ad alcuni accorgimenti. Primo tra tutti è l’utilizzo dello strumento Search Console di Google. In Search Console è possibile aggiungere il proprio sito, scegliendo tra due tipi di proprietà: “dominio” e “prefisso URL”.
Collegare Search Console comunque non è tutto. Una volta completato l’accesso a questo strumento bisogna inviare, nella sezione dedicata, la sitemap del tuo sito, che devi aver preventivamente creato.
Ma quanto tempo ci vuole affinché Google indicizzi un sito? Di solito, una volta aggiunto il dominio su Search Console e inviata la sitemap, il sito sarà effettivamente indicizzato nel giro di qualche giorno.
Search Console offre inoltre un’altra grande possibilità: partire dall’indicizzazione di una singola pagina, ad esempio la Home, e lasciare che Google scopra tutte le altre di conseguenza, seguendo i link interni del sito web.
Indicizzare una singola pagina web
Quando si crea una nuova pagina sul sito c’è quindi sempre la possibilità di segnalarne l’esistenza a Google, tramite Search Console, per essere sicuri che venga indicizzata nel più breve tempo possibile.
Per indicizzare una nuova pagina web basta accedere allo strumento Search Console di Google e incollare l’URL della pagina nella “barra di controllo” in alto.
Una volta premuto “invio”, qualora dovesse essere segnalata l’assenza di quella pagina dall’indice di Google, si potrà cliccare su “richiesta di indicizzazione” per velocizzare la procedura.
Come sapere se il sito è già indicizzato
Verificare se un sito web è già stato indicizzato è molto facile. Lo si può fare in diversi modi. Uno è quello che abbiamo appena visto, ovvero il controllo manuale in Search Console.
In alternativa si puà digitare nella barra di ricerca di Google il comando “site:” seguito dall’URL del sito; il motore di ricerca indicherà il numero di pagine di quel dominio che sono state inserite in indice e le mostrerà in SERP.
Ad esempio, digitando “site:biquadroagency.it” vediamo che Google riporta 136 risultati (pagine indicizzate).
Seguendo lo stesso procedimento, si può verificare l’indicizzazione di una singola pagina (inserendo l’URL della specifica pagina).
Se delle pagine non risultano indicizzate nonostante sia stata effettuata la richiesta su Search Console, potrebbero esserci delle problematiche da risolvere. Alcune pagine, ad esempio, potrebbero essere bloccate erroneamente dal file robots.txt, oppure potrebbero presentare i Meta Tag NoIndex, NoFollow, con i quali si chiede esplicitamente al motore di ricerca di non indicizzare un determinato contenuto.
Entrambi i casi sono abbastanza semplici da risolvere. Il segreto è saper individuare l’esistenza del problema e avere un minimo di dimestichezza con il codice sorgente per agire direttamente nella modifica.
Attenzione, non è detto che queste impostazioni siano da considerare errori. Talvolta, quella di bloccare la scansione (e quindi l’indicizzazione) di determinate pagine è una vera e propria scelta, soprattutto nel caso di siti eCommerce che, ad esempio, prevedono pagine duplicate o sezioni del sito “private”, da non mostrare su Google.
Vediamo come fare.
E-commerce: Sitemap e Robots.txt
Prima di indicizzare un sito, è importante verificare che la Sitemap e il file Robots.txt siano stati impostati correttamente. Se si è già effettuata l’indicizzazione è comunque meglio effettuare questa verifica e, nel caso, apportare le necessarie modifiche. Ma cosa sono la Sitemap e il Robots.txt?
La Sitemap è un documento XML che contiene una lista di tutte le pagine del sito web, quindi una vera e propria “mappa del sito”, appunto. Solitamente, questa mappa viene generata automaticamente e puoi verificarne l’esistenza digitando su Google il dominio del tuo sito seguito da “/sitemap.xml”. Anche senza una sitemap, Google scansionerà comunque il sito, ma per un e-commerce (dato il numero di pagine più elevato rispetto ad un normale sito web) o un sito web nuovo, questa risulta essere molto utile.
Per creare una sitemap si possono utilizzare editor di testo normali oppure software specifici, nonché alcuni generatori di sitemap disponibili online. In ogni caso, è meglio che sia un professionista ad occuparsene, per evitare che la mappa non escluda pagine importanti del sito o che ci siano, al contrario, pagine che è meglio non indicizzare. Soprattutto per un e-commerce è importante che le pagine siano inserite correttamente e organizzate in modo gerarchico e ordinato in diverse cartelle. Una mappa ordinata dell’e-commerce può fare la differenza, rendendo più brevi i tempi di scansione e indicizzazione e aiutando i crawler di Google a capire come è organizzato il sito e quali pagine sono più importanti.
Una volta creata, la sitemap va aggiunta al file robots.txt e inviata a Search Console.
Inserire, se possibile, lo screenshot della sitemap di uno dei vostri clienti ecommerce. Lascio a voi la scelta
Il file Robots.txt è invece un file di testo che fornisce delle direttive agli spider di Google, indicando loro quali sono i contenuti che possono leggere e scansionare e quali no. Ad esempio, può essere utilizzato per bloccare la scansione di cartelle che contengono file sensibili o riservati, così che non vengano indicizzati da Google con il rischio che diventino accessibili a chiunque sul web.
Per gli e-commerce è probabile che si decida di creare, inoltre, delle pagine duplicate, le classiche landing page da utilizzare per fare campagne pubblicitarie su Google Ads. Ovviamente è buona prassi non dare in pasto al motore di ricerca contenuti duplicati, seppur deliberatamente e per scopi diversi. Quindi si può usare il file Robots.txt per bloccarne preventivamente la scansione.
Altra casistica frequente per gli ecommerce è quella dei contenuti cosiddetti “dinamici”, ovvero quelli che si autogenerano quando gli utenti selezionano filtri per visualizzare solo i prodotti di interesse. In questi casi, si può gestire la duplicazione con un tag rel=“canonical”, che reindirizza i crawler verso la pagina principale di categoria, oppure si può indicare direttamente nel file robots.txt quali di queste pagine non mostrare a Google, così che non le identifichi come pagine duplicate.
Come per la Sitemap è possibile creare da soli il file robots.txt, ma soprattutto nel caso degli E-Commerce è consigliabile rivolgersi ad un esperto per non generare errori e ulteriori problematiche. Una volta creato, il file robots.txt va inserito nella directory principale del sito.
Per visionare il file robots.txt basta digitare l’url del sito, seguito da “/robots.txt”.
Inserire, se possibile, lo screenshot del file robots.txt di uno dei vostri clienti ecommerce. Lascio a voi la scelta anche in questo caso.
Esempio preso da Meta:
Conclusioni
Ricapitolando, per indicizzare un sito web eCommerce si può semplicemente aspettare, ma è decisamente più conveniente agire per velocizzare il processo. Come fare? Innanzitutto bisogna accedere a Search Console tramite un account Google e aggiungere il proprio sito scegliendo una modalità di verifica della proprietà dello stesso. Dopodiché basterà offrire in pasto al motore di ricerca una sitemap scritta senza errori.
Per aiutare i crawler nella scansione del sito ed essere sicuri che Google non indicizzi pagine inutili, duplicate o private, è meglio inserire nella root principale del sito un file robots.txt scritto correttamente, verificando che non blocchi per sbaglio le pagine importanti. È importante inserire in questo file anche la Sitemap che mostrerà ai crawler la struttura gerarchica in cui sono organizzate le pagine dell’e-commerce rendendo più semplice la scansione e migliorando, potenzialmente, anche il posizionamento di determinate pagine del sito nella SERP.
Per quanto si tratti di operazioni relativamente semplici per un addetto ai lavori, non è detto che sia così per chi non mastica questi argomenti con cadenza quotidiana. Il miglior consiglio che possiamo dare per indicizzare nel modo giusto un e-commerce è quello di rivolgersi a dei Webmaster professionisti e consulenti SEO, evitando così di commettere errori che possano generare problematiche e influenzare negativamente l’andamento generale del sito.
Non esitare a contattarci per qualunque necessità o informazione. Saremo lieti di mettere al tuo servizio la nostra esperienza.





