<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Simone Carletti&#039;s Blog &#187; Motori di Ricerca</title>
	<atom:link href="http://www.simonecarletti.it/blog/categories/motori-di-ricerca/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.simonecarletti.it/blog</link>
	<description>Un piccolo spazio nel web con approfondimenti su programmazione, feed, motori di ricerca e marketing.</description>
	<lastBuildDate>Mon, 03 Oct 2011 14:40:00 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Certificazione di Google Analytics</title>
		<link>http://www.simonecarletti.it/blog/2009/03/certificazione-di-google-analytics/</link>
		<comments>http://www.simonecarletti.it/blog/2009/03/certificazione-di-google-analytics/#comments</comments>
		<pubDate>Sat, 14 Mar 2009 16:05:59 +0000</pubDate>
		<dc:creator>Simone Carletti</dc:creator>
				<category><![CDATA[Analytics]]></category>
		<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[google analytics]]></category>

		<guid isPermaLink="false">http://www.simonecarletti.it/blog/?p=2580</guid>
		<description><![CDATA[Caratteristiche della certificazione individuale di Google Analytics e consigli per affrontare l'esame.]]></description>
			<content:encoded><![CDATA[<p>Approfittando della trasferta Torinese e di un po&#8217; di tempo libero, in questi ultimi giorni mi sono documentato per la <a href="http://analytics.blogspot.com/2009/03/what-is-your-google-analytics-iq.html">certificazione individuale di Google Analytics</a>. L&#8217;esame è stata l&#8217;occasione giusta per approfondire alcuni aspetti di Google Analytics che normalmente non rientrano nelle mie attività quotidiane.</p>
<p><img class="aligncenter size-full wp-image-2582" title="certification-screenshot" src="http://www.simonecarletti.it/blog/wp-content/uploads/2009/03/certification-screenshot.jpg" alt="certification-screenshot" width="400" height="309" /><span id="more-2580"></span></p>
<h2>Consigli per la preparazione all&#8217;esame</h2>
<p>Per chi utilizza Google Analytics quotidianamente, l&#8217;esame è abbastanza semplice. Inoltre, la documentazione disponibile sul <a href="http://www.google.com/support/conversionuniversity/">Conversion University Help</a> è sufficiente a coprire oltre il 90% delle domande. Tuttavia, se desiderate sostenere la certificazione vi consiglio di non prendere l&#8217;esame sotto gamba. Alcune domande richiedono un&#8217;interpretazione personale e la conoscenza di alcuni dettagli tecnici di una sessione di navigazione di un utente.</p>
<p>Il <strong>Conversion University Help</strong> è senza dubbio il punto di partenza. Offre una panoramica completa delle funzioni di Google Analytics. Non abbiate fretta a saltare gli argomenti che pensate di conoscere. Alcune domande sono molto specifiche e richiedono, ad esempio, di sapere l&#8217;esatta precedenza attribuita a Google Analytics in caso di comportamenti comuni come multipli referer, conversioni con campagne in sovrapposizione o preferenze riguardo ai cookie.</p>
<p>Oltre al Conversion University Help vi consiglio di approfondire i seguenti temi, se ancora non avete avuto modo:</p>
<ul>
<li>Site Search</li>
<li>Integrazione con Google AdWords</li>
<li>Tracciamento di Conversioni e Goal</li>
<li>Tracciamento di Transazioni e E-Commerce</li>
</ul>
<p>Per ciascuno di questi temi assicuratevi di configurare un profilo di Google Analytics per test ed esplorate le funzionalità disponibili prima di affrontare l&#8217;esame. Non cancellate il profilo, potrebbe servirvi in fase d&#8217;esame.</p>
<p>Sempre in tema di risorse, merita senz&#8217;altro una citazione il sito <a href="http://www.goanalytics.info/">Google Analytics in 30 secondi</a>, una miniera di risorse sapientemente raccolte e pubblicate da Marco, già autore della Guida a Google Analytics per HTML.it. A proposito, complimenti a Marco che, per quanto ne so, è stato <a href="http://www.goanalytics.info/sono-certificato/">uno dei primi italiani a vincere il bollino</a>.</p>
<h2>Approfondimenti tecnici necessari</h2>
<p>Normalmente è più facile per un tecnico apprendere caratteristiche comportamentali di un prodotto lato marketing che per un utente Marketing apprendere competenze tecniche. Questo perché alcune competenze tecniche richiedono prerequisiti a loro volta di carattere tecnico.</p>
<p>Per questo motivo, agli utenti non tecnici consiglio di approfondire gli argomenti:</p>
<ul>
<li><a href="http://services.google.com/analytics/breeze/en/regex_ga/index.html">Regular Expression</a>, per una guida base in Italiano consiglio l&#8217;<a href="http://www.kerouac3001.com/espressioni-regolari-guida-base-50.htm">articolo di Vincenzo</a></li>
<li>Funzionamento e caratteristiche dei cookie: scadenza, first-cookie, last-cookie, possibilità di personalizzazione</li>
<li>Funzionamento e caratteristiche di una sessione di navigazione di un utente</li>
<li>Funzionamento e classificazione di una sessione in visitatore, visita unica e pageview</li>
</ul>
<h2>Caratteristiche del test</h2>
<p>Il test è composto da <strong>70 domande</strong> ed avete a disposizione <strong>90 minuti</strong> per rispondere. Le domande sono per la maggior parte <strong>scelta singola da una lista di possibilità</strong>, in altri casi scelta multipla.</p>
<p>Non abbiate fretta di rispondere subito a tutte le domande. 90 minuti sono tanti, <strong>oltre 1 minuto a risposta</strong> ed alcune risposte richiedono meno di 10 secondi. Contrassegnate con <em>Mark</em> le risposte delle quali non siete sicuri, riprendetele in seguito. Se dopo 1 minuto non avete ancora assegnato una risposta, andate avanti. Riprenderete la risposta in seguito a test ultimato.</p>
<p>Durante il test è possibile consultare siti, Google Analytics ed altro materiale online. Tuttavia questo richiede tempo e vi consiglio di posticipare alla fine le domande per le quali avete bisogno di approfondimenti. Se avete seguito le indicazioni sopra per la preparazione, il numero di risposte da rivedere sarà molto limitato.</p>
<h2>Suggerimenti per il test</h2>
<p>Prima di iniziare il test tenete a portata di mano le seguenti risorse:</p>
<ul>
<li><a href="http://www.google.com/support/conversionuniversity/">Conversion University Help</a></li>
<li>L&#8217;<a href="http://www.google.com/support/googleanalytics/bin/answer.py?hl=en&amp;answer=55578">URL Builder</a></li>
<li>Lo <a href="https://www.google.com/support/googleanalytics/bin/answer.py?answer=55572">strumento per il filtro IP</a></li>
<li>Il vostro account di Google Analytics, eventualmente con attivo il profilo indicato ad inizio post</li>
<li>Se siete un inserzionista AdWords, il vostro account AdWords. Se non lo siete, assicuratevi di conoscere bene il funzionamento di AdWords e Google Analytics</li>
</ul>
<p>Buon esame!</p>
<p>Related posts:<ol>
<li><a href='http://www.simonecarletti.it/blog/2006/08/google-analytics-apre-le-porte-a-tutti/' rel='bookmark' title='Google Analytics apre le porte a tutti'>Google Analytics apre le porte a tutti</a></li>
<li><a href='http://www.simonecarletti.it/blog/2005/11/google-analytics/' rel='bookmark' title='Google Analytics'>Google Analytics</a></li>
<li><a href='http://www.simonecarletti.it/blog/2006/04/invito-google-analytics-li-invia-solo-google/' rel='bookmark' title='Invito Google Analytics: li invia solo Google!'>Invito Google Analytics: li invia solo Google!</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.simonecarletti.it/blog/2009/03/certificazione-di-google-analytics/feed/</wfw:commentRss>
		<slash:comments>19</slash:comments>
		</item>
		<item>
		<title>Serve a qualcosa lo status HTTP 410?</title>
		<link>http://www.simonecarletti.it/blog/2009/02/serve-a-qualcosa-lo-status-http-410/</link>
		<comments>http://www.simonecarletti.it/blog/2009/02/serve-a-qualcosa-lo-status-http-410/#comments</comments>
		<pubDate>Thu, 12 Feb 2009 23:30:08 +0000</pubDate>
		<dc:creator>Simone Carletti</dc:creator>
				<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[Server / Apache]]></category>
		<category><![CDATA[http]]></category>
		<category><![CDATA[http 410]]></category>
		<category><![CDATA[server]]></category>

		<guid isPermaLink="false">http://www.simonecarletti.it/blog/?p=760</guid>
		<description><![CDATA[Risultati di un test per verificare il comportamento di crawler e client in caso di status HTTP 410.]]></description>
			<content:encoded><![CDATA[<p>In questo post vorrei esporre i risultati di un esperimento condotto l&#8217;anno scorso. Obiettivo del test era verificare il <strong>comportamento di crawler e client in caso di status <code>HTTP 410</code></strong>.</p>
<h2>Che cos&#8217;è lo status HTTP 410?</h2>
<p>Come ben saprà chi legge abitualmente questo blog o si interessa di server, un server può restituire diversi <strong>status code</strong> in risposta ad una richiesta di una pagina web. Tra gli status code pià famosi troviamo</p>
<ul>
<li><code>HTTP 200</code> in caso di risposta completata con successo</li>
<li><code>HTTP 404</code> in caso di risorsa non trovata</li>
<li><code>HTTP 403</code> in caso di accesso non consentito</li>
</ul>
<p>Lo status code restituito da un server è fondamentale e determina il <strong>risultato di una risposta HTTP</strong>. Parlando di motori di ricerca, <strong>lo status code influenza il posizionamento</strong> di una pagina così come la sua indicizzazione.</p>
<p><span id="more-760"></span>Lo status code <code>410</code> rappresenta la risposta in caso di <strong>risorsa non più disponibile</strong>. La sua definizione tecnica è <code>HTTP 410 Gone</code>. Per certi versi è molto simile al <code>404</code> poiché entrambi identificano una risorsa irraggiungibile, tuttavia esiste una differenza non banale:</p>
<ul>
<li>lo status code <code>404</code> indica una risorsa non disponibile.</li>
<li>lo status code <code>410</code> indica una risorsa <strong>non più disponibile</strong>.</li>
</ul>
<p>In altre parole, lo status code <code>410</code> implica che a quell&#8217;indirizzo prima fosse disponibile una risorsa che, al momento, è stata rimossa. Al contrario, lo status code <code>404</code> non fornisce questo dettaglio: l&#8217;indirizzo richiesto forse non ha mai ospitato una risorsa, forse sì&#8230; non si sa.</p>
<p>Agli occhi della maggior parte dei client <strong>ciò che conta è il risultato</strong>. In entrambi i casi ci troviamo di fronte ad una risorsa non disponibile e l&#8217;errore va gestito. Alcuni software rimuovono la risorsa dai propri indici, altri la nascondono, altri ancora mettono in atto azioni correttive per verificare un&#8217;eventuale collocazione alternativa.</p>
<p>La maggior parte dei motori di ricerca afferma di gestire lo status code <code>410</code> allo stesso modo del <code>404</code>. Obiettivo del mio test era verificare quest&#8217;affermazione sfruttando la necessità di voler rimuovere un feed non più disponibile.</p>
<h2>Numero di richieste HTTP</h2>
<p>Il grafico seguente riassume le richieste HTTP inviate alla pagina <code>/atom.xml</code> prima e dopo l&#8217;impostazione dello status code <code>HTTP 410</code>, il 5 Ottobre 2008.</p>
<p>Nota. <em>Per ingrandire i valori potete con il mouse selezionare una porzione del grafico. Lo script provvederà ad ingrandire a schermo solo il range che avete evidenziato.</em></p>
<p><script src="/blog/charts/amline/swfobject.js" type="text/javascript"></script></p>
<div id="flashcontent"><strong>You need to upgrade your Flash Player</strong></div>
<p><script type="text/javascript">// <![CDATA[
  var so = new SWFObject("http://www.simonecarletti.it/blog/charts/amline/amline.swf", "amline", "520", "400", "8", "#FFFFFF"); so.addVariable("path", "http://www.simonecarletti.it/blog/charts/amline/"); so.addVariable("settings_file", encodeURIComponent("http://www.simonecarletti.it/blog/wp-content/uploads/2009/02/amline_settings.txt")); so.addVariable("data_file", encodeURIComponent("http://www.simonecarletti.it/blog/wp-content/uploads/2009/02/amline_data.txt")); so.write("flashcontent");
// ]]&gt;</script></p>
<h2>I risultati</h2>
<p>Analizzando i risultati dell&#8217;esperimento è possibile osservare diversi comportamenti curiosi. Ecco alcune mie considerazioni, in ordine sparso.</p>
<ol>
<li>Contrariamente ad ogni mia aspettativa, lo status <code>HTTP 410</code> è supportato da una buona fetta dei client web: crawler, motori di ricerca, parser&#8230; E&#8217; possibile notare come, nel giro di qualche giorno, le richieste alla pagina sono diminuite sensibilmente.</li>
<li>A differenza dello status <code>HTTP 404</code>, lo status <code>HTTP 410</code> ha un <strong>effetto quasi immediato</strong>. Teoricamente parlando questo ha un senso ma, anche in questo caso, non mi sarei aspettato una così concreta aderenza alle specifiche. Il motivo per il quale l&#8217;<code>HTTP 410</code> è così immediato è da ricercare nel suo significato: la volontà di azione. A differenza del <code>404</code> che potrebbe essere casuale o involontario, l&#8217;<code>HTTP 410</code> non è uno status code predefinito e viene impostato deliberatamente. Questa sottile differenza autorizza il client ad agire senza eccessivi controlli aggiuntivi, come avviene invece nel caso di un <code>HTTP 404</code>.</li>
<li>A differenza dello status <code>HTTP 404</code>, buona parte dei client mette in atto un processo di rimozione irreversibile. In altre parole, una volta appurata la non disponibilità della risorsa, i client limitano i controlli periodici ad una frequenza inferiore a quella normalmente prevista per un <code>HTTP 404</code>.</li>
</ol>
<p>In conclusione, direi che è possibile affermare con una discreta certezza che l&#8217;<strong><code>HTTP 410</code> è efficace</strong>. Inoltre, sembra essere dimostrato che per rimuovere velocemente una pagina dalla rete <strong>questo status code rappresenta</strong> una soluzione più efficace rispetto alla semplice cancellazione del file dal server e conseguente <code>HTTP 404</code>.</p>
<p>Related posts:<ol>
<li><a href='http://www.simonecarletti.it/blog/2009/02/come-restituire-http-status-code-con-apache/' rel='bookmark' title='Come restituire HTTP Status Code specifici con Apache e .htaccess'>Come restituire HTTP Status Code specifici con Apache e .htaccess</a></li>
<li><a href='http://www.simonecarletti.it/blog/2007/05/importanti-aggiornamenti-al-tool-http-headers-status-checker/' rel='bookmark' title='Importanti aggiornamenti al tool HTTP Headers Status Checker'>Importanti aggiornamenti al tool HTTP Headers Status Checker</a></li>
<li><a href='http://www.simonecarletti.it/blog/2007/05/strumenti-seo-http-headers-status-checker/' rel='bookmark' title='Strumenti SEO: HTTP Headers Status Checker'>Strumenti SEO: HTTP Headers Status Checker</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.simonecarletti.it/blog/2009/02/serve-a-qualcosa-lo-status-http-410/feed/</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>Leggendo i log ho scoperto&#8230; #11 &#8211; Twingly Blog Search</title>
		<link>http://www.simonecarletti.it/blog/2009/02/leggendo-i-log-ho-scoperto-11-twingly-blog-search/</link>
		<comments>http://www.simonecarletti.it/blog/2009/02/leggendo-i-log-ho-scoperto-11-twingly-blog-search/#comments</comments>
		<pubDate>Mon, 09 Feb 2009 19:52:40 +0000</pubDate>
		<dc:creator>Simone Carletti</dc:creator>
				<category><![CDATA[Analytics]]></category>
		<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[Blog]]></category>
		<category><![CDATA[microblog]]></category>
		<category><![CDATA[twingly]]></category>
		<category><![CDATA[twitter]]></category>

		<guid isPermaLink="false">http://www.simonecarletti.it/blog/?p=2497</guid>
		<description><![CDATA[Analizzando i log è possibile notare il passaggio del bot di Twingly.com, un motore di ricerca per blog orientato alla ricerca in blog e microblog.]]></description>
			<content:encoded><![CDATA[<p>&#8230; <a href="http://www.twingly.com/">Twingly.com</a>, un motore di ricerca per blog orientato alla ricerca in blog e microblog.</p>
<p>Nel primo caso Twingly è in qualche modo paragonabile al funzionamento di Google Blog Search o altre vecchie conoscenze come Technorati. A differenza di quest&#8217;ultimo però, Twingly sembra passarsela meglio. Nel secondo caso Twingly permette ricerche tra i dati di Twitter ed altri servizi dei quali non conoscevo neppure l&#8217;esistenza. Non c&#8217;è da stupirsi, dato che sono diametralmente opposto a questi prodotti.</p>
<p><span id="more-2497"></span>Il bot di Twingly si presenta con la seguente user agent</p>
<pre>Mozilla/5.0 (compatible; Twingly Recon; twingly.com)</pre>
<p>Analizzando i log ho avuto modo di notare che si ciba sia di feed sia di pagine del blog.</p>
<p><strong>Twingly sembra un progetto ben studiato</strong>. E&#8217; pieno di widget ripubblicabili, offre una top100 per la gioia dei classifica-dipendenti e, molto interessante, permette di interagire attraverso un sistema di API. Quest&#8217;ultima funzione, dal mio punto di vista, è forse la parte più attraente.</p>
<p>Related posts:<ol>
<li><a href='http://www.simonecarletti.it/blog/2008/11/leggendo-i-log-ho-scoperto-10-pdf-search-engine/' rel='bookmark' title='Leggendo i log ho scoperto&#8230; #10 &#8211; PDF Search Engine'>Leggendo i log ho scoperto&#8230; #10 &#8211; PDF Search Engine</a></li>
<li><a href='http://www.simonecarletti.it/blog/2008/09/leggendo-i-log-ho-scoperto-5/' rel='bookmark' title='Leggendo i log ho scoperto&#8230; #5'>Leggendo i log ho scoperto&#8230; #5</a></li>
<li><a href='http://www.simonecarletti.it/blog/2008/10/leggendo-i-log-ho-scoperto-8-iearthworm/' rel='bookmark' title='Leggendo i log ho scoperto&#8230; #8 &#8211; iearthworm'>Leggendo i log ho scoperto&#8230; #8 &#8211; iearthworm</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.simonecarletti.it/blog/2009/02/leggendo-i-log-ho-scoperto-11-twingly-blog-search/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>SERP di Google inutilizzabili da qualche minuto</title>
		<link>http://www.simonecarletti.it/blog/2009/01/serp-di-google-inutilizzabili-da-qualche-minuto/</link>
		<comments>http://www.simonecarletti.it/blog/2009/01/serp-di-google-inutilizzabili-da-qualche-minuto/#comments</comments>
		<pubDate>Sat, 31 Jan 2009 15:06:32 +0000</pubDate>
		<dc:creator>Simone Carletti</dc:creator>
				<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[serp]]></category>
		<category><![CDATA[stopbadware]]></category>

		<guid isPermaLink="false">http://www.simonecarletti.it/blog/?p=2391</guid>
		<description><![CDATA[Da qualche minuto le pagine di ricerca di Google sono inutilizzabili, invase dal messaggio Questo sito potrebbe arrecare danni al tuo computer.]]></description>
			<content:encoded><![CDATA[<p>Da qualche minuto le pagine di ricerca di Google sono <strong>completamente inutilizzabili</strong>. Un&#8217;epidemia di messaggi <a href="http://www.simonecarletti.it/blog/2007/04/google-e-stopbadware/">Questo sito potrebbe arrecare danni al tuo computer</a> ha completamente travolto ogni sito presente nelle SERP, probabilmente a causa di un bug.</p>
<p>Ecco alcuni screenshot. Il problema si manifesta sia in Italiano sia sulle pagine dei risultati internazionali.</p>
<p><span id="more-2391"></span><a href="http://www.simonecarletti.it/blog/wp-content/uploads/2009/01/google-stopbadware-bug-it.png"><img class="aligncenter size-medium wp-image-2395" title="Google Stopbadware Bug (IT)" src="http://www.simonecarletti.it/blog/wp-content/uploads/2009/01/google-stopbadware-bug-it-400x300.png" alt="Google Stopbadware Bug (IT)" width="400" height="300" /></a></p>
<p><a href="http://www.simonecarletti.it/blog/wp-content/uploads/2009/01/google-stopbadware-bug-en.png"><img class="aligncenter size-medium wp-image-2396" title="Google Stopbadware Bug (EN)" src="http://www.simonecarletti.it/blog/wp-content/uploads/2009/01/google-stopbadware-bug-en-400x300.png" alt="Google Stopbadware Bug (EN)" width="400" height="300" /></a></p>
<p>Non so se il fenomeno sia circoscritto o visibile a chiunque. Da alcuni test ho verificato lo stesso problema anche cambiando browser o eseguendo il logout dal mio Google Account.</p>
<p>Capita anche a voi?</p>
<p><strong>Aggiornamento:</strong> il problema sembra essere tornato alla normalità. Non si sono fatte attendere reazioni, ad esempio <a href="http://blogoscoped.com/forum/149633.html">Google Blogoscoped</a> e <a href="http://search.twitter.com/search?q=%23googmayharm">Twitter</a>. Credo che molte altre seguiranno nelle prossime ore.</p>
<p><strong>Aggiornamento:</strong> <a href="http://googleblog.blogspot.com/2009/01/this-site-may-harm-your-computer-on.html">Google conferma</a> e chiarisce l&#8217;accaduto.</p>
<p>Related posts:<ol>
<li><a href='http://www.simonecarletti.it/blog/2006/12/google-maps-integrato-nelle-serp/' rel='bookmark' title='Google Maps integrato nelle SERP'>Google Maps integrato nelle SERP</a></li>
<li><a href='http://www.simonecarletti.it/blog/2006/12/google-serp-gadget-blogger-tip/' rel='bookmark' title='Google SERP &amp; Gadget: Blogger tip'>Google SERP &#038; Gadget: Blogger tip</a></li>
<li><a href='http://www.simonecarletti.it/blog/2006/09/ancora-nuovi-look-in-test-alle-serp-di-google/' rel='bookmark' title='Ancora nuovi look (in test) alle SERP di Google'>Ancora nuovi look (in test) alle SERP di Google</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.simonecarletti.it/blog/2009/01/serp-di-google-inutilizzabili-da-qualche-minuto/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Miti e leggende SEO #3 &#8211; I motori di ricerca non leggono JavaScript e CSS</title>
		<link>http://www.simonecarletti.it/blog/2008/10/miti-e-leggende-seo-3-i-motori-di-ricerca-non-leggono-javascript-e-css/</link>
		<comments>http://www.simonecarletti.it/blog/2008/10/miti-e-leggende-seo-3-i-motori-di-ricerca-non-leggono-javascript-e-css/#comments</comments>
		<pubDate>Wed, 08 Oct 2008 03:34:59 +0000</pubDate>
		<dc:creator>Simone Carletti</dc:creator>
				<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[ask]]></category>
		<category><![CDATA[crawler]]></category>
		<category><![CDATA[css]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[javascript]]></category>
		<category><![CDATA[msn]]></category>
		<category><![CDATA[yahoo]]></category>

		<guid isPermaLink="false">http://www.simonecarletti.it/blog/2008/10/miti-e-leggende-seo-3-i-motori-di-ricerca-non-leggono-javascript-e-css/</guid>
		<description><![CDATA[Alcune informazioni su come i crawler dei motori di ricerca interpretano i file JavaScript e CSS.]]></description>
			<content:encoded><![CDATA[<p>E&#8217; abitudine diffusa affermare che i crawler dei motori di ricerca non siano in grado di <strong>leggere file JavaScript o CSS</strong>. In realtà quest&#8217;affermazione è falsa e facilmente documentabile da una semplice analisi dei log.</p>
<p>Ma allora, come mai frasi come <strong>Google non legge i JavaScript</strong> o <strong>Yahoo! non capisce i CSS sono così diffuse</strong>? Come in ogni leggenda che si rispetti, anche in questa c&#8217;è un fondo di verità. In questo articolo cercherò di dimostrare entrambi i punti di vista.</p>
<p><span id="more-757"></span></p>
<h2>I motori di ricerca leggono JavaScript e CSS</h2>
<p>Cominciamo dalla parte più facile, ovvero dimostrare che <strong>i motori di ricerca leggono i file JavaScript e CSS</strong>. Per fugare definitivamente ogni dubbio possiamo <strong>analizzare i log di accesso</strong> di un comune sito web.</p>
<h3>I motori di ricerca ed i file CSS</h3>
<p>Proviamo, ad esempio, a controllare tutti gli accessi ai un file CSS di questo blog.</p>
<pre class="code-bash">$ grep '.css' access.log
85-18-66-25.ip.fastwebnet.it - - [20/Sep/2008:13:03:31 -0700] "GET /blog/styles.css HTTP/1.1" 200 720 "http://www.simonecarletti.com/blog/2006/02/perche_ho_scelto_feeddemon.php" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)"
85-18-66-25.ip.fastwebnet.it - - [20/Sep/2008:13:03:31 -0700] "GET /static/mt4/themes-base/blog.css HTTP/1.1" 200 9767 "http://www.simonecarletti.com/blog/2006/02/perche_ho_scelto_feeddemon.php" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)"
85-18-66-25.ip.fastwebnet.it - - [20/Sep/2008:13:03:31 -0700] "GET /static/mt4/support/themes/professional-blue/professional-blue.css HTTP/1.1" 200 13665 "http://www.simonecarletti.com/blog/2006/02/perche_ho_scelto_feeddemon.php" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)"
85-18-66-25.ip.fastwebnet.it - - [20/Sep/2008:13:03:32 -0700] "GET /static/stylesheets/blog.css HTTP/1.1" 200 5559 "http://www.simonecarletti.com/blog/2006/02/perche_ho_scelto_feeddemon.php" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)"
85-18-66-25.ip.fastwebnet.it - - [20/Sep/2008:13:03:32 -0700] "GET /static/stylesheets/alignments.css HTTP/1.1" 200 1815 "http://www.simonecarletti.com/blog/2006/02/perche_ho_scelto_feeddemon.php" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)"
85-18-66-25.ip.fastwebnet.it - - [20/Sep/2008:13:03:32 -0700] "GET /static/stylesheets/messages.css HTTP/1.1" 200 3198 "http://www.simonecarletti.com/blog/2006/02/perche_ho_scelto_feeddemon.php" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)"
85-18-66-25.ip.fastwebnet.it - - [20/Sep/2008:13:03:32 -0700] "GET /static/mt4/SyntaxHighlighter/Styles/SyntaxHighlighter.css HTTP/1.1" 200 4352 "http://www.simonecarletti.com/blog/2006/02/perche_ho_scelto_feeddemon.php" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; Media Center PC 5.0; .NET CLR 3.0.04506)"
crawl-66-249-70-72.googlebot.com - - [20/Sep/2008:13:06:07 -0700] "GET /static/tools/style.css HTTP/1.1" 200 10046 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
host64-86-dynamic.61-82-r.retail.telecomitalia.it - - [20/Sep/2008:13:10:22 -0700] "GET /blog/styles.css HTTP/1.1" 200 721 "http://www.simonecarletti.com/blog/2007/03/individuare-cloni-fake.php" "Opera/9.52 (Windows NT 5.1; U; it)"
host64-86-dynamic.61-82-r.retail.telecomitalia.it - - [20/Sep/2008:13:10:22 -0700] "GET /static/mt4/themes-base/blog.css HTTP/1.1" 200 9767 "http://www.simonecarletti.com/blog/2007/03/individuare-cloni-fake.php" "Opera/9.52 (Windows NT 5.1; U; it)"
host64-86-dynamic.61-82-r.retail.telecomitalia.it - - [20/Sep/2008:13:10:22 -0700] "GET /static/stylesheets/blog.css HTTP/1.1" 200 5560 "http://www.simonecarletti.com/blog/2007/03/individuare-cloni-fake.php" "Opera/9.52 (Windows NT 5.1; U; it)"</pre>
<p>Non notate nulla di strano? Alla riga numero 8 è presente un accesso da un client con useragent <code>Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)</code>: il crawler di Google!</p>
<p>La user agent è facilmente modificabile e chiunque può spacciarsi, senza troppa fatica, per il crawler di Google. Per rendere il test ancora più affidabile è quindi necessario eseguire un <strong>reverse DNS dell&#8217;indirizzo IP</strong>. Per semplicità ho delegato ad Apache questo lavoro, così che il log contenga direttamente il nome dell&#8217;host al posto del corrispondente IP.</p>
<p>Come potete vedere, l&#8217;host associato a quella richiesta corrisponde a <code>crawl-66-249-70-72.googlebot.com</code>, un host di proprietà di Google. A questo punto, vale la pena eseguire una ricerca mirata nei log solo per questo host, limitando ovviamente i risultati ai soli file CSS.</p>
<pre class="code-bash">$ zgrep '.css ' access.* | egrep '^.*?.googlebot.com'
crawl-66-249-70-72.googlebot.com - - [20/Sep/2008:01:44:17 -0700] "GET /static/mt4/support/themes/professional-blue/professional-blue.css HTTP/1.1" 200 13666 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
crawl-66-249-70-72.googlebot.com - - [20/Sep/2008:13:06:07 -0700] "GET /static/tools/style.css HTTP/1.1" 200 10046 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
crawl-66-249-70-72.googlebot.com - - [22/Sep/2008:12:00:41 -0700] "GET /static/stylesheets/messages.css HTTP/1.1" 200 3199 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
crawl-66-249-70-72.googlebot.com - - [22/Sep/2008:16:28:17 -0700] "GET /static/stylesheets/messages.css HTTP/1.1" 304 256 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
crawl-66-249-70-72.googlebot.com - - [24/Sep/2008:21:32:38 -0700] "GET /mt4/mt-search.cgi?IncludeBlogs=1&amp;search=css HTTP/1.1" 200 18391 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
crawl-66-249-70-72.googlebot.com - - [25/Sep/2008:09:11:06 -0700] "GET /static/stylesheets/blog.css HTTP/1.1" 200 5560 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
crawl-66-249-70-72.googlebot.com - - [25/Sep/2008:12:09:48 -0700] "GET /static/mt4/themes-base/blog.css HTTP/1.1" 200 9768 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
crawl-66-249-70-72.googlebot.com - - [03/Oct/2008:17:09:31 -0700] "GET /static/toolsdesign/style.css HTTP/1.1" 200 10046 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
crawl-66-249-70-72.googlebot.com - - [04/Oct/2008:11:06:55 -0700] "GET /static/tools/style.css HTTP/1.1" 200 10046 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"</pre>
<p>In modo del tutto analogo, andiamo alla ricerca di tracce del bot di MSN e Yahoo!.</p>
<p>Il primo si identifica normalmente con un host che termina per <code>search.msn.com</code>.</p>
<pre class="code-bash">$ zgrep '.css ' access.* | egrep '^.*?.search.msn.com'
msnbot-65-55-110-231.search.msn.com - - [06/Oct/2008:23:09:26 -0700] "GET /static/mt4/themes-base/blog.css HTTP/1.0" 200 9767 "http://www.simonecarletti.com/mt4/mt-search.cgi?tag=luca conti&amp;blog_id=1" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)"
msnbot-65-55-110-231.search.msn.com - - [06/Oct/2008:23:09:27 -0700] "GET /static/stylesheets/blog.css HTTP/1.0" 200 5535 "http://www.simonecarletti.com/mt4/mt-search.cgi?tag=luca conti&amp;blog_id=1" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)"
msnbot-65-55-110-231.search.msn.com - - [06/Oct/2008:23:09:27 -0700] "GET /static/stylesheets/alignments.css HTTP/1.0" 200 1815 "http://www.simonecarletti.com/mt4/mt-search.cgi?tag=luca conti&amp;blog_id=1" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)"
msnbot-65-55-110-231.search.msn.com - - [06/Oct/2008:23:09:27 -0700] "GET /static/stylesheets/messages.css HTTP/1.0" 200 3198 "http://www.simonecarletti.com/mt4/mt-search.cgi?tag=luca conti&amp;blog_id=1" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)"
msnbot-65-55-110-231.search.msn.com - - [06/Oct/2008:23:09:27 -0700] "GET /static/mt4/support/themes/professional-blue/professional-blue.css HTTP/1.0" 200 13666 "http://www.simonecarletti.com/mt4/mt-search.cgi?tag=luca conti&amp;blog_id=1" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)"
msnbot-65-55-110-231.search.msn.com - - [06/Oct/2008:23:09:27 -0700] "GET /static/mt4/SyntaxHighlighter/Styles/SyntaxHighlighter.css HTTP/1.0" 200 4352 "http://www.simonecarletti.com/mt4/mt-search.cgi?tag=luca conti&amp;blog_id=1" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322)"</pre>
<p>Il secondo, invece, utilizza un host tipo <code>*.crawl.yahoo.net</code>.</p>
<pre class="code-bash">$ zgrep '.css ' access.* | egrep '^.*?.crawl.yahoo.net'
llf320045.crawl.yahoo.net - - [07/Oct/2008:00:02:22 -0700] "GET /blog/styles.css HTTP/1.0" 304 218 "http://www.simonecarletti.com/blog/2006/05/piu_trackback_per_tutti.php" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
llf320045.crawl.yahoo.net - - [07/Oct/2008:00:02:25 -0700] "GET /static/mt4/themes-base/blog.css HTTP/1.0" 304 220 "http://www.simonecarletti.com/blog/styles.css" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
llf320045.crawl.yahoo.net - - [07/Oct/2008:00:02:25 -0700] "GET /static/stylesheets/blog.css HTTP/1.0" 304 219 "http://www.simonecarletti.com/blog/styles.css" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
llf320045.crawl.yahoo.net - - [07/Oct/2008:00:02:27 -0700] "GET /static/stylesheets/alignments.css HTTP/1.0" 304 218 "http://www.simonecarletti.com/static/stylesheets/blog.css" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
llf320045.crawl.yahoo.net - - [07/Oct/2008:00:02:27 -0700] "GET /static/stylesheets/messages.css HTTP/1.0" 304 219 "http://www.simonecarletti.com/static/stylesheets/blog.css" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
llf320045.crawl.yahoo.net - - [07/Oct/2008:00:02:35 -0700] "GET /static/mt4/support/themes/professional-blue/professional-blue.css HTTP/1.0" 304 220 "http://www.simonecarletti.com/blog/styles.css" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"
llf320045.crawl.yahoo.net - - [07/Oct/2008:00:02:35 -0700] "GET /static/mt4/SyntaxHighlighter/Styles/SyntaxHighlighter.css HTTP/1.0" 304 219 "http://www.simonecarletti.com/blog/2006/05/piu_trackback_per_tutti.php" "Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)"</pre>
<p>Fermi tutti, abbiamo dimenticato Ask.com! Quest&#8217;ultimo si identifica normalmente con un host tipo <code>*.ask.com</code>.</p>
<pre class="code-bash">$ zgrep '.css ' access.* | egrep '^.*?.ask.com'

$ zgrep '.css ' access.* | egrep '^.*?.ask.com' | wc -l
0
$ egrep '^.*?.ask.com' access.* | wc -l
29</pre>
<p>Niente da fare! Una ricerca per Ask.com non fornisce alcun risultato per i file CSS, mentre fornisce 29 risultati per richieste a normali pagine del blog. Possiamo quindi affermare che, <strong>tra Google, Yahoo, MSN ed Ask, Ask è l&#8217;unico motore di ricerca a non leggere alcun file .css</strong>.</p>
<h3>I motori di ricerca ed i file JavaScript</h3>
<p>Fino ad ora abbiamo parlato soltanto dei file CSS. Possiamo affermare che i motori di ricerca leggono anche i file JavaScript? Proviamo!</p>
<pre class="code-bash">$ zgrep '.js ' access.* | egrep '^.*?.googlebot.com' | wc -l
26
$ zgrep '.js ' access.* | egrep '^.*?.search.msn.com' | wc -l
2485
$ zgrep '.js ' access.* | egrep '^.*?.crawl.yahoo.net' | wc -l
1
$ zgrep '.js ' access.* | egrep '^.*?.ask.com' | wc -l
79</pre>
<p>Per i file JavaScript lo scenario è nettamente differente. <strong>Ask.com legge i file JavaScript mentre, così come Google e MSN</strong> che, nello specifico, non sembra preoccuparsi che file identici linkati da documenti differenti&#8230; sono identici!</p>
<p>La sorpresa, in questo caso, è Yahoo! che sembra aver letto 1 solo file in 30 giorni. Come se non bastasse, questo file non è in alcun modo collegato alle pagine del blog ma si tratta di un file che avevo creato per eseguire la registrazione di un nuovo handler di feed con Firefox 2.0.</p>
<pre class="code-bash">llf520133.crawl.yahoo.net - - [23/Sep/2008:01:54:53 -0700] "GET /blog/public/2006/11/firefox_new_feed_handler/firefox2-registerFeedHandler.js HTTP/1.0" 200 1623 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"</pre>
<h3>Frequenza di accesso</h3>
<p>Per i più curiosi, ecco la frequenza di accesso ai file JavaScript e CSS calcolata negli ultimi 30 giorni, suddivisa per motori.</p>
<table border="0">
<tbody>
<tr>
<th>Motore di Ricerca</th>
<th>CSS</th>
<th>JavaScript</th>
</tr>
<tr>
<td>Google</td>
<td>9</td>
<td>26</td>
</tr>
<tr>
<td>MSN</td>
<td>2915</td>
<td>2485</td>
</tr>
<tr>
<td>Yahoo!</td>
<td>1887</td>
<td>1</td>
</tr>
<tr>
<td>Ask</td>
<td>0</td>
<td>79</td>
</tr>
</tbody>
</table>
<h3>Scaricare non vuol dire leggere!</h3>
<p>A questo punto qualcuno potrebbe obiettare che, analizzando i log, non è dato sapere se il crawler abbia realmente letto il contenuto file o se si è limitato a richiederlo. E&#8217; vero, ma è illogico pensare che un crawler decida di sua spontanea volontà di scaricare un file JavaScript collegato esternamente da un tag script&#8230; solo per generare accessi al server!</p>
<p>Inoltre ci sono diversi modi per dimostrare come il file, in seguito, in effetti venga letto. Non mi dilungo ulteriormente, alcuni di questi sono contenuti leggendo tra le righe nei paragrafi seguenti.</p>
<h2>Leggere vs Interpretare vs Eseguire</h2>
<p>Fermi, dove scappate&#8230; non è mica ancora finito l&#8217;articolo! Prima di tornare al menu di navigazione con link in JavaScript è importante essere a conoscenza della sottile <strong>differenza tra leggere, interpretare ed eseguire</strong>. Questi tre verbi potrebbero sembrare sinonimi, ma non è così.</p>
<p>I crawler normalmente leggono i file JavaScript e CSS ma, come scrissi un anno fa nell&#8217;articolo <a title="Cosa gli spider dei motori di ricerca non sanno fare" href="http://webmarketing.html.it/articoli/leggi/2304/cosa-gli-spider-dei-motori-di-ricerca-non-sanno-fare/">Cosa gli spider dei motori di ricerca non sanno fare</a>, questo non significa necessariamente che intendano eseguirlo.</p>
<p>In altre parole. I crawler scaricano il contenuto dei file, i sorgenti all&#8217;interno vengono normalmente interpretati (soprattutto nel caso di JavaScript) ma quasi mai eseguiti. Questo significa, ad esempio, che un crawler può facilmente scoprire il significato della funzione seguente ma non vuol dire che il dominio <code>paradise.god</code> sarà indicizzato.</p>
<pre class="code-js">function redirect_me_to_paradise {
document.location.href = 'http://paradise.god';
}</pre>
<p>Per questo motivo spesso si tende ad affermare, in modo improprio, che i crawler non leggono JavaScript o CSS indicando che il loro contenuto non viene eseguito come ci si potrebbe aspettare e come avviene invece con un normale browser.</p>
<h2>Perché i motori di ricerca leggono i file JavaScript e CSS?</h2>
<p>L&#8217;esempio precedente dovrebbe cominciare a chiarire alcune delle motivazioni per le quali i motori di ricerca hanno cominciato a leggere ed interpretare il contenuto di file JavaScript e CSS. In passato entrambi i linguaggi sono stati largamente utilizzati per nascondere agli occhi degli utenti contenuti realizzati esclusivamente per i motori di ricerca, all&#8217;unico scopo di sfruttarne il posizionamento a favore di terze pagine. Per approfondimenti sul tema vi consiglio l&#8217;articolo <a href="http://www.kerouac3001.com/testo-nascosto-guida-allo-spam-52.htm">Testo Nascosto</a>, scritto da Vincenzo.</p>
<p>Tecniche come <strong>redirect in javascript</strong>, <strong>doorway page</strong>, <strong>blocchi di testo nascosto</strong> sono oggi nel mirino dei filtri antispam di quasi i motori di ricerca. Per individuarle è necessario analizzare ed interpretare il contenuto di questi file, spesso inseriti esterni alla pagina nella (vana) speranza di eludere il crawler del motore di ricerca.</p>
<p>Per calcare ulteriormente la mano su questo punto vi consiglio alcune letture direttamente dal blog di Matt Cutts:</p>
<ol>
<li><a title="SEO Mistakes: sneaky JavaScript" href="http://www.mattcutts.com/blog/seo-mistakes-sneaky-javascript/">SEO Mistakes: sneaky JavaScript</a></li>
<li><a title="SEO Mistakes: crappy doorway pages" href="http://www.mattcutts.com/blog/seo-mistakes-crappy-doorway-pages/">SEO Mistakes: crappy doorway pages</a></li>
<li><a title="SEO Mistakes: Spam in other languages" href="http://www.mattcutts.com/blog/seo-mistakes-spam-in-other-languages/">SEO Mistakes: Spam in other languages</a></li>
<li><a title="Ramping up on international webspam" href="http://www.mattcutts.com/blog/ramping-up-on-international-webspam/">Ramping up on international webspam</a></li>
<li><a title="SEO Advice: clean house before press releases" href="http://www.mattcutts.com/blog/seo-advice-clean-house-before-press-releases/">SEO Advice: clean house before press releases</a></li>
<li><a title="“Undetectable” spam" href="http://www.mattcutts.com/blog/undetectable-spam/">&#8220;Undetectable&#8221; spam</a></li>
</ol>
<h2>In conclusione</h2>
<p>Webmaster, SEO, spammer ed utenti siete avvisati! Qualunque sia il vostro scopo finale, siate consapevoli del fatto che <strong>i motori di ricerca leggono JavaScript e CSS, normalmente li interpretano, raramente li eseguono</strong>. Ovviamente non è escluso che il comportamento possa variare in futuro.</p>
<p>Related posts:<ol>
<li><a href='http://www.simonecarletti.it/blog/2008/08/leggendo-i-log-ho-scoperto-4/' rel='bookmark' title='Leggendo i log ho scoperto&#8230; #4'>Leggendo i log ho scoperto&#8230; #4</a></li>
<li><a href='http://www.simonecarletti.it/blog/2008/09/leggendo-i-log-ho-scoperto-5/' rel='bookmark' title='Leggendo i log ho scoperto&#8230; #5'>Leggendo i log ho scoperto&#8230; #5</a></li>
<li><a href='http://www.simonecarletti.it/blog/2008/09/leggendo-i-log-ho-scoperto-6/' rel='bookmark' title='Leggendo i log ho scoperto&#8230; #6'>Leggendo i log ho scoperto&#8230; #6</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.simonecarletti.it/blog/2008/10/miti-e-leggende-seo-3-i-motori-di-ricerca-non-leggono-javascript-e-css/feed/</wfw:commentRss>
		<slash:comments>24</slash:comments>
		</item>
		<item>
		<title>Ricerche di Google case sensitive</title>
		<link>http://www.simonecarletti.it/blog/2008/09/ricerche-di-google-case-sensitive/</link>
		<comments>http://www.simonecarletti.it/blog/2008/09/ricerche-di-google-case-sensitive/#comments</comments>
		<pubDate>Sun, 28 Sep 2008 18:02:37 +0000</pubDate>
		<dc:creator>Simone Carletti</dc:creator>
				<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[keyword]]></category>
		<category><![CDATA[serp]]></category>

		<guid isPermaLink="false">http://www.simonecarletti.it/blog/2008/09/ricerche-di-google-case-sensitive/</guid>
		<description><![CDATA[Alcune query sono case sensitive a seconda della chiave di ricerca inserita dall'utente.]]></description>
			<content:encoded><![CDATA[<p>Osservate il numero di risultati e l&#8217;ordine delle posizioni per la keyword <strong>domini google</strong>, scritta semplicemente in due modi diversi.</p>
<p><span id="more-756"></span><a href="http://www.simonecarletti.com/blog/public/2008/09/ricerche-di-google-case-sensitive/domini-google-capscase.png"></a><a href="http://www.simonecarletti.it/blog/wp-content/uploads/2008/09/domini-google-capscase.png"><img class="aligncenter size-medium wp-image-2414" title="Risultati Ricerca per Domini Google" src="http://www.simonecarletti.it/blog/wp-content/uploads/2008/09/domini-google-capscase-303x400.png" alt="Risultati Ricerca per Domini Google" width="303" height="400" /></a></p>
<p class="centered">vs</p>
<p style="text-align: center;"><a href="http://www.simonecarletti.com/blog/public/2008/09/ricerche-di-google-case-sensitive/domini-google-downcase.png"><a href="http://www.simonecarletti.it/blog/wp-content/uploads/2008/09/domini-google-downcase.png"><img class="aligncenter size-medium wp-image-2415" title="Risultati Ricerca per domini google" src="http://www.simonecarletti.it/blog/wp-content/uploads/2008/09/domini-google-downcase-303x400.png" alt="Ricerca Google per domini google" width="303" height="400" /></a></a></p>
<p>Related posts:<ol>
<li><a href='http://www.simonecarletti.it/blog/2006/09/ancora-nuovi-look-in-test-alle-serp-di-google/' rel='bookmark' title='Ancora nuovi look (in test) alle SERP di Google'>Ancora nuovi look (in test) alle SERP di Google</a></li>
<li><a href='http://www.simonecarletti.it/blog/2006/05/google-indietro-nel-tempo/' rel='bookmark' title='Google, indietro nel tempo&#8230;'>Google, indietro nel tempo&#8230;</a></li>
<li><a href='http://www.simonecarletti.it/blog/2005/10/calcolo-dei-tempi-di-indicizzazione/' rel='bookmark' title='Calcolo dei tempi di indicizzazione'>Calcolo dei tempi di indicizzazione</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.simonecarletti.it/blog/2008/09/ricerche-di-google-case-sensitive/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Perdita dei Google Sitelinks</title>
		<link>http://www.simonecarletti.it/blog/2008/08/perdita-dei-google-sitelinks/</link>
		<comments>http://www.simonecarletti.it/blog/2008/08/perdita-dei-google-sitelinks/#comments</comments>
		<pubDate>Fri, 29 Aug 2008 13:59:04 +0000</pubDate>
		<dc:creator>Simone Carletti</dc:creator>
				<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[google sitelinks]]></category>

		<guid isPermaLink="false">http://www.simonecarletti.it/blog/2008/08/perdita-dei-google-sitelinks/</guid>
		<description><![CDATA[I Google Sitelinks non sono un contratto eterno: come vengono assegnati possono essere rimossi da Google.]]></description>
			<content:encoded><![CDATA[<p>Per chi non sapesse di cosa sto parlando, i <strong>Google Sitelinks</strong> sono quella lista di collegamenti che compaiono qualche volta sotto al primo risultato di una ricerca in Google. Per alcuni siti, <a title="Versione evoluta dei Google Sitelinks: sitelinks e form di ricerca - Simone Carletti's Blog" href="http://www.simonecarletti.it/blog/2008/03/versione-evoluta-dei-google-sitelinks-sitelinks-e-form-di-ricerca/">i Google Sitelinks possono anche mostrare una form di ricerca</a>.</p>
<p>Come spiegato nell&#8217;<a title="Che cosa sono i Google Sitelinks - Simone Carletti's Blog" href="http://www.simonecarletti.it/blog/2007/10/che-cosa-sono-i-google-sitelinks/">articolo che cosa sono i Google Sitelinks</a>, l&#8217;assegnazione di questi risultati aggiuntivi è frutto di un algoritmo automatico di Google.<br />
Fino ad oggi si è quasi sempre sentito parlare di siti che hanno ricevuto in omaggio Sitelinks, molto più rari sono gli interventi in merito alla <strong>rimozione dei Google Sitelinks ad un sito</strong>.</p>
<p><span id="more-746"></span></p>
<h2>I Google Sitelink possono essere disattivati&#8230; fidati!</h2>
<p>Questo ha generato in molti utenti la falsa credenza che i Google Sitelinks una volta attribuiti non possano essere rimossi. In realtà non è così: come possono essere attribuiti, allo stesso modo possono essere rimossi ancora una volta dall&#8217;algoritmo di Google. Anche se si tratta di un caso più raro, si può verificare.</p>
<p>L&#8217;esempio pratico l&#8217;ho sperimentato proprio su questo blog, la settimana scorsa. Fino ad inizio agosto una <a title="simone carletti - Google Search" href="http://www.google.com/search?q=simone+carletti">ricerca per simone carletti</a> restituiva come primo risultato questo blog, con 4 Google Sitelinks attivi che puntavano rispettivamente a:</p>
<ol>
<li>HTTP Headers Status Checker</li>
<li>HTTP Headers Analyzer</li>
<li>Apache Log Analyzer 2 Feed</li>
<li>&#8230; il quarto non lo ricordo</li>
</ol>
<p>Ad oggi, se provate la stessa ricerca noterete che i Google Sitelinks sono completamente scomparsi, come dimostra lo screenshot seguente.</p>
<p><a href="http://www.simonecarletti.com/blog/public/2008/08/perdita-dei-google-sitelinks/blog-no-sitelinks.png"><img class="centered" src="http://www.simonecarletti.com/blog/public/2008/08/perdita-dei-google-sitelinks/blog-no-sitelinks-thumb-400x149.png" alt="blog-no-sitelinks.png" width="400" height="149" /></a></p>
<p>Molti vivrebbero questa situazione come un dramma esistenziale e, probabilmente, sarebbe stato lo stesso anche per me se si fosse trattato di un cliente.<br />
In realtà, sperimentando <a title="RSS World potrebbe arrecare danni al tuo computer - Simone Carletti's Blog" href="http://www.simonecarletti.it/blog/2007/02/rss-world-potrebbe-arrecare-danni-al-tuo-computer/">ancora</a> <a title="RSS World, Google e Bardware - Parte 2 - Simone Carletti's Blog" href="http://www.simonecarletti.it/blog/2007/02/rss-world-google-e-bardware-parte-2/">una</a> <a title="RSS World torna in pista! Opinioni sul servizio antibadware - Simone Carletti's Blog" href="http://www.simonecarletti.it/blog/2007/02/rss-world-torna-in-pista-opinioni-sul-servizio-antibadware/">volta</a> un&#8217;esperienza anomala sulla propria pelle ho potuto <strong>analizzare la vicenda con obiettività</strong> ma, soprattutto, con la perfetta consapevolezza di quali erano stati i miei movimenti negli ultimi tempi che avrebbero potuto causare questo problema.</p>
<p>Quest&#8217;ultimo passo è fondamentale. Chi si è trovato, anche solo una volta, ad affrontare una situazione anomala per risolvere un problema di terzi ha ben presente cosa significhi dover giocare a Sherlock Holmes per tentare di scoprire ogni mossa che il cliente può aver compiuto, volontariamente o involontariamente.</p>
<h2>Possibili motivi per la rimozione dei Google Sitelinks</h2>
<p>Poiché l&#8217;algoritmo per l&#8217;assegnazione dei Google Sitelinks non è pubblico non ho certezza che la mia analisi sia del tutto infallibile, tuttavia sono abbastanza certo di aver individuato l&#8217;origine del problema.</p>
<p>Le cause che possono portare alla rimozione dei Google Sitelinks sono essenzialmente due: <strong>perdita della prima posizione</strong> o <strong>numero insufficiente di sitelinks</strong>.</p>
<h3>Perdita della prima posizione</h3>
<p>Questa ipotesi è la più semplice da comprendere. Poiché, al momento, l&#8217;algoritmo assegna i Google Sitelinks solo al sito in prima posizione nei risultati per una determinata keyword, <strong>la perdita della prima posizione comporta inevitabilmente la perdita dei Google Sitelinks</strong>. Il &#8220;premio&#8221; passa quindi, di norma, a colui che ha conquistato la vetta ammesso che il sito abbia i requisiti necessari.</p>
<p>Questa situazione è più frequente per keyword generiche che non corrispondono a brand o nomi propri. Di norma, è difficile che il sito ufficiale di un marchio citato nella ricerca possa essere scavalcato da un qualsiasi altro sito. Ad esempio, difficile che il sito di Prada possa essere scalzato per la <a title="prada - Google Search" href="http://www.google.com/search?q=prada">keyword prada</a> da un rivenditore, anche se il primo è completamente in flash e non offre alcun deeplink utile.</p>
<h3>Numero insufficiente di Sitelinks</h3>
<p>Questa è, quasi certamente, la causa che ha decretato la perdita dei Google Sitelinks per questo sito.</p>
<p>Come vi sarete accorti, <strong>il numero di Sitelinks normalmente varia da un minimo di 4 ad un massimo di 8 per risultato</strong>. Questo significa che il crawler di Google deve essere in grado di <strong>identificare almeno 4 candidati link possibili</strong>. Nel caso in cui Google non riesca a raccogliere un numero di link sufficienti, automaticamente i Sitelink non vengono attribuiti.</p>
<p>La conferma arriva direttamente dalla <a href="http://www.google.com/support/webmasters/bin/answer.py?hl=en&amp;answer=47334">documentazione di Google</a> che aggiunge un altro ingrediente importante alla ricetta: il numero minimo di link richiesti.</p>
<blockquote><p>Note that we only display sitelinks when a site has a minimum of <strong>three</strong> sitelinks available. If you have two or fewer unblocked sitelinks, no sitelinks at all will appear in Google search results for your site.</p></blockquote>
<p>Dati questi elementi, è ragionevole pensare che i requisiti minimi siano applicabili non solo per l&#8217;attribuzione ma anche per il <strong>mantenimento dei Google Sitelinks</strong>. Nel momento in cui un sito non dispone più di un numero di collegamenti sufficienti, automaticamente i Google Sitelinks vengono rimossi dalla pagina dei risultati a patto che Google non riesca ad <strong>individuare delle risorse aggiuntive da utilizzare</strong>.</p>
<p>Come anticipato ad inizio post, il mio sito disponeva esclusivamente di 4 sitelink. In preparazione allo sviluppo del nuovo sito, ho spostato la sezione <strong>code</strong> su <a title="Simone Carletti's Codestuffs" href="http://code.simonecarletti.com">code.simonecarletti.com</a> privando così il sito di due dei quattro sitelink. Al momento questo sito non dispone di altre sezioni di rilievo, di conseguenza a Google non è rimasto altro che disattivare la funzionalità.<br />
La conferma arriva anche da Google Webmaster Tools, dove la lista dei Google Sitelinks è inesorabilmente vuota.</p>
<p>Leggendo tra le righe, sembrerebbe confermato anche un altro aspetto dell&#8217;algoritmo: <strong>i link su terzi livelli non contribuiscono</strong> al numero totale dei Google Sitelinks.</p>
<h2>I test sono l&#8217;anima del SEO</h2>
<p>E&#8217; incredibile quanto si possa apprendere semplicemente soffermandosi a studiare ed analizzare un fenomeno. A volte è necessario anche qualche <em>sacrificio</em> (in genere involontario) ma, a mio avviso, è proprio questo uno degli aspetti più intriganti in questo campo.</p>
<p>Related posts:<ol>
<li><a href='http://www.simonecarletti.it/blog/2007/10/che-cosa-sono-i-google-sitelinks/' rel='bookmark' title='Che cosa sono i Google Sitelinks'>Che cosa sono i Google Sitelinks</a></li>
<li><a href='http://www.simonecarletti.it/blog/2008/03/versione-evoluta-dei-google-sitelinks-sitelinks-e-form-di-ricerca/' rel='bookmark' title='Versione evoluta dei Google Sitelinks: sitelinks e form di ricerca'>Versione evoluta dei Google Sitelinks: sitelinks e form di ricerca</a></li>
<li><a href='http://www.simonecarletti.it/blog/2007/11/htmlit-larticolo-sui-google-sitelinks-e-piaciuto-altre-proposte/' rel='bookmark' title='HTML.it: l&#8217;articolo sui Google Sitelinks è piaciuto, altre proposte?'>HTML.it: l&#8217;articolo sui Google Sitelinks è piaciuto, altre proposte?</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.simonecarletti.it/blog/2008/08/perdita-dei-google-sitelinks/feed/</wfw:commentRss>
		<slash:comments>5</slash:comments>
		</item>
		<item>
		<title>Quando avere un ranking alto non è un vantaggio</title>
		<link>http://www.simonecarletti.it/blog/2008/08/quando-avere-un-ranking-alto-non-e-un-vantaggio/</link>
		<comments>http://www.simonecarletti.it/blog/2008/08/quando-avere-un-ranking-alto-non-e-un-vantaggio/#comments</comments>
		<pubDate>Tue, 19 Aug 2008 08:36:49 +0000</pubDate>
		<dc:creator>Simone Carletti</dc:creator>
				<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[commenti]]></category>
		<category><![CDATA[ranking]]></category>
		<category><![CDATA[spam]]></category>

		<guid isPermaLink="false">http://www.simonecarletti.it/blog/2008/08/quando-avere-un-ranking-alto-non-e-un-vantaggio/</guid>
		<description><![CDATA[Un potenziale esempio di come non sempre sia vantaggioso avere un alto indice di popolarità per un motore di ricerca.]]></description>
			<content:encoded><![CDATA[<p>Non sempre avere un sito con un alto indice di popolarità (qualcuno lo definirebbe trustrank) è un vantaggio. In alcuni casi questo <em>privilegio</em> potrebbe trasformarsi in uno svantaggio o un potenziale problema.<br />
E&#8217; quello che mi è successo domenica quando, nel solito controllo periodico antispam, ho identificato un commento palesemente inadeguato.</p>
<p>Immediatamente è scattata la rimozione, l&#8217;<strong>analisi dei log</strong> per risalire alla provenienza e qualche contromisura per prevenire il crossposting dei commenti SPAM <a title="Edit - Il blog di HTML.it" href="http://blog.html.it/">altrove</a>.</p>
<p><span id="more-743"></span>Finita la bonifica, ho dedicato un paio di minuti alla ricerca online per scoprire dove altro avesse colpito il commentatore ed ecco il risultato.</p>
<p><a href="http://www.simonecarletti.it/blog/wp-content/uploads/2008/08/spam-serp-first-check.png"><img class="aligncenter size-medium wp-image-2995" title="spam-serp-first-check" src="http://www.simonecarletti.it/blog/wp-content/uploads/2008/08/spam-serp-first-check-400x224.png" alt="spam-serp-first-check" width="400" height="224" /></a></p>
<p>In meno di cinque ore il mio blog compariva già in prima posizione per questo scomodo commento, seguito da un <a title="TagliaBlog - SEO Blog" href="http://blog.tagliaerbe.com/">illustre compagno di sventura</a>. Fortunatamente, il blog sembra essere particolarmente sotto i riflettori. Già in giornata la stessa ricerca mostrava risultati più confortanti per il sottoscritto.</p>
<p><a href="http://www.simonecarletti.it/blog/wp-content/uploads/2008/08/spam-serp-second-check.png"><img class="aligncenter size-medium wp-image-2996" title="spam-serp-second-check" src="http://www.simonecarletti.it/blog/wp-content/uploads/2008/08/spam-serp-second-check-400x224.png" alt="spam-serp-second-check" width="400" height="224" /></a></p>
<p>Curioso notare come il blog di Davide figuri ancora nelle SERP, nonostante nel suo caso si tratti della homepage. Notoriamente questa pagina speciale gode di una rilevanza maggiore.</p>
<p>Related posts:<ol>
<li><a href='http://www.simonecarletti.it/blog/2006/09/pingare-su-technorati-chi-ti-cita-ecco-come-ottenere-ranking/' rel='bookmark' title='Pingare su Technorati chi ti cita? Ecco come ottenere ranking'>Pingare su Technorati chi ti cita? Ecco come ottenere ranking</a></li>
<li><a href='http://www.simonecarletti.it/blog/2007/04/microsoft-webmaster-tools-a-quando-forse-presto/' rel='bookmark' title='Microsoft Webmaster Tools&#8230; a quando? Forse presto?'>Microsoft Webmaster Tools&#8230; a quando? Forse presto?</a></li>
<li><a href='http://www.simonecarletti.it/blog/2007/06/apache-log-analyzer-2-feed-i-feed-a-vantaggio-dei-seo/' rel='bookmark' title='Apache Log Analyzer 2 Feed: i feed a vantaggio dei SEO'>Apache Log Analyzer 2 Feed: i feed a vantaggio dei SEO</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.simonecarletti.it/blog/2008/08/quando-avere-un-ranking-alto-non-e-un-vantaggio/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Visualizza tradotti inglesi risultati per la ricerca di</title>
		<link>http://www.simonecarletti.it/blog/2008/08/visualizza-tradotti-inglesi-risultati-per-la-ricerca-di/</link>
		<comments>http://www.simonecarletti.it/blog/2008/08/visualizza-tradotti-inglesi-risultati-per-la-ricerca-di/#comments</comments>
		<pubDate>Sun, 17 Aug 2008 10:38:01 +0000</pubDate>
		<dc:creator>Simone Carletti</dc:creator>
				<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[google translate]]></category>

		<guid isPermaLink="false">http://www.simonecarletti.it/blog/2008/08/visualizza-tradotti-inglesi-risultati-per-la-ricerca-di/</guid>
		<description><![CDATA[In alcune pagine dei risultati di una ricerca in italiano, Google offre un collegamento per tradurre in inglese il contenuto.]]></description>
			<content:encoded><![CDATA[<p>Sapere l&#8217;inglese è importante. Adesso ce lo ricorda anche Google, facendo spuntare un collegamento di tanto in tanto nel caso decidessimo di tradurre in inglese la pagina dei risultati di una ricerca in italiano. Non so voi, ma io non ne trovo un&#8217;utilità concreta. Dite che all&#8217;utente possa servire?</p>
<p><a href="http://www.simonecarletti.com/blog/public/2008/08/visualizza-tradotti-inglesi-risultati-per-la-ricerca-di/visualizza-risultati-tradotti.png"><a href="http://www.simonecarletti.it/blog/wp-content/uploads/2008/08/visualizza-risultati-tradotti.png"><img class="aligncenter size-medium wp-image-2703" title="visualizza-risultati-tradotti" src="http://www.simonecarletti.it/blog/wp-content/uploads/2008/08/visualizza-risultati-tradotti-400x167.png" alt="visualizza-risultati-tradotti" width="400" height="167" /></a></a></p>
<p>In compenso, più che una <em>traduzione inglese</em>, a Google ora come ora servirebbe <em>una correzione italiana</em>. Il testo del collegamento sembra scritto da <a title="Yoda Cat (I Can Has Cheezburger?) - Simone Carletti's Blog" href="http://www.simonecarletti.it/blog/2008/02/yoda-cat-i-can-has-cheezburger/">Yoda</a>.</p>
<p>Related posts:<ol>
<li><a href='http://www.simonecarletti.it/blog/2007/08/sei-alla-ricerca-di-un-modo-per-disabilitare-i-risultati-personalizzati-di-google/' rel='bookmark' title='Sei alla ricerca di un modo per disabilitare i risultati personalizzati di Google?'>Sei alla ricerca di un modo per disabilitare i risultati personalizzati di Google?</a></li>
<li><a href='http://www.simonecarletti.it/blog/2007/03/38-faq-su-google-e-la-censura-dei-risultati/' rel='bookmark' title='38 FAQ su Google e la censura dei risultati'>38 FAQ su Google e la censura dei risultati</a></li>
<li><a href='http://www.simonecarletti.it/blog/2007/01/google-restituisce-i-risultati-in-0-secondi/' rel='bookmark' title='Google restituisce i risultati in 0 secondi'>Google restituisce i risultati in 0 secondi</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.simonecarletti.it/blog/2008/08/visualizza-tradotti-inglesi-risultati-per-la-ricerca-di/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Pensieri sparsi sul nuovo Microsoft Webmaster Center</title>
		<link>http://www.simonecarletti.it/blog/2008/08/pensieri-sparsi-sul-nuovo-microsoft-webmaster-center/</link>
		<comments>http://www.simonecarletti.it/blog/2008/08/pensieri-sparsi-sul-nuovo-microsoft-webmaster-center/#comments</comments>
		<pubDate>Fri, 08 Aug 2008 09:57:44 +0000</pubDate>
		<dc:creator>Simone Carletti</dc:creator>
				<category><![CDATA[Motori di Ricerca]]></category>
		<category><![CDATA[microsoft]]></category>
		<category><![CDATA[microsoft webmaster center]]></category>

		<guid isPermaLink="false">http://www.simonecarletti.it/blog/2008/08/pensieri-sparsi-sul-nuovo-microsoft-webmaster-center/</guid>
		<description><![CDATA[Alcuni pensieri sparsi sui recenti aggiornamenti al pannello Webmaster Center di Microsoft.]]></description>
			<content:encoded><![CDATA[<p>Interrompo questo (ahime) prolungato silenzio per condividere un paio di curiosità fresche fresche di giornata. <a title="Edit - Il blog di HTML.it" href="http://blog.html.it/">Edit</a> è in pausa estiva, dunque colgo l&#8217;occasione per rinfrescare un po&#8217; con nuovi contenuti queste pagine.</p>
<p>La novità della settimana è che <a title="Live Search : Improve your site's standing with new Webmaster tools" href="http://blogs.msdn.com/livesearch/archive/2008/08/06/improve-your-site-s-standing-with-new-webmaster-tools.aspx">Live Search ha migliorato il pannello Webmaster Tools</a>. Non potevo farmi sfuggire l&#8217;occasione di curiosare le novità, dopo essere stato profondamente deluso dall&#8217;inusabilità dello strumento fino ad oggi, già espressa nel recente <a title="Aggiornamento alla Guida Sitemap |  Edit - Il blog di HTML.it" href="http://blog.html.it/22/07/2008/aggiornamento-alla-guida-sitemap/">aggiornamento</a> della <a title="Guida Sitemap | Guide Web marketing | Webmarketing.HTML.it" href="http://webmarketing.html.it/guide/leggi/137/guida-sitemap/">Guida Sitemap</a> per HTML.it.</p>
<p><span id="more-731"></span></p>
<h2>Impressioni sul nuovo Webmaster Center</h2>
<p>Cominciamo dal nome. Ma si chiama Webmaster Center o Webmaster Tools?<br />
Non che sia un problema esistenziale ma sono già confuso prima ancora di cominciare. Il blog <a title="Live Search: Tutto più facile con i nuovi Webmaster Tools" href="http://msnsearchitalia.spaces.live.com/Blog/cns!9AB045E18822860B!318.entry">italiano</a> ed <a title="Live Search : Improve your site's standing with new Webmaster tools" href="http://blogs.msdn.com/livesearch/archive/2008/08/06/improve-your-site-s-standing-with-new-webmaster-tools.aspx">internazionale</a> preferiscono <em>Tools</em> ma il <a title="Live Search Webmaster Center Blog : Big Update to Webmaster Tools" href="http://blogs.msdn.com/webmaster/archive/2008/08/06/live-search-webmaster-tools-update.aspx">blog ufficiale</a> si dichiara <em>Center</em> così come il sito stesso (<em>che però dichiara Signup to use the tools</em>).<br />
Ok, ci rinuncio. Sappiate che indipentemente da Center o Tools, sto parlando di <a title="Webmaster Center - Live Search" href="http://webmaster.live.com/">lui</a>.</p>
<p>Passiamo alle cose meno frivole. La mia prima impressione è che, riguardo a Webmaster Tools, Microsoft stia tentando di continuare ad inseguire Google.<br />
Nulla di male in realtà, il pannello di controllo di Google per Webmaster è senza dubbio uno strumento eccellente e sarei ben felice di poter disporre di funzionalità simili anche per Live.<br />
Purtroppo, come in tutti i casi dove si rincorre qualcuno, si rischia di lasciare indietro dei pezzi riducendo di gran lunga la qualità del risultato.</p>
<p>Cominciamo dall&#8217;usabilità. Poco o nulla è cambiato dalla prima release ed il pannello non è certo un esempio di usabilità.</p>
<p><img class="aligncenter size-full wp-image-2992" title="overview" src="http://www.simonecarletti.it/blog/wp-content/uploads/2008/08/overview.png" alt="overview" width="400" height="242" /></p>
<p>Oltre ad un layout discutibile, sarebbe utile poter disporre della lista dei domini registrati sempre a portata di mano per saltare rapidamente da uno all&#8217;altro. Se proprio vogliamo fare le cose per bene, cambiare dominio dovrebbe portarmi nella stessa sezione in cui mi trovo per il dominio corrispondente.</p>
<p>Carino il nuovo <a title="HTTP Compression and HTTP Conditional Get test tool (beta)" href="http://www.microsoft.com/search/Tools/default.aspx">HTTP verifier</a>. Semplice, essenziale ma funzionale.<br />
Anche in questo caso lo strumento non brilla certo di intuitività e qualcosa mi dice che continuerò ad utilizzare <a title="HTTP Headers Analyzer" href="http://www.simonecarletti.com/tools/http-analyzer/">prodotti</a> <a title="HTTP Headers Status Checker" href="http://www.simonecarletti.com/tools/http-checker">casalinghi</a>. Inutile sottolineare come sarebbe bello che i due nuovi tool HTTP verifier e Keyword research tool fossero integrati <span style="text-decoration: line-through;">un po&#8217; meglio</span> invece di spedire l&#8217;utente a spasso per siti Microsoft facendogli abbandonare l&#8217;interfaccia di Webmaster Center. La sensazione che ne deriva è quasi come se quegli strumenti fossero stati messi lì per sport, giusto per riempire quella desolata barra laterale che in un monitor &gt; 1024&#215;768 appare vuota come Riccione a novembre.</p>
<p>Mi sbaglierò, ma ancora non ho un posto dove trovare la lista delle Sitemap segnalate. E se l&#8217;intendo è quello di usare il campo <em>Sitemap address</em> allora non mi è chiaro come fare ad infilare in quell&#8217;input text più di un URL senza dover per forza ricorrere ad una <a title="Specifiche formato XML delle Sitemap - Specifiche XML Sitemap" href="http://sitemaps.specifiche.it/protocol.htm#index">Sitemap Index</a>.</p>
<p>Finalmente è disponibile la sezione Crawl issue. I dati possono essere consultati e scaricati in formato CSV.<br />
Irrazionale il pannello Sitemaps disponibile come ultima voce. La sezione (apparentemente) non è stata modificata dalla precedente release e questo mi convince ancora di più dell&#8217;inusabilità del sistema.<br />
Perché mai il campo <em>Sitemap address</em> prima menzionato si trova sotto <em>Profile</em> e non sotto <em>Sitemaps</em>. Non che sotto <em>Profile</em> non ci possa stare, ma a questo punto proporrei di re-organizzare un po&#8217; meglio la gestione delle informazioni.</p>
<h2>In conclusione</h2>
<p>Ci sono un paio di altre considerazioni degne di nota ma vedrò di dedicargli due righe in qualche altro post.<br />
Nel frattempo, concludo confermando la mia sensazione iniziale di delusione. In sei mesi circa, periodo dall&#8217;ultimo aggiornamento di Webmaster Center, le novità sono poco più che una confusione di strumenti messi a disposizione con un limitato ordine logico.</p>
<p>La sensazione che questo pannello mi trasmette è quella di uno sviluppo confusionario dove manca un&#8217;attenzione verso l&#8217;utilizzatore finale.<br />
Manca una visione d&#8217;insieme degli strumenti, manca una capacità di relazionarli tra loro in modo utile, come se l&#8217;obiettivo fosse solo far vedere che si offre qualcosa senza conoscere il cliente al quale si va ad offrire il prodotto e senza essersi mai seduto a tavolino con il cliente (che per inciso sono i SEO) per sincerarsi che il team di sviluppo fosse sulla strada giusta.</p>
<p>Mi auguro un&#8217;inversione di rotta nel futuro e spero che Microsoft decida di investire maggiormente nello sviluppo di questo strumento. Non posso che notare, da un paio d&#8217;anni a questa parte, una straordinaria tendenza di alcuni rami di quest&#8217;azienda all&#8217;apertura ed al confronto (si pensi ad esempio all&#8217;evoluzione di Internet Explorer). Questo è un segnale positivo, tuttavia senza gli adeguati investimenti c&#8217;è il rischio che molti buoni propositi cadano nel dimenticatoio.<br />
Nel frattempo, credo che continuerò a non utilizzare Webmaster Center dato che per ora non ne vedo un reale valore aggiunto.</p>
<p>Related posts:<ol>
<li><a href='http://www.simonecarletti.it/blog/2007/04/microsoft-webmaster-tools-a-quando-forse-presto/' rel='bookmark' title='Microsoft Webmaster Tools&#8230; a quando? Forse presto?'>Microsoft Webmaster Tools&#8230; a quando? Forse presto?</a></li>
<li><a href='http://www.simonecarletti.it/blog/2007/08/google-webmaster-central-rimuove-il-post-non-english-domain-names/' rel='bookmark' title='Google Webmaster Central rimuove il post &#8220;non-English domain names&#8221;'>Google Webmaster Central rimuove il post &#8220;non-English domain names&#8221;</a></li>
<li><a href='http://www.simonecarletti.it/blog/2007/11/live-search-webmaster-portal-beta/' rel='bookmark' title='Live Search Webmaster Portal Beta'>Live Search Webmaster Portal Beta</a></li>
</ol></p>]]></content:encoded>
			<wfw:commentRss>http://www.simonecarletti.it/blog/2008/08/pensieri-sparsi-sul-nuovo-microsoft-webmaster-center/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

