Leggendo i log ho scoperto… #4

August 25th, 2008 at 7:27 am • permalink1 comment

… che c’è un nuovo tipo di crawler in casa Yahoo! che si identifica come Mozilla/5.0 (Yahoo-MMCrawler/4.0; mailto:vertical-crawl-support@yahoo-inc.com).
La comparsa di questo bot risale alla prima settimana di Luglio 2008 e sembra prediligere esclusivamente file multimediali, nello specifico immagini.

68.142.212.211 - - [15/Aug/2008:02:57:14 -0700] "GET /robots.txt HTTP/1.0" 200 405 "-" "Mozilla/5.0 (Yahoo-MMCrawler/4.0; mailto:vertical-crawl-support@yahoo-inc.com)"
68.142.212.211 - - [15/Aug/2008:02:57:14 -0700] "GET /blog/public/2007/05/come-segnalare-phishing/opera-report-phishing-thumb.png HTTP/1.0" 200 85650 "-" "Mozilla/5.0 (Yahoo-MMCrawler/4.0; mailto:vertical-crawl-support@yahoo-inc.com)"

Questo crawler sembrerebbe aderire al protocollo di esclusione basato su robots.txt.

  1. Leggendo i log ho scoperto… #8 – iearthworm
  2. Leggendo i log ho scoperto… #5
  3. Leggendo i log ho scoperto… #7 – Proximic.com
  4. Leggendo i log ho scoperto… #3
  5. Leggendo i log ho scoperto… #6

Filed in Analytics • Tags: , , ,


Comments

[...] Yahoo sembrerebbe avere una collezione di crawler non documentati particolarmente ricca. Dopo il Yahoo-MMCrawler ed il bot travestito da utente, è la volta di iearthworm, un’altro misteriosa creatura di [...]

Add a Comment




Follow Me
    Random Quote