Leggendo i log ho scoperto… #10 – PDF Search Engine

November 3rd, 2008 at 7:01 am • permalink0 comments

PDFind.com, un motore di ricerca che non conoscevo specifico per l’indicizzazione di file PDF.

Il motore di ricerca dispone di un proprio crawler, chiamato PDFBot ed identificato dalla user agent PDFBot (crawler@pdfind.com).

83.233.122.64 - - [15/Aug/2008:02:27:53 -0700] "GET /robots.txt HTTP/1.0" 200 405 "-" "PDFBot (crawler@pdfind.com)"

Il crawler individua e scarica file pdf. Il motore di ricerca analizza i file, mantiene una copia cache ed indicizza i documenti nel proprio archivio. E’ possibile visualizzare un’anteprima del PDF direttamente online.

  1. Leggendo i log ho scoperto… #4
  2. Leggendo i log ho scoperto… #3
  3. Leggendo i log ho scoperto… #11 – Twingly Blog Search
  4. Leggendo i log ho scoperto… #5
  5. Leggendo i log ho scoperto… #8 – iearthworm

Filed in Analytics • Tags: , ,


Add a Comment




Follow Me
    Random Quote