Publié par Malaiac le 18 avril 2009

1 milliard de pages web

ClueWeb 09, un dataset d’un milliard de pages web. 5 Téraoctets compressés. Ouch.

  • sid
    Bonne cuvée 2009 ! Ca tient sur une dédibox ? :)
    890$ le set complet pour deux mois de crawl, par contre, c'est récent.
blog comments powered by Disqus
Web Statistics
47 requêtes en 1,170 secondes.