Publié par Malaiac le 18 avril 2009

1 milliard de pages web

ClueWeb 09, un dataset d’un milliard de pages web. 5 Téraoctets compressés. Ouch.

    View Comments

  1. sid dit :

    Bonne cuvée 2009 ! Ca tient sur une dédibox ? :)
    890$ le set complet pour deux mois de crawl, par contre, c’est récent.

Post your comments

You must be logged in to post a comment.

blog comments powered by Disqus
Web Statistics
51 requêtes en 0,641 secondes.