Открывается архив Интернета

        Сегодня открывается интернет-архив, содержащий больше текста, чем какая-либо библиотека мира. Он предоставит пользователям почти всю возможную информацию, которая была опубликована в cети за последние 5 лет.
        Архив, названный Wayback Machine, содержит в себе более 10 миллиардов страниц, включая те, которые к настоящему моменту исчезли из Интернета. В архиве можно проследить процесс эволюции/смены дизайна многих сайтов. Проект, который создавался пять лет и стоил многие миллионы долларов, содержит более 100 терабайт информации и размещается на 300 компьютерах.
        Для пополнения информации архив использует "боты", которые "путешествуют" по cети, перебираясь с линка на линк и тем самым собирают новую информацию. Сайты, требующие авторизации или блокирующие боты, не рассматриваются. Архив пополняется каждые два месяца.
        Надо отметить, что после нескольких часов работы сайт, не выдержав нагрузки, закрылся. Будем надеяться, что временно.

Новости партнеров

Выбор читателей