Не следует путать с arXiv.org — крупнейшим архивом электронных публикаций по точным и естественным наукам.
Internet Archive
Internet Archive logo and wordmark.svg
Internet Archive mirror servers - Bibliotheca Alexandrina.jpg
URL archive.org
Коммерческий нет
Тип сайта универсальная электронная библиотека
Язык(-и) английский
Расположение сервера  США
 Египет
 Нидерланды
Владелец Internet Archive
Автор Брюстер Кейл[1]
Начало работы 24 января 1996 года
Текущий статус работает
Оборот
Число сотрудников
  • 200 чел.
Слоган universal access to all knowledge
Рейтинг Alexa
 169 (20 июня 2020)[2]
Commons-logo.svg Медиафайлы на Викискладе

Архи́в Интерне́та (англ. Internet Archive) — некоммерческая организация, основанная в 1996 году в Сан-Франциско Брюстером Кейлом. Архив собирает копии веб-страниц, графические материалы, видео- и аудиозаписи и программное обеспечение. Архив обеспечивает долгосрочное архивирование собранного материала и бесплатный доступ к своим базам данных для широкой публики. Декларируемой целью Архива является сохранение культурно-исторических ценностей цивилизации в эпоху интернет-технологий, создание и поддержка электронной библиотеки. По состоянию на октябрь 2012 года размер Архива — 10 петабайт[4], на октябрь 2016 года — 15 петабайт[5], на март 2019 года — 45 петабайт[6]. По состоянию на август 2016 года содержит 502 млрд копий веб-страниц. Сервер Архива расположен в Сан-Франциско, зеркала — в Новой Александрийской библиотеке и в Амстердаме. С 2007 года Архив имеет юридический статус библиотеки[7].

История

Архив был создан Брюстером Кейлом в 1996 году примерно в то же время, когда он основал компанию Alexa Internet, занимающуюся сбором статистики о посещаемости веб-сайтов. В октябре того же года организация начала архивировать и хранить копии веб-страниц[8]. Сохранённые копии не были доступны для широкой публики до создания в 2001 году веб-сервиса Wayback Machine. С конца 1999 года Архив начал расширение за пределы веб-архива и в настоящее время, помимо копий веб-сайтов, включает в себя тексты, видео, звукозаписи, программное обеспечение и изображения.

Проекты

Wayback Machine

Логотип Wayback Machine

The Wayback Machine — веб-сервис Архива. Содержание веб-страниц время от времени фиксируется c помощью бота или при ручном указании посетителем сайта адреса страницы для фиксации. Таким образом, можно посмотреть, как выглядела та или иная страница раньше, даже если она больше не существует.

Легальность

На сервис не раз подавались судебные иски в связи с тем, что публикация контента может быть нелегальной. По этой причине сервис удаляет материалы из публичного доступа по требованию их правообладателей или, если доступ к страницам сайтов не разрешён в файле robots.txt владельцами этих сайтов.

Книга, изготовленная в течение 20 минут в рамках проекта Book-on-demand, на основе электронной книги из Архива

В 2002 году часть архивных копий веб-страниц, содержащих критику саентологии, была удалена из архива[9] с пояснением, что это было сделано по «просьбе владельцев сайта»[10]. В дальнейшем выяснилось, что этого потребовали юристы Церкви саентологии, тогда как настоящие владельцы сайта не желали удаления своих материалов[11]. Некоторые пользователи сочли это проявлением интернет-цензуры.

Сервис веб-архива может использоваться в качестве меры борьбы с блокировками доступа к сайтам: как и сервис кэшированных копий страниц от поисковых систем, Архив Интернета позволяет ознакомиться с более ранними копиями популярных страниц. Однако использование Архива и кэшей в таких целях требует специальных усилий от пользователя и позволяет получить доступ не ко всем сайтам[12].

Open Library

Основная статья: Open Library
Книжный сканер Архива

Open Library — общественный проект по сканированию всех книг в мире, к которому приступила Internet Archive в октябре 2005 года. На февраль 2010 года библиотека содержит в открытом доступе 1 миллион 165 тысяч книг, в каталог библиотеки занесено больше 22 млн изданий. По данным на 2008 год, Архиву принадлежат 13 центров оцифровки в крупных библиотеках. По оценке Internet Archive на ноябрь 2008 года, коллекция составила более 0,5 петабайта, включая изображения и документы в формате PDF[13]. Коллекция постоянно растёт, так как библиотека сканирует около 1000 книг в день.

Scan-on-demand — бесплатная оцифровка желаемых публикаций из фондов Бостонской общественной библиотеки, относится к проекту «Открытая библиотека».

Собрание фильмов, аудио, текстов и программного обеспечения, которые являются общественным достоянием или распространяются под лицензией Creative Commons.

Награды

23 марта 2010 года Архив Интернета назван победителем в номинации Project of Social Benefit ежегодной премии Free Software Awards, организованной некоммерческим фондом Free Software Foundation (FSF)[14][15].

Блокировка Архива Интернета

В России

Images.png Внешние изображения
Image-silk.png Страница сайта Роскомнадзора с сообщением о блокировке страницы «Одиночный джихад»

В октябре 2014 года Роскомнадзор заблокировал на территории РФ доступ к некоторым страницам Архива Интернета за видеоролик «Звон мечей» экстремистской группировки «Исламское государство Ирака и Леванта» (нынешнее название — «Исламское государство»). Ранее блокировались только ссылки на отдельные материалы в архиве, однако 24 октября 2014 года в реестр запрещённых сайтов временно был включён сам домен и его IP-адрес[16][17][18].

16 июня 2015 года на основании статьи 15.3 закона «Об информации, информационных технологиях и о защите информации» генпрокуратура РФ приняла решение о блокировке страницы «Одиночный джихад в России», содержащей, по её мнению, «призывы к массовым беспорядкам, осуществлению экстремистской деятельности, участию в массовых мероприятиях, проводимых с нарушением установленного порядка»[18][19][20], в действительности на территории России был заблокирован доступ ко всему сайту, кроме The Wayback Machine.

С апреля 2016 года Роскомнадзор решил убрать сайт из блокировок, и он доступен в России.

По состоянию на 22 августа 2019 года в Мосгорсуде находятся на рассмотрении иски Ассоциации по защите авторских прав в интернете (АЗАПИ), в которых заявлено требование о блокировке интернет-портала archive.org на территории России в связи с нарушениями авторских прав[21].

В других странах СНГ

Архив Интернета был заблокирован на территории Казахстана в 2015 году[22] (по состоянию на 25 февраля 2021 года сайт остаётся недоступным для казахстанцев).

Также в 2017 году сообщалось о блокировках Архива Интернета в Киргизии[23].

archive.org также заблокирован на территории Таджикистана[источник не указан 57 дней].

В Индии

В Индии Архив был частично заблокирован судебным решением в августе 2017 года. Решение Madras High Court перечисляло 2,6 тыс. адресов в сети Интернет, которые способствовали пиратскому распространению ряда фильмов двух местных кинокомпаний[24][25]. Представители проекта безуспешно пытались связаться с министерствами[26][27].

См. также

  • История Интернета
  • Архивирование веб-сайтов
  • Archive.today
    1. Internet Archive: Bios (англ.) IA.
    2. archive.org Competitive Analysis, Marketing Mix and Traffic - Alexa (англ.). Alexa Internet. — Глобальный рейтинг сайта archive.org. Дата обращения: 20 июня 2020.
    3. https://projects.propublica.org/nonprofits/organizations/943242767
    4. 10,000,000,000,000,000 bytes archived!. Архивировано 28 ноября 2012 года.
    5. Defining Web pages, Web sites and Web captures.
    6. Donate to the Internet Archive! (англ.). archive.org. Дата обращения: 28 марта 2019.
    7. Internet Archive officially a library. Internet Archive (7 мая 2007). Дата обращения: 31 августа 2016.
    8. Internet Archive: In the Collections (недоступная ссылка). Wayback Machine (6 июня 2000). Дата обращения: 1 сентября 2016. Архивировано 6 июня 2000 года.
    9. Bowman, Lisa M. Net archive silences Scientology critic, CNET News.com (24 сентября 2002). Архивировано 16 июля 2012 года. Дата обращения 4 января 2007.
    10. Jeff. exclusions from the Wayback Machine (Blog). Wayback Machine Forum. Internet Archive (23 сентября 2002). Дата обращения: 4 января 2007. Архивировано 25 августа 2011 года. Author and Date indicate initiation of forum thread
    11. Miller, Ernest Sherman, Set the Wayback Machine for Scientology (Blog). LawMeme. Yale Law School (24 сентября). Дата обращения: 4 января 2007. Архивировано 25 августа 2011 года. The posting is billed as a 'feature' and lacks an associated year designation; comments by other contributors appear after the 'feature'
    12. Maximillian Dornseif. Government mandated blocking of foreign Web content (англ.). preprint cs/0404005 16. arXiv (2004). Дата обращения: 26 ноября 2017.
    13. Bulk Access to OCR for 1 Million Books, via Open Library Blog, by raj, 24 ноября 2008.. Архивировано 28 ноября 2012 года.
    14. Free Software Awards Announced. Архивировано 28 ноября 2012 года.
    15. Стали известны номинанты ежегодной награды Free Software Awards (недоступная ссылка). Дата обращения: 17 сентября 2017. Архивировано 18 июля 2011 года.
    16. Производится блокировка экстремистского видео террористической организации «Исламское государство Ирака и Леванта» в сети Интернет. Роскомнадзор (24 октября 2014).
    17. Роскомнадзор внёс «архив интернета» в реестр запрещённых сайтов // Meduza. — 2014. — 25 октября.
    18. 1 2 Роскомнадзор заблокировал архив интернета // РБК. 25 июня 2015 года.
    19. Роскомнадзор заблокировал страницу «архива интернета» за экстремизм // Lenta.ru. 25 июня 2015 года.
    20. Роскомнадзор заблокировал архив интернета из-за «Одиночного джихада» // Московский комсомолец. 25 июня 2015 года.
    21. АЗАПИ хочет навечно заблокировать «Архив интернета» // РосКомСвобода. — 2014. — 22 августа.
    22. Xenia Voronina. Experts explain reason for websites blocking in Kazakhstan (англ.), Республиканская газета «Казахстанская правда» (21 October 2015). Дата обращения 26 ноября 2017.
    23. Kyrgyzstan Blocks Archive.org on ‘Extremism’ Grounds (англ.), Global Voices advox (21 July 2017). Дата обращения 26 ноября 2017.
    24. 'Bollywood blocks the Internet Archive' - BBC News
    25. Access to Internet Archive’s Wayback Machine Blocked in India
    26. Statement and Questions Regarding an Indian Court’s Order to Block archive.org | Internet Archive Blogs
    27. Update: Internet Archive contacted Indian govt regarding the block, but got no response - MediaNama

    Литература

    • Алексей Кутовенко. Всё прошлое интернета // UPgrade : журнал. — 2011. — № 21 (525). — С. 40—41. — ISSN 1680-4694.
    • Алексей Кутовенко.
      • Архив Интернета. Архивировано 28 ноября 2012 года.
      • Оцифровка книг: общественный проект (недоступная ссылка). webplanet.ru (27 октября 2005). Архивировано 12 апреля 2012 года.
      • Крупнейший интернет-архив обзавёлся новым дата-центром. Lenta.ru (20 марта 2009).

      Зеркала

      • Зеркало в Александрии. Архивировано 28 ноября 2012 года.
Яндекс.Метрика