Архів Інтернету

Не слід плутати з arXiv.org - найбільшим архівом електронних публікацій з точних і природничих наук.

Архів Інтернету ( англ. Internet Archive ) - Некомерційна організація, заснована в 1996 році в Сан-Франциско Брюстером Кейла. Архів збирає копії веб-сторінок, графічні матеріали, відео-, аудіозаписи та програмне забезпечення. Архів забезпечує довгострокове архівування зібраного матеріалу та безкоштовний доступ до своїх баз даних для широкої публіки. Декларованою метою Архіву є збереження культурно-історичних цінностей цивілізації в епоху інтернет-технологій, створення і підтримка електронної бібліотеки. Розмір Архіву - 10 петабайт [1]. Він містить 85 мільярдів веб-сторінок. [2] Сервер Архіву розташований в Сан-Франциско, дзеркала - в Нової Олександрійській бібліотеці і Амстердамі. З 2007 р. Архів має юридичний статус бібліотеки.


1. Проекти

  • The Wayback Machine - веб-сервіс Архіву. Зміст веб-сторінок фіксується з часовим проміжком c допомогою бота. Таким чином, можна подивитися, як виглядала та чи інша сторінка раніше, навіть якщо вона більше не існує. У 2002 році частина архівних копій веб-сторінок, що містять критику саєнтології, була видалена з архіву [3] з поясненням, що це було зроблено по "прохання власників сайту" [4]. Надалі з'ясувалося, що цього зажадали юристи Церкви Саєнтології, тоді як справжні власники сайту не бажали видалення своїх матеріалів [5]. Деякі визнали це інтернет-цензурою.
  • Збори фільмів, аудіо, текстів і програмного забезпечення, які є суспільним надбанням чи захищені ліцензією Creative Commons.
Книжковий сканер Архіву
  • Open Library C жовтня 2005 р. Internet Archive приступила до суспільного проекту " Open Library "по скануванню всіх книг у світі. На лютий 2010 року бібліотека містить у відкритому доступі 1165000 книг, в каталог бібліотеки занесено більше 22 млн видань. За даними на 2008 рік Архіву належить 13 центрів оцифровки у великих бібліотеках. За оцінкою Internet Archive на листопад 2008 року, колекція склала більше 0,5 петабайт, включаючи зображення і документи у форматі PDF [6]. Колекція постійно зростає, так як бібліотека сканує близько 1000 книг в день.
  • Scan-on-demand - безкоштовна оцифровка бажаних публікацій з фондів Бостона громадської бібліотеки, ставиться до проекту "Відкрита бібліотека"
Книга, виготовлена ​​протягом 20 хвилин в рамках проекту Book-on-demand, на основі електронної книги з Архіву

2. Нагороди

23 березня 2010 року Архів Інтернету названий переможцем у номінації Project of Social Benefit щорічної премії Free Software Awards, організованої некомерційним фондом Free Software Foundation (FSF). [7] [8]

Примітки

  1. bytes archived! - blog.archive.org/2012/10/26/10000000000000000-bytes-archived /. Читальний - www.webcitation.org/6CV4cmtmR з першоджерела 28 листопада 2012.
  2. Найбільший інтернет-архів обзавівся новим дата-центром - www.lenta.ru/news/2009/03/20/wayback/. Lenta.ru. Читальний - www.webcitation.org/61CZQRtv4 з першоджерела 25 серпня 2011.
  3. Bowman, Lisa M. Net archive silences Scientology critic - news.com.com/2100-1023-959236.html, CNET News.com (24 вересня 2002 р).
  4. Jeff exclusions From The Wayback Machine - www.archive.org/iathreads/post-view.php?id=778 (Blog). Wayback Machine Forum. Internet Archive (23 вересня 2002 р.). Читальний - www.webcitation.org/61CZRWc49 з першоджерела 25 серпня 2011. Author and Date indicate initiation of forum thread
  5. Miller, Ernest Sherman, Set the Wayback Machine for Scientology - research.yale.edu / lawmeme / modules.php? name = News & file = article & sid = 350 (Blog). LawMeme. Yale Law School (24 вересня). Читальний - www.webcitation.org/61CZZkNQ2 з першоджерела 25 серпня 2011. The posting is billed as a 'feature' and lacks an associated year designation; comments by other contributors appear after the 'feature'
  6. Bulk Access to OCR for 1 Million Books, via Open Library Blog, by raj, 24 листопада 2008. - blog.openlibrary.org/2008/11/24/bulk-access-to-ocr-for-1-million-books / . Читальний - www.webcitation.org/6CV4dbkun з першоджерела 28 листопада 2012.
  7. Free Software Awards Announced - www.fsf.org/news/2009-free-software-awards. Читальний - www.webcitation.org/6CV4egivg з першоджерела 28 листопада 2012.
  8. Стали відомі номінанти щорічної нагороди Free Software Awards - biz.cnews.ru / news / line / index.shtml? 2010/03/24/384064. Читальний - www.webcitation.org/6CV4ffeIm з першоджерела 28 листопада 2012.