Internet Archive

Het huidige hoofdkantoor van het Internet Archive in een voormalige kerk in San Francisco
Internetondernemer Brewster Kahle, stichter van het Internet Archive

Internet Archive (Nederlands: internetarchief) is een website en project met als doel universele toegang te bieden tot alle menselijke kennis. Het project is begonnen door Brewster Kahle in 1996 en was gevestigd in het Presidio van San Francisco, Californië, Verenigde Staten.

Sinds november 2009 is het gehuisvest in een voormalige Christian Science-kerk in San Francisco.

Collectie

Het voormalige hoofdkantoor in het Presidio, een voormalig militair terrein, tot november 2009 de thuisbasis van het Internet Archive

De collectie omvat:

  • Kopieën van websites op het World Wide Web (Wayback Machine)
  • Boeken
  • Films
  • Geluidsopnames, waaronder opnames van liveconcerten van bands die dit toestaan
  • Software
  • Afbeeldingen

Wayback Machine

Kopie van het Internet Archive (in de Bibliotheca Alexandrina)

Het archief onderhoudt de Wayback Machine[1], met inhoud die gedoneerd wordt door Alexa Internet. Nadat een gebruiker een URL opgeeft, zorgt deze machine voor gearchiveerde versies van de website, door de jaren heen. In juni 2022 had Internet Archive meer dan 700 miljard webpagina's opgeslagen.[2]

Boeken en teksten

De grootste collectie die daarnaast door Internet Archive beschikbaar wordt gesteld, bestaat uit boeken en teksten. In juni 2016 stelde het meer dan 10 miljoen teksten online ter beschikking, waarvan 2,3 miljoen afkomstig waren uit Amerikaanse bibliotheken. Het totale aantal was in april 2022 opgelopen tot 38 miljoen.[3]

Veel boeken zijn publiek domein, en voor iedereen zonder belemmeringen beschikbaar in verschillende formaten, zoals pdf, DjVu, Epub, "full text" en als jp2.[4]

Veel andere boeken, waarvan de auteursrechten nog niet zijn verlopen, kunnen geleend worden middels een gratis account, rechtstreeks of via Open Library. Dit gedeelte is slechts in enkele talen zoals in het Engels, Duits, Spaans toegankelijk, en niet in het Nederlands. Er zijn ook nog slechts weinig Nederlandstalige boeken beschikbaar, maar des te meer Engelstalige.[5][6] Het totaal aantal boeken dat geleend kan worden bedroeg per april 2022 3,35 miljoen.[7]

Films

Internet Archive heeft onder de categorie Moving Images een gevarieerd aanbod aan audiovisueel materiaal. In juni 2016 bestond de collectie uit meer dan 2,5 miljoen films en filmpjes.[8]

Subcollecties van Moving Images zijn:

  • Animation & Cartoons: tekenfilms uit de jaren 30 en 40, computer- en 3D-animatie en zogenaamde Brick-films met Lego-mannetjes.
  • Arts & Music: materiaal van de (lokale) tv-programma's als Punkcast, GrooveTV, This or That! en Coffee House TV. Daarnaast ook ingezonden filmpjes.
  • Computers & Technology: Diverse programma's over de geschiedenis van computers en internet.
  • Cultural & Academic Films: Diverse documentaires, met veel materiaal over archeologie en sociale bewegingen.
  • Ephemeral Films: Educatie- promotie- en andere niet-entertainment-filmpjes. Hieronder vallen Britse oorlogspropaganda-filmpjes, reclames voor drive-inbioscopen, oude filmpjes uit San Francisco en een collectie amateurfilms, verzameld door Skip Elsheimer.
  • Movies: Hieronder vallen onder andere meer dan duizend bioscoopfilms die in het publieke domein zijn gevallen, en een verzameling filmtrailers.
  • News & Public Affairs: Nieuws- en actualiteiten. Hieronder een verzameling nieuwsopnames van de aanslagen van 11 september, programma's over de oorlog in Irak, het programma Democracy Now! en een verzameling toespraken van George W. Bush.
  • Non-English Videos: Een verzameling niet-Engelse video's. De talen van de meeste video's zijn Arabisch, Duits, Chinees, Frans, Italiaans, Japans en Spaans.
  • Open Source Movies: Ingezonden filmpjes met een Creative Commons-licentie. Met meer dan 72000 filmpjes de grootste collectie.
Filmkenner Rick Prelinger digitaliseerde meer dan 2000 filmpjes voor Internet Archive

Geluidsopnames

Onder de categorie "Audio" bevinden zich meer dan 2,9 miljoen geluidsopnames. De muzieksectie omvat grotendeels muziek van onafhankelijke artiesten, die zich laten vertegenwoordigen door zogenaamde netlabels. Daarnaast is er een grote collectie live-opnames van artiesten, die een open beleid voeren ten aanzien van geluidsopnames van hun concerten, zoals de Grateful Dead, Jefferson Starship, Ryan Adams, en Alejandro Escovedo. Verder zijn er collecties audioboeken, gedichten, hoorspelen en colleges te vinden.

Omvang en opslag

De totale omvang van het archief bedroeg in 2003 ongeveer 100 terabyte aan gegevens, met een groeicijfer van 12 terabyte per maand. In 2004 bereikte het een grootte van meer dan een petabyte, met een groeicijfer van 20 terabyte per maand. Dit is inclusief 40 miljard webpagina's. Een kopie van de gegevens wordt ook bijgehouden in de Bibliotheca Alexandrina in het Egyptische Alexandrië. In oktober 2012 werd de mijlpaal van 10 petabyte bereikt.[9]

Licenties

De meeste films, boeken en geluidsopnames vallen onder het publieke domein of vallen onder de Creative Commons-licentie.
De live-opnames van artiesten kunnen bestaan omdat die artiesten een open beleid voeren bij hun optredens, maar dat maakt de muziek zelf nog niet vrij van auteursrechten.

Zie ook

Externe links

Algemeen

  • (en) Internet Archive met de (en) Wayback Machine
  • European Web Archive, vergelijkbare dienst
  • (en) Open Library

Voorbeelden Wayback Machine

  • De Nederlandstalige Wikipedia op 19 oktober 2001 (alles: .com en .org)
Bronnen, noten en/of referenties
  1. De naam Wayback Machine komt uit een tekenfilmserie, genaamd The Rocky and Bullwinkle Show. De hond Mr. Peabody en zijn assistent, een jongen genaamd Sherman, gebruiken een tijdmachine, genaamd de WABAC Machine om beroemde gebeurtenissen uit het verleden te bezoeken.
  2. Voor een actuele opgave van het aantal opgeslagen websites, zie deze pagina (geraadpleegd 2022-06-28).
  3. Voor een actuele opgave van het aantal boeken en teksten in Internet Archive, zie deze pagina (geraadpleegd 2022-04-28).
  4. Een voorbeeld van een Nederlandstalig boek in het publieke domein: Charles Darwin (ca. 1890) — De reis van de "Beagle" ("voor Nederlanders bewerkt door Dr. H. Hartogh Heys van Zouteveen en Dr. T.C. Winkler").
  5. Een voorbeeld van een Nederlandstalig boek dat te leen is via Internet Archive: Bill Bryson (2003) — Een kleine geschiedenis van bijna alles (50e druk, 2020) dat na inloggen hier voor een uur beschikbaar is. Een ander voorbeeld, nu via Open Library: De Bijbel in twee edities van de nieuwe vertaling van 1951.
  6. Een voorbeeld van een Engelstalig boek, te leen op Internet Archive: Rachel Carson (1962) — Silent Spring, per april 2022 te leen in vijf edities. Gearchiveerd op 8 augustus 2023.
  7. Voor een actuele opgave van het aantal uitleenbare boeken bij Internet Archive: zie deze pagina. (geraadpleegd 2022-04-28).
  8. Moving Image Archive
  9. (nl) Internet Archive meldt mijlpaal van 10 petabyte. Gearchiveerd op 14 maart 2021.
Mediabestanden
Zie de categorie Internet Archive van Wikimedia Commons voor mediabestanden over dit onderwerp.