Share to: share facebook share twitter share wa share telegram print page

End of Term Web Archive

Mosaïque géologique de l'Amérique du Nord : une version de cette carte de l'Institut d'études géologiques des États-Unis a été archivée par l'université du Nord du Texas, partenaire du projet lors de l'archivage de fin de mandat 2008.

L'End of Term Web Archive, littéralement en français : Archive Web de fin de mandat, est un projet d'archivage qui conserve les sites web du gouvernement fédéral américain lors des changements d'administration[1].

Contexte

L'End of Term Web Archive est créée à la suite d'une annonce faite en 2008 par la National Archives and Records Administration (NARA) indiquant qu'elle n'archiverait pas les sites Web gouvernementaux pendant la période de transition (en), après avoir agit de la sorte en 2000 et 2004[2]. La collecte fédérale de 2004 est accessible parallèlement aux collectes du Congrès, qui débutent à partir du 109e congrès des États-Unis, aux Archives nationales américaines[3].

Les premiers partenaires du projet étaient la bibliothèque du Congrès, les bibliothèques de l'université George-Washington, les bibliothèques de l'université Stanford, les bibliothèques de l'université du nord du Texas (en), le Bureau d'impression du gouvernement des États-Unis, la bibliothèque numérique de Californie (en) et Internet Archive, tous membres du Consortium international pour la préservation de l'internet. Le projet est initialement esquissé après une assemblée générale de l'IIPC en 2008[4]. La NARA et l'Environmental Data & Governance Initiative (EDGI) se sont jointes au projet respectivement en 2020 et 2021[5],[6].

Projet

Le projet archive les sites Web et les documents à des fins d'accès public et de recherches[7]. Les données issues de l'archivage des ensembles de données de fin de mandat de 2008, 2012, 2016 et 2020 peuvent être téléchargées en masse[8]. En , les ensembles de données de 2004 sont toujours en cours d'inventaire et il est prévu de transférer une copie de tous les ensembles de données vers Amazon Web Services[8]. Une étude de l'UNT sur les risques liés aux fichiers documentaires a révélé que 83 % des fichiers PDF du domaine .gov en 2008 avaient disparu quatre ans plus tard[9]. Cela est conforme à l'obligation de gérer les sites web, mais leur statut signifie que les modifications peuvent intéresser le public et les groupes de surveillance[10]. La preuve de la demande d'accès continu aux documents historiques publiés sur le Web peut être trouvée dans une annonce faite par l'Agence de protection de l'environnement des États-Unis en réponse aux préoccupations suscitées par les changements intervenus en 2017, indiquant que les pages de l'administration précédente seraient soigneusement archivées[11]. Ces pages instantanées ont été clairement identifiées afin de les distinguer du contenu contemporain[12].

Les archives donnent la priorité aux sites administrant des zones susceptibles d'être mises à jour ou supprimées pendant la période de transition[13]. Le public est encouragé à proposer des sites importants, qui sont ensuite combinés à des explorations approfondies des domaines gouvernementaux afin de constituer la collection[14],[15]. Bien qu'elle soit très complète (l'exploration de 2016 a permis de sauvegarder 11 382 sites web), elle n'est pas exhaustive[16],[17]. Les chercheurs ont utilisé ces collections pour examiner l'histoire de la politique en matière de changement climatique et la réutilisation des comptes Twitter suspendus du gouvernement américain[18],[19].

La collecte de 2024 débute en , avec un outil de nomination d'URL développé par l'université du nord du Texas[20],[21].

Notes et références

  1. (en) Jim Dwyer, « Harvesting Government History, One Web Page at a Time », The New York Times,‎ (lire en ligne, consulté le ).
  2. (en) Peter Webster, « Users, technologies, organisations: Towards a cultural history of world web archiving », Humanities Commons,‎ (lire en ligne, consulté le ).
  3. (en) « List of Web Harvests [données collectées] », sur le site webharvest.gov (consulté le ).
  4. (en) Tracy Seneca, Abbie Grotke, Cathy Nelson Hartman et Kris Carpenter, « It Takes a Village to Save the Web: The End of Term Web Archive », Documents to the people,‎ (lire en ligne [PDF], consulté le ).
  5. (en) « End of Term Web Archive », sur le site github.com (consulté le ).
  6. Site officiel
  7. (en) « End of Term Web Archive », sur le site eotarchive.org (consulté le ).
  8. a et b (en) « Datasets », sur le site eotarchive.org (consulté le ).
  9. (en) Courtney Gilmore, « UNT Part of Team Archiving Obama Administration Web Content », NBC DFW,‎ (lire en ligne, consulté le ).
  10. (en) « Website Monitoring », sur le site envirodatagov.org [lien archivé] (consulté le ).
  11. (en) Chris Mooney et Juliet Eilperin, « EPA website removes climate science site from public view after two decades », The Washington Post,‎ (lire en ligne, consulté le ).
  12. (en) « Climate Change [intantané] », sur le site epa.gov [lien archivé], (consulté le ).
  13. (en) « Guerrilla Archiving », sur le site politicsofevidence.wordpress.com (consulté le ).
  14. (en) James R. Jacobs, « Nominations sought for the U.S. Federal Government Domain End of Term 2020 Web Archive », Free Government Information,‎ (lire en ligne, consulté le ).
  15. (en) « End of Term Archive [Post sur X] », sur x.com, (consulté le ).
  16. (en) Ed Keefe, « How many .gov sites exist? Thousands », The Washington Post,‎ (lire en ligne, consulté le ).
  17. (en) Lauren J. Young, « The Librarians Saving The Internet », Science Friday,‎ (lire en ligne, consulté le ).
  18. (en) Toly Rinberg, Maya Anjur-Dietrich, Marcy Beck, Andrew Bergman, Justin Derry, Lindsey Dillon, Gretchen Gehrke, Rebecca Lave, Chris Sellers, Nick Shapiro, Anastasia Aizman, Dan Allan, Madelaine Britt, Raymond Cha, Janak Chadha, Morgan Currie, Sara Johns, Abby Klionsky, Stephanie Knutson, Katherine Kulik, Aaron Lemelin, Kevin Nguyen, Eric Nost, Kendra Ouellette, Lindsay Poirier, Sara Rubinow, Justin Schell, Lizz Ultee, Julia Upfal, Tyler Wedrosky et Jacob Wylie, « Changing the Digital Climate », 100days.envirodatagov.org,‎ (lire en ligne, consulté le ).
  19. (en) « Suspended U.S. government Twitter accounts », sur le site gwu-libraries.github.io, (consulté le ).
  20. (en) « End of Term Presidential Harvest 2024 », sur le site digital2.library.unt.edu (consulté le ).
  21. (en) « Announcing the 2024 End of Term Web Archive Initiative », sur le site records-express.blogs.archives.gov, (consulté le ).

Articles connexes

Liens externes

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya