Wayback Machine

Vikipēdijas lapa
Jump to navigation Jump to search

Wayback Machine ir digitāls Tīmekļa arhīvs un citas informācijas krātuve, rakstīta Java un Python programmēšanas valodās. 2001. gadā to izveidoja bezpeļņas organizācija Internet Archive, kas atrodas Sanfrancisko, Kalifornijā, ASV. Aleksas Tīmekļa vietņu pasaules reitingā šī vietne 2019. gada sākumā bija 253. vietā.[1]

"Wayback Machine" logotips

Vēsture[labot šo sadaļu | labot pirmkodu]

"Internet Archive" dibinātāji 2001.gadā radīja "Wayback Machine",[2][3] lai risinātu problēmas ar tīmekļa vietņu satura izzušanu, kad tā maina URL vai tiek slēgta. Serviss ļauj lietotājiem redzēt tīmekļa lapu arhivētās versijas, ko arhīvs sauc par "trīsdimensiju indeksu".[4] Viņi izveidoja servisu, cerot arhivēt visu internetu un nodrošināt "vispārēju piekļuvi visām zināšanām".[5]

"Wayback Machine" jau 1996. gadā sāka glabāt kešatmiņā glabātās tīmekļa lapas ar mērķi padarīt pakalpojumu publiski pieejamu piecus gadus vēlāk.[6] No 1996. līdz 2001. gadam informācijai nebija publiskas pieejas, lai gan veidotāji reizēm ļāva pētniekiem un zinātniekiem pameklēt vēl trūcīgajā datu bāzē.[7] Kad arhīvs 2001.gadā sasniedza piekto gadadienu, tas tika atklāts sabiedrībai ceremonijā Kalifornijas Universitātē Bērklijā.[8] Uz brīdi, kad "Wayback Machine" tika palaista oficiāli, tajā jau bija vairāk nekā 10 miljardi arhivēto lapu.

Mūsdienās dati tiek glabāti lielā "Internet Archive" klasterī Linux mezglā.[5] Mašīna pārskata un arhivē jaunas tīmekļa vietņu versijas.[9] Vietnes var arī ierakstīt manuāli, ievadot meklēšanas lodziņā vietnes URL, ja vietne ļauj Wayback Machine to "pārmeklēt" un saglabāt datus.[6] Serviss vairs nesavāc datus par visām vietnēm, izvēloties tās pēc sava algoritma.[9]

Tehniskas detaļas[labot šo sadaļu | labot pirmkodu]

Programmatūra tika izstrādāta, lai pārmeklētu Tīmekli un lejupielādētu visas publiski pieejamās tīmekļa vietnes, Gopher hierarhiju, Netnews (Usenet) ziņojumu dēļu sistēmu un lejupielādējamu programmatūru.[10] Šo "rāpuļprogrammu" apkopotā informācija neietvēra visu informāciju, kas pieejama internetā, jo lielāko daļu datu izplatību ierobežo to īpašnieki vai saglabā to datu bāzēs, kas nav publiski pieejamas. Lai pārvarētu nepilnīgi saglabātajās tīmekļa vietnēs, 2005. gadā "Internet Archive" izstrādāja "Archive-It.org", kas ļāva iestādēm un satura veidotājiem brīvprātīgi saglabāt digitālā satura kolekcijas un izveidot digitālos arhīvus.[11]

Pārmeklēšanu veic no dažādiem avotiem, no kuriem daži tiek importēti no trešām pusēm un citus ģenerē pats arhīvs.[9] "Worldwide Web Crawls" darbojas kopš 2010. gada un caurskata globālo Tīmekli.[12]

Vietņu un lappušu tveršanas biežums dažādās tīmekļa vietnēs atšķiras. Daļa vietņu ir iekļautas "pārmeklēšanas sarakstā", un vietne tiek arhivēta vairākkārtīgi. Vietnes pārmeklēšana var ilgt mēnešus vai pat gadus. Tomēr vietne var būt iekļauta vairāk nekā vienā pārmeklēšanas sarakstā, tāpēc top pārmeklēta biežāk un dziļāk.[9]

Uzglabāšanas apjoms un izaugsme[labot šo sadaļu | labot pirmkodu]

Tā kā tehnoloģijas gadu gaitā ir attīstījušās, "Wayback Machine" uzglabāšanas jauda ir palielinājusies. 2003.gadā pēc tikai divu gadu publiskās piekļuves "Wayback Machine" apjoms palielinājās par 12 terabaitiem mēnesī. Dati tika glabāti "Internet Archive" personāla izstrādātajās PetaBox plauktu sistēmās. Pirmais 100TB plaukts pilnībā sāka darboties 2004. gada jūnijā, taču drīz kļuva skaidrs, ka viņiem būs nepieciešams daudz vairāk uzglabāšanas vietas.[13][14]

"Internet Archive" 2009. gadā pārvietoja savu pielāgoto uzglabāšanas arhitektūru uz "Sun Open Storage" un saņēma jaunu datu centru "Sun Modular Datacenter" iekš "Sun Microsystems" Kalifornijas universitātē.[15] Kopš 2009. gada "Wayback Machine" saturēja aptuveni trīs petabaitus datu un katru mēnesi auga par 100 terabaitiem.[16]

2011. gadā publiskai testēšanai kļuva pieejama jauna, uzlabota "Wayback Machine" versija ar atjauninātu saskarni un jaunāku arhivētā satura rādītāju.[17] Šā gada martā "Wayback Machine" forumā tika ziņots, ka "jaunajā beta versijā ir pilnīgāks un aktuālāks indeksēto materiālu indekss, un tas tiks regulāri atjaunināts.”[18]

2013. gada janvārī uzņēmums paziņoja par sasniegto 240 miljardu URL robežu.[19] 2013. gada oktobrī uzņēmums radīja funkciju "Saglabāt lapu", kas ļauj jebkuram interneta lietotājam arhivēt URL saturu.[20]

Uz 2014. gada decembri "Wayback Machine" saturēja 435 miljardus tīmekļa lapu - gandrīz deviņus petabaitus datu, un tas palielinājās par aptuveni 20 terabaitiem nedēļā.[21][22][23] 2016. gada jūlijā tajā bija aptuveni 15 petabaitu datu,[24] bet 2018. gada septembrī vairāk nekā 25 petabaitu datu.[25][26]

Vietņu izslēgšanas politika[labot šo sadaļu | labot pirmkodu]

Vēsturiski "Wayback Machine" ir ievērojusi robotu izslēgšanas standartu (robots.txt), nosakot, vai vietne tiks pārmeklēta vai nē. Tīmekļa vietņu īpašniekiem bija iespēja atteikties no "Wayback Machine", izmantojot robots.txt. Tā piemēroja robots.txt noteikumus ar atpakaļejošu datumu; ja vietne bloķēja arhīvu, visas iepriekš arhivētās lapas no domēna nekavējoties tika izņemtas.[27] Turklāt "Internet Archive" norādīja, ka "dažreiz tīmekļa vietnes īpašnieks sazinās ar mums tieši un lūdz mūs pārtraukt vietnes pārmeklēšanu vai arhivēšanu. Mēs izpildām šādus pieprasījumus." Viņu tīmekļa vietnē teikts: ""Internet Archive" nav ieinteresēts saglabāt vai piedāvāt piekļuvi tīmekļa vietnēm vai citiem Interneta dokumentiem personām, kuras nevēlas savu materiālu vākšanu."[28][29] Tomēr kopš 2017. gada arhīvs sācis ignorēt standartu robots.txt, īpaši attiecībā uz ASV iestāžu vietnēm.[30][31][32][33]

Lietošana[labot šo sadaļu | labot pirmkodu]

Kopš 2001. gada publiskās atklāšanas studenti un zinātnieki ir pētījuši gan to, kā "Wayback Machine" tiek glabāti un apkopoti dati, gan tās arhīvā esošās lapas. 2013. gadā bija uzrakstīti aptuveni 350 pētnieciski raksti par "Wayback Machine", galvenokārt par informācijas tehnoloģiju, bibliotēku zinātnes un sociālās zinātnes jomām. Sociālo zinātņu pētnieki ir izmantojuši "Wayback Machine", lai analizētu, kā tīmekļa vietņu attīstība no 90. gadu vidus līdz mūsdienām ir ietekmējusi uzņēmuma izaugsmi.[22]

Kad "Wayback Machine" arhivē lapu, tā parasti ietver lielāko daļu hipersaišu, saglabājot tās saites aktīvas, lai tās netiktu bojātas ar interneta nestabilitāti. Zinātnieki Indijā pētīja "Wayback Machine" spēju saglabāt hipersaites tiešsaistes zinātniskajās publikācijās un konstatēja, ka tā saglabā nedaudz vairāk nekā pusi no tām.[34]

Žurnālisti izmanto "Wayback Machine", lai apskatītu mirušās vietnes, datētu ziņojumus un izmaiņas tīmekļa vietnes saturā. Tās saturs ir izmantots, lai uzspiestu politiķiem atbildību un atklātu melus.[35] Tā, 2014. gadā Ukrainas Donbasa separātistu līdera Igora Girkina arhivēta sociālā medija lapa apliecināja, ka viņš ar savu militāro grupu notriecis domājamu Ukrainas militāru lidmašīnu, pirms kļuva zināms, ka lidmašīna patiesībā bija civilā Malaizijas aviokompānijas lidmašīna; pēc tam viņš izdzēsa ziņojumu un vainoja Ukrainas armiju par lidmašīnas notriekšanu.[35][36] 2017. gada apmeklētāji archive.org bija atklājuši, ka visas atsauces uz klimata pārmaiņām ir pazudušas no Baltā nama tīmekļa vietnes.[37][38][39]

Turklāt vietne tiek izmantota verificēšanai, nodrošinot Vikipēdijas redaktoriem piekļuvi atsauču un satura veidošanai.

Ierobežojumi[labot šo sadaļu | labot pirmkodu]

Neskatoties uz tās iespējām, "Wayback Machine" ir arī daži svarīgi ierobežojumi. 2014. gadā bija sešu mēnešu kavēšanās laiks starp brīžiem, kad tīmekļa vietne ir pārmeklēta un kad tā ir pieejama skatīšanās mašīnā.[40] Pašlaik kavēšanās laiks ir no 3 līdz 10 stundām.[41] "Wayback Machine" nav "vēsturisks Google"; lietotājiem ir jāzina to vietņu URL, ko viņi vēlas redzēt.[42] Tajā ir funkcija "vietnes meklēšana", kas ļauj lietotājiem atrast vietni, pamatojoties uz vārdiem, kas apraksta vietni, nevis vārdiem, kas atrodami pašās tīmekļa lapās.

"Wayback Machine" neietver katru tīmekļa lapu, kas jebkad radīta, dēļ tās tīmekļa pārmeklēšanas ierobežojumiem. "Wayback Machine" nevar pilnībā arhivēt tīmekļa lapas, kurās ir interaktīvas funkcijas, piemēram, Flash platformas un JavaScript, jo šīm funkcijām ir nepieciešama mijiedarbība ar mītnes vietni. Viņu tīmekļa pārmeklētājam ir grūti iegūt visu, kas nav kodēts HTML (vai kādā no tā variantiem), kas bieži izraisa bojātas hipersaites un trūkstošus attēlus. Turklāt tīmekļa rāpuļprogramma nevar arhivēt "bāreņu lapas", kas nesatur saites uz citām lapām. Īpaši noteikumi, kas reglamentē "Wayback Machine" rāpuļprogrammu, var sekot tikai iepriekš noteiktam hipersaišu skaitam, pamatojoties uz iepriekš iestatītu dziļuma ierobežojumu, tāpēc tā nevar arhivēt katru hipersaiti katrā lapā.[43][12][42]

Daži īpašnieki savā tīmekļa vietnē ievieto robots.txt failu, kas parasti novērš "Wayback Machine" tās atklāšanu un arhivēšanu. Turklāt tīmekļa vietņu īpašnieki var arī tiešā kontaktā pieprasīt, lai viņu lapas tiktu izslēgtas no arhīva.[43]

Likumi[labot šo sadaļu | labot pirmkodu]

Civilprocesi[labot šo sadaļu | labot pirmkodu]

Netbula LLC pret Chordiant Software Inc.[labot šo sadaļu | labot pirmkodu]

2009. gada lietā "Netbula, LLC pret Chordiant Software Inc.", atbildētājs Chordiant iesniedza lūgumu piespiest Netbula atslēgt robots.txt failu savā tīmekļa vietnē, jo šis fails neļāva "Wayback Machine" publicēt arhivētās iepriekšējo lapu versijas Netbulas vietnē, kuras, pēc Chordiant uzskata, atbalstītu tās pozīciju.[44]

Netbula iebilda pret šo priekšlikumu, pamatojoties uz to, ka atbildētājiem vajadzētu tieši griezties pie "Internet Archive".[45] Tomēr "Internet Archive" darbinieks sniedza zvērinātu paziņojumu, atbalstot Chordiant ierosinājumu, norādot, ka tas nevar publicēt bloķētas tīmekļa lapas ar jebkādiem citiem līdzekļiem "bez ievērojama sloga, izdevumiem un darbības traucējumiem".[44]

Tiesnesis Hovards Loids noraidīja Netbulas argumentus un lika viņiem īslaicīgi atspējot robots.txt bloķēšanu, lai ļautu Chordiant ielādēt arhivētās lapas, ko viņi meklēja.[44]

Telewizja Polska[labot šo sadaļu | labot pirmkodu]

2004. gada oktobra lietā "Telewizja Polska USA, Inc. pret Echostar Satellite", lietas dalībnieks mēģināja izmantot "Wayback Machine" arhīvu kā pieņemamu pierādījumu avotu. Pirms tiesas procesa EchoStar norādīja, ka tā plāno piedāvāt "Wayback Machine" momentuzņēmumus kā pierādījumu par iepriekšējo Telewizja Polska tīmekļa vietnes saturu. Telewizja Polska cēla ierosinājumu, lai apturētu momentuzņēmumus, pamatojoties uz avota neautentificētību, bet maģistrāta tiesnesis Arlanders Kejs noraidīja šo ierosinājumu.[46][47] Tomēr tiesas procesā tiesnesis Ronalds Gusmans atcēla Keja secinājumus, norādīja, ka ne "Internet Archive" darbinieka apliecinājums, ne tā pamatā esošās lapas (t.i., arhivētā Telewizja Polska tīmekļa vietne) nav pieņemami kā pierādījumi. Tiesnesis Gusmans pamatoja savu lēmumu, ka darbinieka liecība bija nepietiekami pierādoša, un Tīmekļa lapas izdrukas nebija pašautentificējošas.

Patentu tiesības[labot šo sadaļu | labot pirmkodu]

Ja ir izpildītas dažas papildu prasības (piemēram, arhīvam sniedzot autoritatīvus paziņojumus), Amerikas Savienoto Valstu patentu birojs un Eiropas Patentu birojs pieņem datuma zīmogus no interneta arhīva kā pierādījumu tam, kad konkrētā tīmekļa lapa bijusi pieejama sabiedrībai. Šie datumi tiek izmantoti, piemēram, izskatot patenta pieteikumu.[48]

Lietderības ierobežojumi[labot šo sadaļu | labot pirmkodu]

Tīmekļa vietnes arhivēšanai ir tehniski ierobežojumi, un tādējādi pretējās puses tiesvedībā var ļaunprātīgi izmantot tīmekļa vietņu arhīvu rezultātus. Šo problēmu var saasināt prakse, kad sūdzību, atbilžu vai ekspertu liecību iesniegšanas laikā tiek parādīti tīmekļa lapu ekrānšāviņi, kad pamatā esošās saites nav parādītas un tādēļ var saturēt kļūdas. Piemēram, "Wayback Machine" neaizpilda veidlapas un tādēļ neietver daudzu e-komercijas datubāzu saturu savos arhīvos.[49]

Tiesiskais statuss[labot šo sadaļu | labot pirmkodu]

Eiropā "Wayback Machine" var tikt interpretēta kā autortiesību likumu pārkāpums. Tikai satura veidotājs var izlemt, kur tas tiek publicēts vai dublēts, tāpēc arhīvam pēc radītāja pieprasījuma būtu jāizdzēš lapas no sistēmas.[50][51]

Arhivētā satura juridiskie jautājumi[labot šo sadaļu | labot pirmkodu]

Vairākas lietas bijušas vērstas pret "Internet Archive", jo īpaši pret tā "Wayback Machine" arhivēšanas pasākumiem.

Scientoloģija[labot šo sadaļu | labot pirmkodu]

2002. gada beigās "Internet Archive" no "Wayback Machine" izņēma dažādas vietnes, kas kritizēja scientoloģiju.[52] Kļūdas paziņojumā tika norādīts, ka tā bija atbilde uz "vietnes īpašnieka pieprasījumu".[53] Vēlāk tika noskaidrots, ka juristi no scientoloģijas baznīcas bija pieprasījuši šo noņemšanu un ka tas noticis pretēji vietņu īpašnieku gribai.[54]

Healthcare Advocates, Inc.[labot šo sadaļu | labot pirmkodu]

2003. gadā "Harding Earley Follmer & Frailey" aizstāvēja klientu no strīdiem, kas saistīti ar preču zīmēm, izmantojot "Wayback Machine". Advokāti varēja pierādīt, ka prasītāja iesniegtie pieprasījumi bija nederīgi, pamatojoties uz viņu tīmekļa vietnes saturu vairākus gadus iepriekš. Prasītājs, "Healthcare Advocates", pēc tam grozīja savu sūdzību, lai iekļautu tajā "Internet Archive", apsūdzot to autortiesību pārkāpuma organizēšanā. Advokāti apgalvoja, ka, tā kā viņi savā tīmekļa vietnē bija instalējuši robots.txt failu, pat ja pēc sākotnējās tiesas prāvas iesniegšanas arhīvam bija jānoņem visas iepriekšējās prasītājas tīmekļa vietnes kopijas no "Wayback Machine", tomēr daži materiāli turpināja būt publiski redzami.[55] Lieta tika atrisināta ārpus tiesas, pēc tam, kad tika noteikta tehniskā problēma.[56]

Sjūzena Šela[labot šo sadaļu | labot pirmkodu]

Bērnu aizsardzības aktīviste Sjūzena Šela iesniedza prasību 2005. gada decembrī, pieprasot "Internet Archive" samaksāt 100 000 ASV dolāru par viņas tīmekļa vietnes profane-justice.org arhivēšanu no 1999. līdz 2004. gadam.[57][58] 2007. gada 25. aprīlī "Internet Archive" un Sjūzena Šela kopīgi paziņoja par viņu tiesas prāvas izšķiršanu.[57]

Daniels Davidjuks[labot šo sadaļu | labot pirmkodu]

Laikā no 2013. līdz 2016. gadam pornoaktieris Daniels Davidjuks mēģināja noņemt arhivētos attēlus no "Wayback Machine" arhīva, vispirms nosūtot vairākus pieprasījumus arhīvam un pēc tam pārsūdzot Kanādas Federālajā tiesā.[59][60][61]

Cenzūra[labot šo sadaļu | labot pirmkodu]

Archive.org tiek bloķēts Ķīnā.[62][63] Pēc tam, kad vietne iespējoja šifrētu HTTPS protokolu, tas 2015. gadā tika bloķēts Krievijā.[64][65][35] 2016. gada aprīlī vietnes bloķēšana Krievijā tika pārtraukta. Šādas pašas problēmas raksturīgas arī citām NVS valstīm: archive.org Kazahstānā tika bloķēts 2015. gadā,[66] 2017. gadā tas pats notika Kirgizstānā.[67]

Ārējās saites[labot šo sadaļu | labot pirmkodu]

Atsauces[labot šo sadaļu | labot pirmkodu]

  1. «Archive.org Traffic, Demographics and Competitors - Alexa». alexa.com. Skatīts: 2019. gada 4. februāris.
  2. «WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools». WHOIS. Skatīts: 2016. gada 13. marts.
  3. «InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools». WHOIS. Skatīts: 2016. gada 13. marts.
  4. "The Wayback Machine", Frequently Asked Questions. Atjaunināts: September 18, 2018
  5. 5,0 5,1 «20,000 Hard Drives on a Mission | Internet Archive Blogs». blog.archive.org (en-US). Arhivēts no oriģināla, laiks: 2018. gada 20. oktobris. Skatīts: 2018. gada 15. oktobris.
  6. 6,0 6,1 «Internet Archive: Wayback Machine». archive.org (angļu). Arhivēts no oriģināla, laiks: 2014. gada 3. janvāris. Skatīts: 2018. gada 15. oktobris.
  7. John Cook. «Web site takes you way back in Internet history». Seattle Post-Intelligencer, 2001. gada 1. novembris. Arhivēts no oriģināla, laiks: 2014. gada 12. augusts. Skatīts: 2011. gada 15. augusts.
  8. "Wayback Goes Way Back on Web". Wired. October 28, 2001. Arhivēts no oriģināla October 16, 2017. Atjaunināts: October 16, 2017.
  9. 9,0 9,1 9,2 9,3 Kalev Leetaru (January 28, 2016). "The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web". Forbes. Archived from the original on October 16, 2017. Retrieved October 16, 2017.
  10. Brewster Kahle. «Archiving the Internet». Scientific American – March 1997 Issue. Arhivēts no oriģināla, laiks: 2012. gada 3. aprīlis. Skatīts: 2011. gada 19. augusts.
  11. Jeff Kaplan. «Archive-It: Crawling the Web Together». Internet Archive Blogs, 2014. gada 27. oktobris. Arhivēts no oriģināla, laiks: 2017. gada 12. oktobris. Skatīts: 2017. gada 16. oktobris.
  12. 12,0 12,1 «Worldwide Web Crawls». Internet Archive. Arhivēts no oriģināla, laiks: 2017. gada 19. oktobris. Skatīts: 2017. gada 16. oktobris.
  13. «Internet Archive: Petabox». archive.org (angļu). Skatīts: 2018. gada 25. oktobris.
  14. Michael Kanellos. «Big storage on the cheap». CNET News.com, 2005. gada 29. jūlijs. Arhivēts no oriģināla, laiks: 2007. gada 3. aprīlis. Skatīts: 2007. gada 29. jūlijs.
  15. «Internet Archive and Sun Microsystems Create Living History of the Internet». Sun Microsystems. 2009. gada 25. marts. Arhivēts no oriģināla, laiks: 2009. gada 26. marts. Skatīts: 2009. gada 27. marts.
  16. Lucas Mearian. «Internet Archive to unveil massive Wayback Machine data center». Computerworld.com, 2009. gada 19. marts. Arhivēts no oriģināla, laiks: 2009. gada 23. marts. Skatīts: 2009. gada 22. marts.
  17. «Updated Wayback Machine in Beta Testing». Archive.org. Arhivēts no oriģināla, laiks: 2011. gada 23. augusts. Skatīts: 2011. gada 19. augusts.
  18. «Beta Wayback Machine, in forum». Archive.org. Arhivēts no oriģināla, laiks: 2014. gada 17. aprīlis. Skatīts: 2014. gada 16. aprīlis.
  19. «Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs». Blog.archive.org. 2013. gada 9. janvāris. Arhivēts no oriģināla, laiks: 2014. gada 14. aprīlis. Skatīts: 2014. gada 16. aprīlis.
  20. Alexis Rossi. «Fixing Broken Links on the Internet». archive.org. San Francisco, CA, US : Collections Team, the Internet Archive, 2013. gada 25. oktobris. Arhivēts no oriģināla, laiks: 2014. gada 7. novembris. Skatīts: 2015. gada 25. marts. We have added the ability to archive a page instantly.
  21. «Internet Archive Frequently Asked Questions». Arhivēts no oriģināla, laiks: 2009. gada 21. oktobris. Skatīts: 2015. gada 17. janvāris.
  22. 22,0 22,1 Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (May 5, 2015). "Using the wayback machine to mine websites in the social sciences: A methodological resource" (en). Journal of the Association for Information Science and Technology 67 (8): 1904–1915. doi:10.1002/asi.23503. ISSN 2330-1635.
  23. «Internet Archive Frequently Asked Questions». 2014. gada 18. decembris. Arhivēts no oriģināla, laiks: 2014. gada 18. decembris. Skatīts: 2018. gada 13. decembris.
  24. «Can the manipulation of big data change the way the world thinks?». The National. Arhivēts no oriģināla, laiks: 2017. gada 12. janvāris. Skatīts: 2017. gada 14. maijs.
  25. Zachary Crockett. «Inside Wayback Machine, the internet’s time capsule». The Hustle (en-US), 2018. gada 28. septembris. Arhivēts no oriģināla, laiks: 2018. gada 2. oktobris. Skatīts: 2018. gada 26. oktobris.
  26. Virginia Heffernan. «Things Break and Decay on the Internet—That's a Good Thing». WIRED (en-US), 2018. gada 18. septembris. Arhivēts no oriģināla, laiks: 2018. gada 25. septembris. Skatīts: 2018. gada 26. oktobris.
  27. Some sites are not available because of Robots.txt or other exclusions Archived April 15, 2011, Wayback Machine vietnē.
  28. How can I remove my site's pages from the Wayback Machine? Archived April 17, 2014, Wayback Machine vietnē.
  29. Joseph Cox. «The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers», 2018. gada 22. maijs. Arhivēts no oriģināla, laiks: 2018. gada 23. maijs. Skatīts: 2018. gada 23. maijs.
  30. Mark Graham. «Robots.txt meant for search engines don't work well for web archives». Internet Archive Blogs, 2017. gada 17. aprīlis. Arhivēts no oriģināla, laiks: 2017. gada 17. aprīlis. Skatīts: 2017. gada 16. aprīlis.
  31. «Archivierung des Internets: Internet Archive ignoriert künftig robots.txt» (de-DE). heise online. Arhivēts no oriģināla, laiks: 2017. gada 27. aprīlis. Skatīts: 2017. gada 14. maijs.
  32. «Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de» (de-DE). Arhivēts no oriģināla, laiks: 2017. gada 19. jūnijs. Skatīts: 2017. gada 14. maijs.
  33. «Internet Archive will ignore robots.txt files to keep historical record accurate». Digital Trends. 2017. gada 24. aprīlis. Arhivēts no oriģināla, laiks: 2017. gada 16. maijs. Skatīts: 2017. gada 14. maijs.
  34. Sampath Kumar, B.T.; Prithviraj, K.R. (October 21, 2014). "Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs" (en). Journal of Information Science 41 (1): 71–81. doi:10.1177/0165551514552752. ISSN 0165-5515.
  35. 35,0 35,1 35,2 «Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed». Arhivēts no oriģināla, laiks: 2017. gada 6. janvāris. Skatīts: 2017. gada 14. maijs.
  36. «What the Web Said Yesterday». The New Yorker. Arhivēts no oriģināla, laiks: 2015. gada 25. janvāris. Skatīts: 2017. gada 14. maijs.
  37. «The March for Science began with this person's 'throwaway line' on Reddit». Washington Post. Arhivēts no oriģināla, laiks: 2017. gada 23. aprīlis. Skatīts: 2017. gada 23. aprīlis.
  38. «Are scientists going to march on Washington?». The Washington Post. Arhivēts no oriģināla, laiks: 2017. gada 31. janvāris. Skatīts: 2017. gada 31. janvāris.
  39. Katherine Ellen Foley. «The global March for Science started with a single Reddit thread». Quartz. Arhivēts no oriģināla, laiks: 2017. gada 24. aprīlis. Skatīts: 2017. gada 23. aprīlis.
  40. «Internet Archive Frequently Asked Questions». Internet Archive. 2014. gada 2. aprīlis. Arhivēts no oriģināla, laiks: 2014-04-02. Skatīts: 2018. gada 23. novembris.
  41. «Internet Archive Frequently Asked Questions». archive.org (angļu). Skatīts: 2018. gada 23. novembris.
  42. 42,0 42,1 Bates, Mary Ellen (2002). "The Wayback Machine". Online 26: 80.
  43. 43,0 43,1 «Internet Archive Frequently Asked Questions». archive.org (angļu). Arhivēts no oriģināla, laiks: 2013. gada 20. aprīlis. Skatīts: 2018. gada 18. oktobris.
  44. 44,0 44,1 44,2 Howard Lloyd. «Order to Disable Robots.txt» (PDF), October 2009. Skatīts: 2009. gada 15. oktobris.
  45. Antonio Cortes. «Motion Opposing Removal of Robots.txt», October 2009. Arhivēts no oriģināla, laiks: 2010. gada 27. oktobris. Skatīts: 2009. gada 15. oktobris.
  46. Gelman, Lauren (November 17, 2004). "Internet Archive's Web Page Snapshots Held Admissible as Evidence". Packets 2 (3). Atjaunināts: January 4, 2007.
  47. Howell, Beryl A. (February 2006). "Proving Web History: How to use the Internet Archive" (PDF). Journal of Internet Law: 3–9. Arhivēts no oriģināla 2010. gada 5. jūlijā. Atjaunināts: August 6, 2008.
  48. Wynn W. Coggins. «Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?». USPTO, Fall 2002. Arhivēts no oriģināla, laiks: 2012. gada 21. septembris.
  49. «Debunking the Wayback Machine». Arhivēts no oriģināla, laiks: 2010. gada 29. jūnijs.
  50. Martin Bahr. «The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts?». JurPC (vācu), 2002. doi:10.7328/jurpcb/20021719. Arhivēts no oriģināla, laiks: 2009. gada 23. augusts.
  51. «Internet Archive FAQ». Archive.org. Arhivēts no oriģināla, laiks: 2014. gada 17. aprīlis. Skatīts: 2014. gada 16. aprīlis.
  52. Lisa M Bowman. «Net archive silences Scientology critic». CNET News.com, 2002. gada 24. septembris. Arhivēts no oriģināla, laiks: 2012. gada 15. maijs. Skatīts: 2007. gada 4. janvāris.
  53. Jeff. «exclusions from the Wayback Machine» (Blog). Wayback Machine Forum. Internet Archive, 2002. gada 23. septembris. Arhivēts no oriģināla, laiks: 2007. gada 11. februāris. Skatīts: 2007. gada 4. janvāris. Author and Date indicate initiation of forum thread.
  54. Ernest Miller. «Sherman, Set the Wayback Machine for Scientology» (Blog). LawMeme. Yale Law School. Arhivēts no oriģināla, laiks: 2012. gada 16. novembris. Skatīts: 2007. gada 4. janvāris. Norādīts vairāk nekā |archiveurl= un |archive-url= vajadzīgs; Norādīts vairāk nekā |archivedate= un |archive-date= vajadzīgs
  55. Dye, Jessica (2005). "Website Sued for Controversial Trip into Internet Past". EContent. 28 (11): 8–9.
  56. Bangeman, Eric (August 31, 2006). "Internet Archive Settles Suit Over Wayback Machine". Ars technica. Arhivēts no oriģināla November 5, 2007. Atjaunināts: November 29, 2007.
  57. 57,0 57,1 Internet Archive v. Shell, vol=505 F.Supp.2d 755, United States District Court for the District of Colorado, date=August 31, 2006 quote='April 25, 2007 Settlement agreement announced.' Filing 65, 2007-04-30: '...therefore ORDERED that this matter shall be DISMISSED WITH PREJUDICE...'
  58. Lewis T., Chief Judge Babcock. «Internet Archive v. Shell Civil Action No. 06cv01726LTBCBS» (PDF), 2007. gada 13. februāris. Arhivēts no oriģināla, laiks: 2014. gada 25. janvāris. Skatīts: 2015. gada 25. marts. 1) Internet Archive's motion to dismiss Shell's counterclaim for conversion and civil theft (Second Cause of Action) is GRANTED, 2) Internet Archive's motion to dismiss Shell's counterclaim for breach of contract (Third Cause of Action) is DENIED; 3) Internet Archive's motion to dismiss Shell's counterclaim for Racketeering under RICO and COCCA (Fourth Cause of Action) is GRANTED.
  59. Richard Stobbe. «Copyright Implications Of A "Right To Be Forgotten"? Or How To Take-Down The Internet Archive.». Mondaq, 2014. gada 5. decembris. Skatīts: 2019. gada 8. marts.
  60. Glennys McVeigh. James Philpott, Adam Weissman, Ren Bucholz, Brent Kettles, Aaron Pearl (redaktori) . «Davydiuk v. Internet Archive Canada, 2014 FC 944». CanLII. Federation of Law Societies of Canada, 2014. gada 16. oktobris. Skatīts: 2019. gada 8. marts.
  61. Richard F. Southcott. John Philpott, Alex Alton, Ren Bucholz (redaktori) . «Davydiuk v. Internet Archive Canada and Internet Archive, 2016 FC 1313 (CanLII)». CanLII. Ottawa, Ontario : Federation of Law Societies of Canada, 2016. gada 30. novembris. Skatīts: 2019. gada 8. marts.
  62. Kate Conger. «Backing up the history of the internet in Canada to save it from Trump». TechCrunch. Arhivēts no oriģināla, laiks: 2016. gada 27. decembris. Skatīts: 2017. gada 14. maijs.
  63. «Where to find what's disappeared online, and a whole lot more: the Internet Archive». Public Radio International. Arhivēts no oriģināla, laiks: 2017. gada 28. marts. Skatīts: 2017. gada 14. maijs.
  64. Richard Chirgwin. «There's no Wayback in Russia: Putin blocks Archive.org». Arhivēts no oriģināla, laiks: 2016. gada 7. oktobris. Skatīts: 2017. gada 14. maijs.
  65. «Russia won’t go Wayback, blocks the Internet Archive». Digital Trends. 2015. gada 26. jūnijs. Arhivēts no oriģināla, laiks: 2016. gada 17. aprīlis. Skatīts: 2017. gada 14. maijs.
  66. Experts explain reason for websites blocking in Kazakhstan
  67. Kyrgyzstan Blocks Archive.org on ‘Extremism’ Grounds