ARHIVA SITE-URI

În arhivarea web, un site de arhivare este un site web care stochează informații despre paginile web din trecut pentru a putea fi vizualizat de oricine.

Tehnici comune

Două tehnici comune pentru arhivarea site-urilor Web utilizează un crawler web sau solicită depuneri de utilizatori:

  •     Utilizarea unui crawler web: prin utilizarea unui crawler web (de exemplu, arhiva Internet), serviciul nu va depinde de o comunitate activă pentru conținutul său și poate astfel să construiască mai rapid o bază de date mai mare. Cu toate acestea, crawlerele web pot numai să indexeze și să arhiveze informațiile pe care publicul le-a ales să le trimită pe Internet sau care pot fi accesate cu crawlere, deoarece dezvoltatorii de site-uri web și administratorii de sistem au capacitatea de a bloca accesarea [anumitor] pagini (utilizând un fișier robots.txt).
  •     Comentariile utilizatorilor: În timp ce poate fi dificil să se înceapă serviciile de depunere a utilizatorilor din cauza ratelor potențial scăzute de depunere a utilizatorilor, acest sistem poate aduce unele dintre cele mai bune rezultate. Prin accesarea cu crawlere a paginilor web, este posibilă numai obținerea informațiilor pe care publicul le-a ales să le publice online; cu toate acestea, furnizorii potențiali de conținut nu se pot deranja să posteze anumite informații, presupunând că nimeni nu ar fi interesat de acest lucru, deoarece acestea nu dispun de un loc adecvat pentru a-l posta sau din cauza problemelor legate de drepturile de autor. Cu toate acestea, utilizatorii care văd pe cineva dorește ca informațiile să fie mai potrivite pentru a le trimite.

ARHIVA SITE-URI

Exemple

  • Grupuri Google

În data de 12 februarie 2001, Google a achiziționat arhivele grupului de discuții usenet de la Deja.com și le-a transformat în serviciul Grupuri Google. Acestea permit utilizatorilor să caute discuții vechi cu tehnologia de căutare Google, permițând în același timp utilizatorilor să posteze pe listele de discuții.
Arhiva de Internet

Arhiva de Internet construiește un compendiu de site-uri web și medii digitale. Începând cu anul 1996, Arhiva a angajat un crawler web pentru a-și construi baza de date. Este unul dintre cele mai cunoscute site-uri de arhivă.

  • Arhivele NBCUniversale

Arhivele NBCUniversal oferă acces la conținut exclusiv de la NBCUniversal și filialele sale. Site-ul lor NBCUniversal Archives oferă o vizualizare ușoară a clipurilor de știri anterioare și recente și este un prim exemplu al unei arhive de știri.

  • Nextpoint

Nextpoint oferă un sistem de automatizare bazat pe cloud, SaaS pentru marketing, conformare și necesități legate de litigii, inclusiv descoperirea electronică.

  • Arhiva PANDORA

PANDORA (Arhiva Pandorei), fondată în 1996 de către Biblioteca Națională a Australiei, este conservarea și accesarea resurselor documentare în rețea din Australia, care încorporează misiunea lor. Acestea oferă un catalog pe termen lung de publicații online selectate și site-uri web create de australieni sau care au un subiect australian. Ei își folosesc sistemul PANDAS (sistemul digital de arhivare PANDORA) atunci când construiesc catalogul.

  • textfiles.com

textfiles.com este o mare bibliotecă de fișiere text vechi întreținute de Jason Scott Sadofsky. Misiunea sa este de a arhiva vechile documente care au plutit în jurul sistemelor de buletin de bord (BBS) ale tinereții sale și de a documenta experiențele altor oameni cu privire la sistemele de bord.