Conservarea digitală

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Conservarea digitală este ansamblul activităților care vizează garantarea duratei în timp și conservarea informațiilor în format digital. Conservarea digitală este definită ca atare numai atunci când este pe termen lung și protejată de orice erori de stocare pentru orice recuperare a acelorași informații pentru întreaga perioadă în care informațiile sunt stocate.

Descriere

Conservarea digitală poate fi privită ca ansamblul de procese și activități care asigură accesul continuu la informațiile digitale, precum și la toate tipurile de înregistrări științifice-culturale și moșteniri în format digital. Include atât informații care au fost digitalizate (adică au avut o origine analogică), cât și cele care s-au născut sub formă digitală și fără un omolog analog. În limbajul imaginilor digitale și al resurselor electronice, conservarea nu mai este doar produsul unui program, ci un proces în continuă schimbare. În acest context, informațiile digitale sunt păstrate pentru a-și asigura longevitatea în timp. Păstrarea pe termen lung a informațiilor digitale este însoțită de includerea metadatelor de păstrare .

Moștenirea culturală a societății umane poate fi păstrată sub diferite forme materiale, cum ar fi piatra , pergamentul , bambusul , hârtia etc. În această eră există o mulțime de informații sub formă digitală, cum ar fi site-uri de știri, bloguri, site-uri de rețele sociale, site-uri de conservare a imaginilor și site-uri care își schimbă conținutul în timp. Conform datelor raportate de Brewster Kahle , fondatorul Internet Archive în 1996, în articolul Preserving the Internet publicat în Scientific American în 1998, durata medie a unui URL a fost de 44 de zile. [1]

Caracteristica unică a informațiilor în formă digitală înseamnă că conținutul său poate fi ușor actualizat, dar implică în același timp multe dificultăți în conservarea sa în timp.

Termenul de stocare informatică (literalmente „stocare”) în italiană se traduce prin arhivare sau conservare / conservare , în funcție de context.

Deteriorarea fizică

Prima problemă cu care se confruntă păstrarea datelor digitale este legată de faptul că mediile în care sunt stocate informațiile sunt mai vulnerabile la deteriorare și la calamități naturale. Hârtia se deteriorează în ceea ce privește luciul și culoarea, dar aceeași deteriorare devine vizibilă după cel puțin zece decenii; iar când se produce de fapt deteriorarea, ea vine doar câteva decenii mai târziu. De asemenea, este posibil să recuperați toate informațiile fără pierderi chiar și după ce deteriorarea și-a arătat efectele. Datele înregistrate în formă digitală se deteriorează în mult mai puțin timp, odată ce deteriorarea a început în multe cazuri, datele se pierd iremediabil. Această caracteristică a datelor digitale lasă foarte puțin timp între decizia de a păstra aceleași date și implementarea păstrării.

Învechirea digitală

Pictogramă lupă mgx2.svg Același subiect în detaliu: Obsolescența digitală .

O altă problemă, poate chiar mai gravă și mai importantă, este problema accesului pe termen lung. Tehnologia digitală se dezvoltă foarte rapid, iar modalitatea de recuperare a informațiilor digitale poate fi învechită în câțiva ani. Atunci când un software sau o tehnologie pentru decodarea informațiilor digitale este abandonat sau hardware-ul pe care sunt stocate informațiile nu mai este disponibil, informațiile înregistrate pot fi ușor pierdute pur și simplu pentru că nu mai sunt accesibile. Acest proces este, de asemenea, cunoscut sub numele de caducitate digitală .

Această problemă se datorează lipsei de standarde , protocoale și metode de conservare digitale stabilite [2] : de exemplu, copii ale datelor au fost stocate pe benzi în trecut, iar standardele pentru această tehnologie s-au schimbat enorm în ultimii ani, deci există nu, nu există nicio garanție că vor fi lizibile și în viitor [3] .

Strategii

Există mai multe strategii pentru stocarea datelor digitale în timp.

Răcoritoare

Reîmprospătarea (actualizarea, reîncărcarea) [4] este transferul de date între două medii digitale de același tip; în acest fel nu există modificări sau modificări ale reprezentării binare a datelor [5] . Un exemplu este transferul datelor recensământului populației de pe un disc compact pe altul. Această strategie trebuie combinată cu cea a migrării (vezi mai jos ) atunci când software-ul sau hardware-ul necesar pentru citirea datelor nu mai sunt disponibile sau nu sunt adecvate pentru citirea formatelor de date. Strategia revigorantă poate deveni necesară în caz de deteriorare fizică a suportului.

Migrația

Migrația este transferul de date către un sistem nou sau chiar către diferite medii digitale. Această strategie poate implica conversia resurselor dintr-un format în altul (de exemplu convertirea unui document Word într-un PDF sau OpenDocument ), de la un sistem de operare la altul (de exemplu de laSolaris la Linux ) sau de la o programare a limbajului la altul (de exemplu din limbajul C la Java ) astfel încât resursa să rămână complet accesibilă și funcțională. Datele care au fost supuse procesului de migrare riscă să piardă unele tipuri de funcționalități pe care noile formate nu le pot funcționa sau citi sau se poate întâmpla ca convertorul sau programul utilizat pentru conversie să nu poată interpreta toate particularitățile formatul original.
Administrația Națională a Arhivelor și Înregistrărilor și Lockheed Martin dezvoltă un sistem de migrare a datelor care va păstra intact orice tip de document, creat cu orice aplicație, pe orice platformă sau cu orice tip de suport digital. Cu acest tip de sistem, fișierele sunt transformate în formate flexibile, cum ar fi XML ; vor fi, prin urmare, ușor accesibile de către noile tehnologii în viitor. Lockheed Martin crede că va fi imposibil să se dezvolte un sistem de emulare pentru arhivele Administrației Naționale a Arhivelor și Înregistrărilor, deoarece volumul de date și costul ar fi excesive.

Duplicare

Duplicarea este crearea uneia sau mai multor copii de date pe mai multe sisteme. Datele disponibile într-o singură copie pe un singur sistem sunt supuse riscului de blocări ale software - ului care îl rulează sau al hardware - ului , de modificări intenționate sau accidentale sau de catastrofe de mediu precum incendii, inundații etc. Prin duplicarea pe mai multe sisteme în locații diferite, datele au mult mai multe șanse să rămână intacte.

Emulare

Pictogramă lupă mgx2.svg Același subiect în detaliu: Emulator .

Emularea este duplicarea funcționalității unui sistem învechit (de exemplu, emularea Atari 2600 pe un sistem Windows sau emularea WordPerfect 1.0 pe un sistem Macintosh ). Emulatoarele pot fi create pentru aplicații, sisteme de operare sau platforme hardware. Emularea a fost o strategie populară pentru readucerea la viață a jocurilor video de pe platforme mai vechi, cum ar fi proiectul MAME . Flexibilitatea emulației ca sistem universal a fost dezbătută de comunitatea academică. Raymond A. Lorie a sugerat crearea unui computer virtual universal care să poată rula în viitor orice software pe orice platformă încă necunoscut sau care nu a fost încă creat. Această strategie nu a fost adoptată masiv de către comunitate.

Utilizarea metadatelor

Pictogramă lupă mgx2.svg Același subiect în detaliu: Metadate .

Metadatele sunt date încorporate într-un fișier digital care include informații despre: crearea, drepturile de acces, restricțiile de acces, istoricul de păstrare și drepturile de utilizare [6] . Metadatele pot suferi perimarea. ASCII este considerat formatul cel mai durabil pentru metadate [7] deoarece este utilizat pe scară largă, este compatibil cu versiunile anterioare atunci când este utilizat cu Unicode și folosește caractere lizibile de către oameni, nu coduri numerice. Păstrează informațiile în timp, dar nu structura cu care sunt reprezentate informațiile. Pentru mai multe funcționalități, pot fi utilizate și SGML sau XML . Ambele limbi sunt stocate în format ASCII, dar conțin etichete care denotă structura și formatul.

Obiecte digitale certificate

Obiectele digitale care își pot garanta propria autenticitate se numesc „obiecte digitale certificate”. Acestea se explică de la sine: încorporează istoricul tuturor modificărilor într-o înregistrare, făcând posibil ca viitorii utilizatori să verifice dacă conținutul obiectului este valid (Gladney, 2004). Alte strategii de păstrare, cum ar fi duplicarea și migrarea, sunt necesare pentru păstrarea pe termen lung a certificării.

Sustenabilitate digitală

Sustenabilitatea digitală cuprinde o serie de probleme și probleme legate de longevitatea informațiilor digitale. [8] Spre deosebire de strategiile și soluțiile tradiționale, atât pe termen scurt, cât și pe termen lung, durabilitatea digitală implică o metodă mai activă și continuă de conservare. Se concentrează mai puțin pe soluție și tehnologie și mai mult pe construirea unei structuri și abordări flexibile, cu accent pe interoperabilitate, întreținere regulată în timp și dezvoltare constantă. [9] Sustenabilitatea digitală încorporează metode aplicate astăzi care facilitează accesul și disponibilitatea materialului digital într-un viitor mai mult sau mai puțin îndepărtat.

Standard de conservare digitală

Pictogramă lupă mgx2.svg Același subiect în detaliu: Open Archive Information System .

Pentru a standardiza practica conservării digitale și a oferi un set de recomandări pentru implementarea programului de conservare, a fost dezvoltat un model de referință pentru un sistem de informații arhivat deschis (OAIS). Modelul de referință (ISO 14721: 2003) include următoarele directive pe care arhiva OAIS trebuie să le respecte întotdeauna:

  • Negociați și faceți schimb de informații adecvate cu producătorii de date digitale;
  • Obțineți un control suficient al informațiilor furnizate la un nivel care asigură păstrarea pe termen lung;
  • Determinați ce comunitate ar trebui să devină o „comunitate de referință” capabilă să înțeleagă informațiile furnizate;
  • Asigurați-vă că informațiile digitale care trebuie păstrate sunt înțelese într-un mod autonom pentru comunitatea de referință. Cu alte cuvinte, comunitatea ar trebui să poată înțelege informațiile chiar și fără ajutorul experților care au produs informațiile;
  • Respectați politicile și procedurile documentate care se asigură că informațiile sunt păstrate în siguranță de toate riscurile rezonabile și care permit diseminarea informațiilor în copii certificate ale originalului sau trasabile la original;
  • Punerea informațiilor digitale stocate și disponibile comunității de referință [10] .

OAIS se ocupă de toate aspectele tehnice ale ciclului de viață al unui obiect digital: de la plasarea într-o arhivă până la stocarea în infrastructura de stocare, de la gestionarea datelor, la accesibilitate și distribuție. Modelul abordează, de asemenea, problemele legate de metadate și recomandă ca cinci tipuri de metadate să fie asociate cu un obiect digital: referința obiectului (identificare), proveniența (inclusiv un istoric de stocare), context, fixitate (indicatori de autenticitate) și reprezentare (formatare, fișier structura și ceea ce „dă sens fluxului de biți al obiectului”. [5]

Înainte de propunerea Gladney pentru obiecte digitale certificate (TDO), Research Library Group (RLG) a dezvoltat „atributele și responsabilitățile” care denotă practica unui „ depozit digital de încredere ” (TDR). Cele șapte atribute ale unui TDR sunt: ​​„respectarea modelului de referință pentru un sistem de informații deschise arhivistice (OAIS), responsabilitate administrativă, durabilitate organizațională, durabilitate financiară și tehnologică și adecvare procedurală, securitate sistem, responsabilitate procedurală”. Responsabilitățile RLG includ, de asemenea, recomandări pentru dezvoltarea unui sistem de depozitare digitală colaborativă și schimbul de cercetări și informații privind conservarea digitală, inclusiv cu privire la aspectele legate de drepturile de proprietate intelectuală [11] .

Standard de conservare audio digital

În ianuarie 2004, Consiliul pentru bibliotecă și resurse informaționale (CLIR) a organizat o reuniune a experților solizi pentru a discuta cele mai bune practici în conservarea audio digitală ; reuniunea a produs un raport prezentat în martie 2006 . Acest raport investighează procedurile pentru reformatarea sunetului analogic la digital și rezumă discuțiile și recomandările pentru cele mai bune practici de conservare digitală. Experții au distribuit un set de 15 recomandări pentru îmbunătățirea practicii transferului audio analogic la digital pentru stocare:

  • Dezvoltă abilități de bază în domeniul ingineriei de conservare a sunetului. Participanții au observat cu îngrijorare că numărul de experți calificați pentru transferul digital și arhivarea înregistrărilor audio vechi este în scădere și au subliniat necesitatea de a găsi o modalitate prin care să se poată împărtăși cunoștințele tehnice ale experților cu generațiile următoare;
  • Elaborați acorduri cu instituții mai mici care permit acest lucru achiziționarea în cooperare [ neclară ] de materiale și consumabile;
  • Urmăriți un program de cercetare pentru problemele cu bandă magnetică care se concentrează pe soluții mai puțin distructive;
  • Elaborați linii directoare pentru transferul automat al sunetului analogic în format digital;
  • Dezvoltarea unui singur loc (bazat pe o aplicație web) pentru schimbul de informații cu privire la dezvoltarea programelor de transfer digital și conservare;
  • Efectuați proiecte de cercetare ulterioare privind reproducerea nedistructivă a discurilor audio deteriorate;
  • Elaborați un diagramă pentru a identifica compoziția diferitelor tipuri de discuri audio și benzi;
  • Elaborați un tabel de referință cu privire la cele mai frecvente probleme legate de mass-media digitală;
  • Catalogați principalele standarde de inginerie audio;
  • Studiați cele mai sigure și mai eficiente metode pentru curățarea casetelor și discurilor analogice;
  • Elaborați o listă de experți în muzică care ar putea fi consultați pentru sfaturi privind transferul anumitor tipuri de conținut muzical (de exemplu, determinarea cheii corecte pentru a determina cea mai bună viteză de redare);
  • Stabilirea arhivelor audio digitale pe țări;
  • Colaborați la dezvoltarea unui vocabular comun în domeniul conservării audio;
  • Investigați transferul de tehnologii din domenii precum chimia și știința materialelor pentru a rezolva diferitele probleme de conservare a artefactelor audio. [12]

De asemenea, Asociația Internațională a Arhivelor Sunetului și Audiovizualului (IASA) a publicat ghiduri actualizate privind tehnicile de creare și conservare a materialelor audio digitale. [13]

Exemple de inițiative de conservare digitală

  • Xena este un software gratuit de arhivare bazat pe Java care poate fi instalat pe orice computer. Convertiți documente proprii, grafică și fișiere audio în formate deschise și normalizați alte fișiere binare în ASCII cu un wrapper de fișiere XML;
  • ArchivalWare (realizat de PTF Inc.) este un Soluție de bibliotecă digitală [ neclară ] creată special pentru a găzdui, disemina, păstra și permite identificarea resurselor digitale. Produsul creează fișiere PDF pentru conservarea digitală pe termen lung și include suport pentru metadatele XMP, care permit metadatelor să fie încorporate permanent în obiectul digital în sine;
  • DSpace este un software open source care acceptă date digitale în diferite formate (text, video, audio), le distribuie pe web, le indexează (pentru regăsire ușoară) și le salvează în timp;
  • Biblioteca Britanică este responsabilă de mai multe programe în domeniul conservării digitale. Arhivele Naționale din Marea Britanie au pregătit, de asemenea, calea pentru diverse inițiative în domeniul conservării digitale;
  • PADI este un depozit cuprinzător de informații referitoare la conservarea digitală de la Biblioteca Națională din Australia ;
  • SimpleDL este capabil să stocheze mai multe formate, inclusiv text, imagini, video, audio și date. SimpleDL folosește Amazon S3 pentru a oferi 99,99999999999% durabilitate a datelor digitale stocate în arhiva sa.

Inițiative de conservare digitală la scară largă

Multe biblioteci și arhive au început sau sunt pe cale să înceapă „ inițiative de conservare digitală pe scară largă” (LSDI). Protagoniștii sunt instituții culturale, companii comerciale precum Google și Microsoft și grupuri non-profit, inclusiv Open Content Alliance (OCA), Million Book Project (MBP) și HathiTrust . Principala motivație a acestor grupuri este extinderea accesului la resursele academice, în special într-o perspectivă pe termen lung.

Aproximativ treizeci de instituții culturale, inclusiv doisprezece membri ai Comitetului pentru cooperare instituțională (CIC), au semnat acorduri de digitalizare atât cu Google, cât și cu Microsoft. Multe dintre aceste instituții culturale participă la Open Content Alliance (OCA) și la Million Book Project (MBP). Unele biblioteci sunt implicate într-o singură inițiativă, în timp ce altele și-au diversificat strategiile de digitalizare prin participarea la mai multe inițiative. Principalele motive expuse pentru ca bibliotecile să participe la programele LSDI sunt accesul, conservarea, cercetarea și dezvoltarea. Se speră că conservarea digitală va asigura că materialul deținut de biblioteci rămâne accesibil generațiilor viitoare. Bibliotecile intenționează în viitor să utilizeze copii digitalizate ca copii de siguranță pentru lucrările cu risc de deteriorare în cazul în care acestea nu mai sunt tipărite, se deteriorează, se pierd sau se deteriorează la reparații.

Notă

  1. ^ Brewster Kahle Conservarea internetului . „Scientific American”, 276 (1997), n. 3, p. 72-74. Verificat 5 februarie 2011
  2. ^ Levy, DM și Marshall, CC (1995), Going digital: o privire asupra ipotezelor care stau la baza bibliotecilor digitale , în „Communications of the ACM”, 58, No. 4: pp. 77-84.
  3. ^ Flugstad, Myron (2007), Website Archiving: the Long-Term Preservation of Local Born Digital Resources , Arkansas Libraries vol. 64 n. 3 (toamna 2007) pp. 5-7.
  4. ^ Referință Word: „refreshing” , la wordreference.com . Adus pe 3 ianuarie 2019 .
  5. ^ a b Biblioteca Universității Cornell. (2005) Politici de gestionare a conservării colecției digitale: strategii pe termen scurt pentru a contracara problemele pe termen lung Arhivat 14 ianuarie 2014 la Arhiva Internet .
  6. ^ Grupul consultativ cadru NISO. (2007). Un cadru de orientare pentru construirea unor colecții digitale bune, ediția a treia Arhivat la 17 mai 2008 la Internet Archive ., P. 57,
  7. ^ Inițiativă națională pentru un patrimoniu cultural în rețea. (2002). NINCH Ghid de bune practici în reprezentarea digitală și gestionarea materialelor patrimoniului cultural Arhivat 8 decembrie 2007 la Arhiva Internet .
  8. ^ Bradley, K. (vara 2007). Definirea sustenabilității digitale. Library Trends v. 56 nr 1 p. 148-163.
  9. ^ Sustenabilitatea resurselor digitale. (2008). TASI: Serviciul de consultanță tehnică pentru imagini. Arhivat la 4 martie 2008 la Internet Archive .
  10. ^ Comitetul consultativ pentru sistemele de date spațiale. (2002). Model de referință pentru un sistem de informații arhivat deschis (OAIS). Washington, DC: Secretariatul CCSDS, p. 3-1
  11. ^ Grupul de biblioteci de cercetare. (2002). Depozite digitale de încredere: atribute și responsabilități Arhivat 20 februarie 2008 la Internet Archive .
  12. ^ Consiliul pentru resurse de bibliotecă și informații. Publicația 137: Captarea sunetului analog pentru păstrarea digitală: Raportul unei mese rotunde de discuții despre cele mai bune practici pentru transferul de discuri și benzi analogice martie 2006 Arhivat 20 septembrie 2008 la Internet Archive .
  13. ^ IASA (2009). Linii directoare privind producția și conservarea obiectelor audio digitale Arhivat 8 mai 2015 la Arhiva Internet .

Elemente conexe

Alte proiecte

linkuri externe

Controlul autorității Tezaur BNCF 52292 · LCCN (EN) sh95004496 · BNF (FR) cb119595620 (data) · NDL (EN, JA) 01.056.398