MARC

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare
Notă despre dezambiguizare.svg Dezambiguizare - Dacă sunteți în căutarea altor semnificații, consultați Marc .

MARC (acronim pentru MAchine Readable Cataloging) este un format pentru reprezentarea informațiilor bibliografice dezvoltat de Biblioteca Congresului din Statele Unite în 1966 pentru prelucrarea și diseminarea datelor bibliografice [1] . Astăzi a fuzionat în standardul ISO 2709 .

fundal

La începutul anilor '60 ai secolului al XX-lea , Statele Unite și alte țări vorbitoare de limbă engleză încep să înregistreze sisteme de informații electronice informații bibliografice formate în mod tradițional din fișe de hârtie care erau cataloagele majorității bibliotecilor.

Ideea a fost de a putea arhiva și transmite informații bibliografice cu mijloacele disponibile la acea vreme, adică benzi și rețele telematice primitive, caracterizate de costuri foarte mari în raport cu performanța. Prin urmare, compacitatea reprezentării informațiilor a fost un factor crucial și, de fapt, specificația MARC originală a avut ca scop mai ales reducerea deșeurilor de spațiu cât mai mult posibil, fără a face gestionarea informațiilor prea complexă.

Factorul spațial a condus la excluderea reprezentărilor caracterizate prin câmpuri de lungime fixă, chiar dacă diferite în funcție de câmp, deoarece multe dintre câmpurile care alcătuiesc o înregistrare bibliografică pot avea o lungime imprevizibilă. Prin urmare, a fost necesar să se utilizeze câmpuri cu lungime variabilă, iar formatul descris mai jos a fost identificat în acest scop.

Formatul necesar pentru identificarea părților din informațiile bibliografice prin etichete sau etichete constând din doar trei cifre. Pentru a se asigura că, în timpul înregistrării și citirii ulterioare a informațiilor, titlul unei publicații nu a fost confundat cu numele unui editor, a fost necesar să se stabilească o corespondență între etichetele și câmpurile înregistrării bibliografice. De exemplu, s-a stabilit că eticheta 100 corespundea autorului principal și eticheta 240 titlului propriu-zis.

Formatul a permis divizarea câmpurilor în unități mai mici, numite subcâmpuri , identificate printr-o singură literă sau cifră. Astfel, de exemplu, autorul principal a fost reprezentat în mod adecvat de subcâmp A a câmpului 100 sau, așa cum este adesea scris astăzi, de câmpul 100 $ a sau pur și simplu 100a.

În esență, specificația MARC a definit atât sintaxa, cât și semantica reprezentării informațiilor bibliografice.

Pe termen lung, confuzia dintre aceste două obiective a avut efecte negative. În acest fel, sintaxa de semantică a fost separată, iar formatul a fost generalizat și riguros definit în standardul ISO 2709 , în timp ce numeroase semantici diferite, aproximativ la nivel național, au fost definite pornind de la formatul neutru . De exemplu, în Statele Unite, USMARC a fost adoptat, ulterior fuzionat, împreună cu CANMARC , în specificația MARC21 . FINMARC , DENMARC , UKMARC și mulți alții s-au născut în Europa.

O încercare de a pune ordine în această pădure de specificații mai mult sau mai puțin incompatibile a fost inițiată acum mulți ani de IFLA , cu definiția specificației UNIMARC . Este o semantică încă condiționată de ISO 2709 , dar definită cu scopul de a fi universală , adică potrivită pentru nevoile diferitelor țări și ale diferitelor comunități de utilizatori și profesioniști. Este, de asemenea, mult mai riguros decât cei născuți anterior, deoarece a fost dezvoltat de comisia savanților din întreaga lume, sub rezerva revizuirilor periodice și a evoluției continue.

În lumea anglo-saxonă, confuzia arbitrară dintre MARC, MARC21 și ISO 2709 este frecventă. În special, anglo-saxonii tind să confunde semantica MARC cu formatul. Cea mai evidentă consecință a acestui fapt este faptul că, invariabil sau aproape, software-ul pentru manipularea înregistrărilor în format MARC dezvoltat în lumea anglo-saxonă presupune că etichetele sunt cele ale MARC21 și, prin urmare, deși MARC21 împărtășește formatul cu UNIMARC și multe altele, aceste software-uri de obicei nu pot procesa înregistrări UNIMARC , de exemplu.

De-a lungul anilor au fost create versiuni specializate ale MARC, în special pentru:

  • înregistrări de autoritate , care descriu autori, fie ei oameni, companii, conferințe etc ...
  • înregistrări bibliografice, care descriu publicațiile
  • păstrarea înregistrărilor , care descriu proprietarul publicațiilor

Recent, răspândirea XML ca format pentru reprezentarea informațiilor a condus la definirea unei reprezentări a informațiilor bibliografice echivalente semantic cu MARC21 , cunoscută sub numele de MARCXML , dar care adoptă XML ca sintaxă. S-a discutat mult despre oportunitatea acestei operațiuni, dar avantajele sunt exclusiv practice: este mult mai ușor să manipulați fișiere XML decât înregistrările în format ISO 2709 și, mai presus de toate, instrumentele pentru a face acest lucru sunt complet generale și foarte răspândite.

Structura unei înregistrări MARC

După cum sa menționat deja mai sus, MARC poate fi considerat un caz particular al ISO 2709 , așa că vă rugăm să consultați acest ultim articol pentru informații generale despre structura înregistrărilor MARC.

Structura ghidului

Ghidul rezervă cinci caractere pentru lungimea înregistrării (inclusiv terminatorul înregistrării). Celelalte poziții de ghidare sunt utilizate după cum urmează:

6 tipul de înregistrare (?)
7 nivel bibliografic (?)
... ...

Structura de intrare a directorului

Ghidul unei înregistrări MARC afirmă, în esență, că fiecare intrare de director este alcătuită din douăsprezece caractere: trei pentru etichetă, cinci pentru poziție, patru pentru lungimea câmpului aferent. Directorul este terminat de către terminatorul de câmp. Aceasta este o măsură de precauție, deoarece ghidul indică și unde începe zona de date și, astfel, unde se termină directorul. În timpul unei transmisii, înregistrări sau citiri, orice erori pot fi identificate cu ușurință verificând dacă acest terminator este chiar acolo unde indică ghidul, eventual remediind eroarea în sine.

Structura zonei și câmpurilor de date

Zona de date, după cum sa menționat deja, este împărțită în câmpuri. Separarea unui câmp de celălalt se poate face citind doar directorul, dar pentru a remedia orice erori de transmisie sau de intrare / ieșire, câmpurile sunt, de asemenea, separate de terminatorul de câmp (FT).

Rolul separatorului de subcâmp ( SUA , de la separatorul de unități ) este diferit: este singura modalitate de a distinge un subcâmp în cadrul unui câmp. Subcâmpurile pot fi scanate doar secvențial, tocmai pentru că directorul nu conține nicio informație despre ele.

Alte diferențe semnificative între MARC și ISO 2709

Pe lângă faptul evident că MARC definește ca constante unii parametri pe care ISO 2709 îi tratează ca variabile, există și alte diferențe importante.

MARC atribuie sens ordinii în care sunt prezentate subcâmpurile în anumite câmpuri particulare. ISO 2709, pe de altă parte, ignoră complet această ordine, deși nu interzice implementărilor specifice să o considere semnificativă.

Notă

  1. ^ Giuliano Vigini, Glosar de biblioteconomie și știința informației , Milano 1985, p. 70.

Bibliografie

  • Antonio Scolari, UNIMARC , Roma, Asociația bibliotecilor italiene , 2000, ISBN 88-7812-061-8 .
  • Stefano Gambari și Matteo Barucci, Formate de înregistrare pentru înregistrări bibliografice citibile de mașini (MAchine-Readable Cataloging, MARC) , în Mauro Guerrini (ed.), Bibliotecă. Ghid clasificat , Milano, Editura bibliografică, 2007, pp. 416-420, ISBN 978-88-7075-634-0 .

Elemente conexe

linkuri externe

Controlul autorității LCCN (EN) sh85080966 · GND (DE) 4168864-8 · BNF (FR) cb11945919s (dată) · BNE (ES) XX534940 (dată) · NDL (EN, JA) 00.616.909