Fișier plat

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Fișierele plate sunt toate acele fișiere de date care conțin aspecte de înregistrare fără relații structurale. Pentru a interpreta acest tip de fișier, este necesară cunoașterea elementelor suplimentare, cum ar fi, de exemplu, proprietățile de formatare ale fișierului. Numai sistemele moderne de gestionare a datelor folosesc o abordare mai structurată a gestionării fișierelor (cum ar fi cea definită de Structured Query Language ), prezentând mijloace de stocare a datelor semnificativ mai complexe.

Exportul de date în fișiere delimitate prin virgulă este o opțiune convenabilă, pusă la dispoziție de majoritatea sistemelor de gestionare a datelor utilizate în prezent; fișierul delimitat însă nu conține nicio informație despre datele în sine. Rezultă că interpretarea lor necesită informații suplimentare. Prin urmare, acest tip de fișier este cunoscut în mod obișnuit ca fișier plat.

Clasificare

Fișierele plate pot fi clasificate după cum urmează:

  • Fișiere plate delimitate
  • Fișier plat cu lățime fixă

Un fișier plat delimitat conține căi de înregistrare cu lățime variabilă, separate printr-un semn de delimitare. De obicei, acest semn constă dintr-o virgulă, punct și virgulă, două puncte sau o bară verticală. Fișierele plate cu lățime fixă , pe de altă parte, constau din căi de înregistrare cu o lățime fixă ​​neschimbată. Înregistrările foarte lungi sunt trunchiate, iar cele scurte sunt umplute cu alte elemente (de obicei, goluri).

Un alt detaliu de adăugat constă în a spune că fișierele plate delimitate pot fi supuse unor mici probleme în cazul în care unul dintre câmpurile referitoare la datele conținute are în interior semnul de delimitare. Un dezavantaj al fișierelor cu lățime fixă ​​este utilizarea ineficientă a spațiului care poate duce la o creștere a dimensiunii fișierului.

Funcționalitate și utilizări

În principal, fișierele plate sunt utilizate pentru a popula bazele de date (prin urmare sunt cunoscute sub numele de baze de date Flat File ), dar aceasta nu este singura lor utilizare. Fișierele plate sunt utilizate în multe aplicații web pentru a colecta informații de la utilizatori, a le salva și, ulterior, pentru a transfera aceste informații într-un program de gestionare a datelor pentru analiză. Salvarea informațiilor în fișiere plate necesită mai puțin timp decât arhivarea într-o bază de date. Este o practică obișnuită să așteptați până când există o cantitate mare de date în fișierul plat înainte de a fi transferate în baza de date. În mod ideal, un program terț, cum ar fi o aplicație CGI , este utilizat pentru a crea fișierele plate originale ale căror date au fost colectate anterior prin introducerea de la sute de utilizatori. Fișierele jurnal produse de server pot fi, de asemenea, utilizate pentru a popula tipăriturile bazei de date în acest fel.

Flat Files sunt, de asemenea, utilizate nu numai pentru istoricizarea datelor în DB și CMS , ci și ca instrument pentru transferul de date între servere la distanță (în acest caz numite și fluxuri de informații). În ultimii ani, această a doua utilizare a fost înlocuită cu fișiere XML care au caracteristica nu numai de a conține datele, ci și de a le descrie. Cei care încă folosesc fișiere plate pentru transferul de informații sunt deseori mainframe cu proceduri pe care nimeni nu îndrăznește să le modifice. O critică a formatului XML pentru transferul masiv de date este că dimensiunea fișierelor devine disproporționată, în timp ce cele ale fișierelor plate sunt, în general, reduse la esențial. Soluția la această problemă este comprimarea fișierelor XML (în mod evident soluție valabilă la fel pentru Flat Files), dar compresia XML se mândrește acum cu standardul EXI ( Efficient XML Interchange , adesea utilizat pentru dispozitivele mobile). Este recomandabil să transferați date folosind EXI în loc de Flat File: deoarece nu este necesar să definiți metoda de compresie adoptată, deoarece există biblioteci pentru a citi conținutul fișierelor, deoarece nu este nevoie ca cele două sisteme de comunicare să stabilească protocol descrie în prealabil caracteristicile datelor (poziție, aliniere, tip, format etc.). Cu toate acestea, atunci când masa de date și / sau întârzierea sistemelor sunt o constrângere, singura soluție este în continuare utilizarea fișierelor plate. Pentru a depăși problemele de comunicare, format, validare, control și multe altele (indiferent dacă fluxul de date este Flat File sau XML), este recomandabil să utilizați firewall-uri de calitate a datelor .

Cel mai bun exemplu de utilizare excelentă a fișierului plat este calea ferată indiană. Compania nu folosește niciun sistem comercial de gestionare a datelor relaționale (RDBMS - Relational Data Base Management System), deoarece nu există un sistem de gestionare a datelor care să poată face față unei astfel de încărcări de date, ci folosește în schimb un fișier plat prin aplicarea tuturor concepte legate de sistemul relațional de gestionare a datelor cu sistemul dvs.

Implementări practice

Baze de date bazate pe fișiere plate:

  • MySQL CSV - Motor de stocare pentru MySQL 5.x.
  • HXTT JDBC CSV / Text - Instrumente HXTT JDBC pentru baza de date Flat File.
  • CsvJdbc - driver JDBC pentru fișiere CSV.
  • J-Stels CSV - driver JDBC pentru fișiere CSV.

CMS bazat pe fișiere plate:

  • CMS simplă
  • phpCMS
  • CloudCMS
  • Smulge
  • Flatnuke

Instrumente care manipulează / adoptă fișiere plate:

  • jValidator - Firewall de calitate a datelor open source, care funcționează prin Flat File și XML.
  • GNU Recutils - Un set de instrumente și biblioteci Open Source, bazate pe baze de date text numite recfiles.
  • Mimesis - Un FFDB scris în PHP4 care folosește mai multe fișiere și multe metode de istoricizare.
  • Flat File Checker - Aplicație open source pentru validarea datelor pentru Flat Files.
Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT