Mascare de date

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Mascarea datelor este o procedură de ofuscare a datelor; este folosit pentru a proteja confidențialitatea în utilizarea și testarea platformelor online. [1]
Prin mascare, datele sensibile sunt înlocuite cu alte date sau cu șiruri de caractere , pentru a preveni identificarea persoanei fizice. Această procedură previne deturnarea de date în scopuri comerciale, dar permite utilizarea acestora pentru dezvoltarea de aplicații, site-uri web și testarea software- ului.

Mascarea datelor este utilizată și recomandată pentru implementarea măsurilor de securitate prevăzute de Regulamentul general privind protecția datelor (GDPR).

Reguli generale pentru efectuarea mascării datelor

Mascarea datelor trebuie să fie ireversibilă, indiferent de tehnica utilizată. Datele de ieșire nu pot fi convertite înapoi la forma originală. Cu toate acestea, rezultatele trebuie să fie reprezentative pentru datele sursă.

Atunci când se utilizează soluții de mascare a datelor, este necesar să se mențină integritatea referențială a datelor. Unele atribute prezente în baza de date pot fi de fapt folosite ca referință pentru alte elemente. De exemplu, dacă un număr de card de credit utilizat ca cheie principală într-un tabel este convertit într-un set de caractere, toate valorile legate de acesta trebuie codificate conform acelorași criterii. [2]

Multe baze de date relaționale, pentru a optimiza stocarea datelor, permit elementelor să se relaționeze între ele prin intermediul cheilor. Amestecarea sau înlocuirea acestor chei în timpul proceselor de mascare a datelor ar putea afecta funcționarea bazei de date din cauza pierderii relațiilor de date.

Nu este necesară criptarea întregii baze de date. Cu toate acestea, toate datele sensibile și datele nesensibile care pot duce la date sensibile trebuie criptate.

Mascarea datelor trebuie să fie un proces repetabil: nu este recomandabil să efectuați mascare „unică”, care ar fi dificil de întreținut și ineficientă.

Este adesea important ca mascare să mențină neschimbat tipul de date din bazele de date, deoarece bazele de date, de exemplu, nu acceptă text în câmpuri numerice sau legate de dată. Cu toate acestea, există situații în care o anumită bază de date poate fi stocată ca o bază de date generică (de exemplu, un număr poate fi păstrat ca un text generic).

Structura datelor trebuie, de asemenea, să rămână neschimbată de regulă: dacă datele originale au o lungime cuprinsă între două și douăzeci de caractere, datele modificate ar trebui să aibă aceeași lungime.

În unele cazuri, poate fi, de asemenea, necesar să se mențină grupări logice de valori. De exemplu, amestecarea aleatorie a datelor referitoare la locația geografică a anumitor indivizi, indicată prin cod poștal, ar duce la pierderea informațiilor geografice importante.

Mascare de date statică și dinamică

În timpul fazelor de dezvoltare este necesar să se utilizeze datele pentru a efectua teste privind funcționarea corectă a bazei de date. Pentru a permite această operațiune fără a compromite confidențialitatea utilizatorului, sunt utilizate două tipuri de mascare: statică și dinamică. [3]

Mascare de date statice

Mascarea statică a datelor este utilizată pentru testarea aplicațiilor pe o bază de date. Se creează o copie a bazei de date originale, care este apoi încărcată pe un server separat. Cantitatea de informații conținută în baza de date de copiere este redusă, lăsând la dispoziție doar datele necesare pentru efectuarea testelor specifice. Datele rămase sunt supuse unui proces de mascare, iar versiunea ofuscată a bazei de date este trimisă programatorilor .

Mascare dinamică a datelor

Mascare dinamică a datelor (mascare din mers) are loc în timpul procesului de transfer al datelor necesare proiectării către dezvoltatori [2] și nu necesită înregistrare intermediară pe niciun mediu de stocare. Acest tip de mascare este mai eficient pentru organizațiile care utilizează integrarea continuă a datelor și nu au timp pentru a crea și încărca copii de rezervă ale bazelor de date. Cu o integrare continuă, seturile de date mici pot fi trimise dezvoltatorilor pentru testare.

Prin mascare dinamică a datelor este, de asemenea, posibil să ofensăm parțial datele. Prin această procedură, datele sensibile de la utilizatori neautorizați sunt mascate, permițând în continuare utilizarea interfeței.

De exemplu, un angajat al centrului de apeluri poate identifica un client după ultimele patru numere ale cardului său de credit, dar fără a accesa numărul complet.

Metode de mascare a datelor

Pseudonimizare

Pseudonimizarea ascunde identitatea subiectului de la terți și reduce riscul ca datele să fie legate de diferite domenii. [4]

Prin această metodă, datele cu caracter personal sunt prelucrate în așa fel încât să nu mai poată fi atribuite unei anumite persoane vizate fără utilizarea informațiilor suplimentare, care trebuie stocate separat.

Pseudonimizarea poate fi aplicată în mai multe moduri. De exemplu, poate fi efectuat de către operatorul de date, în momentul colectării datelor, pentru prelucrarea ulterioară. O altă posibilitate de aplicare este pseudonimizarea încredințată unor terți care, după efectuarea prelucrării, vor transmite datele proprietarului [5] .

Tehnicile de pseudonimizare sunt:

  • Counter : Aceasta este cea mai simplă formă de pseudonimizare. Fiecare dată este asociată cu un număr dintr-un contor (care furnizează numere incrementându-le). Această tehnică este utilă pentru seturi de caractere foarte simple.
  • Generator de numere aleatorii : Acesta este similar cu contorul, dar oferă numere aleatorii .
  • Funcția hash criptografică : această metodă vă permite să asociați șiruri de lungime variabilă cu altele de lungime fixă.
  • Cod de autentificare a mesajului : funcționează ca cel precedent, dar generează o cheie secretă pentru pseudonimizare. [6]

Anonimizare

Anonimizarea este o procedură care oferă informații anonime, adică informații care nu se referă la o persoană fizică identificată sau identificabilă. [4]

Diferă de pseudonimizare, care asociază un „pseudonim” cu fiecare dată.

Din nou, nu există o singură tehnică sau metodologie.

  • Blocarea corelabilității : această metodă vă împiedică să urmăriți o singură persoană sau un grup de persoane care au date în baze de date diferite, prin, de exemplu, o analiză a corelației.
  • Zgomot static : metoda constă în modificarea atributelor datelor astfel încât acestea să nu poată fi atribuite subiectului, dar să păstreze în continuare posibilitatea de a fi utilizate.
  • Scrambling : metoda amestecă literele alfabetului împreună, după un anumit model.
  • Generalizare : metoda constă în extinderea sau creșterea scalelor de mărime ale diferitelor atribute. De exemplu, o regiune poate fi înlocuită cu o națiune.

Se amestecă

Tehnicile de amestecare a datelor constau în amestecarea aleatorie a datelor într-o bază de date, între o coloană și alta. Relațiile logice dintre coloane pot fi menținute.

Un caz clasic pentru utilizarea acestor metodologii este generarea de date pentru teste, în care este necesar să existe date reale ca date de intrare pentru proiecte noi, evitând în același timp posibila identificare.

Tehnicile de amestecare nu trebuie folosite singure, ci trebuie să însoțească tehnicile de mascare a datelor. Acest lucru se datorează faptului că nu sunt perfecte și pot menține unele relații între valori.

Există mai multe tipuri de amestecare:

  • Redare aleatorie : amestecă aleatoriu datele între coloane fără a menține o legătură logică între ele.
  • Desemnarea grupurilor : constă în conectarea coloanelor care aparțin aceluiași grup (de exemplu, numărul de telefon cu prefixul și țara) și amestecarea valorilor acestora. Defectul acestei metodologii este că coloanele conectate inițial între ele își păstrează valorile inițiale, ceea ce oferă posibilitatea stabilirii unor relații inițiale.
  • Desemnarea partiției : datele sunt amestecate în partiții specifice (de exemplu prin amestecarea valorilor tuturor rândurilor care au „Japonia” ca valoare a coloanei „țară”). Această metodă vă permite să păstrați intacte câteva legături între atribute. Principalul dezavantaj este că rămâne posibil să vedem câteva relații inițiale.

Criptare

În termeni IT, criptarea înseamnă a face un set de date ilizibil. Este necesară o cheie de decriptare pentru ca datele să poată fi citite. [7]

Criptarea se bazează pe utilizarea algoritmilor de criptare și este cea mai dificilă metodă de mascare a datelor. Datele necriptate, numite text simplu , imediat după procesul de criptare nu mai pot fi interpretate de aparat ( text cifrat ). Acest proces previne pierderea informațiilor sensibile prin hacking . [8]

Metodele de criptare sunt multe, încredințate diferitelor programe și în continuă evoluție.

  • Criptare cheie simetrică : utilă pentru sistemele închise sau pentru utilizatorii individuali. Cheia de criptare este aceeași atât pentru criptare, cât și pentru decriptare și este furnizată direct destinatarului. Această metodă este mai rapidă decât criptarea asimetrică, dar este mult mai riscantă, deoarece cheia de criptare ar putea fi interceptată.
  • Criptare cheie asimetrică : Această metodă utilizează două tipuri de chei: una privată, care trebuie să rămână secretă, și una publică, care poate fi partajată. Există o legătură matematică între cele două. Ambele pot decripta sau cripta un mesaj, folosind întotdeauna cheia opusă celei utilizate pentru fiecare pas. [7]

Notă

  1. ^ enisa, Tehnici de pseudonimizare și cele mai bune practici .
  2. ^ a b Mascare dinamică a datelor , la docs.microsoft.com .
  3. ^ ( IT ) Dynamic Data Masking , pe docs.microsoft.com , 24.03.2021 .
    „Dynamic Data Mask (DDM) limitează expunerea datelor sensibile ascunzându-le de utilizatorii fără privilegii. Poate fi folosit pentru a simplifica foarte mult proiectarea și codificarea securității în aplicație » .
  4. ^ a b ( EN ) enisa, Tehnici și bune practici de pseudonimizare , 2019.
  5. ^ Enisa, Tehnici și bune practici de pseudonimizare , 3 decembrie 2019, pp. 12-17.
  6. ^ Enisa, Tehnici și bune practici de pseudonimizare , 3 decembrie 2019, pp. 24-30.
  7. ^ a b Ce este criptarea datelor? , pe kaspersky.it .
  8. ^ O prezentare generală a criptografiei , la garykessler.net .

Bibliografie