Paradoxul lui Sayre

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Paradoxul lui Sayre este o dilemă întâlnită în proiectarea sistemelor automate de recunoaștere a scrisului de mână . O formulare tipică a paradoxului este că un cuvânt scris în cursiv nu poate fi recunoscut fără a fi segmentat și nu poate fi segmentat fără a fi recunoscut. Paradoxul a fost articulat pentru prima dată într-o publicație din 1973 de Kenneth M. Sayre , din care și-a luat numele. [1]

Natura problemei

Este relativ ușor să proiectezi sisteme automate capabile să recunoască cuvintele scrise într-un format tipărit. Aceste cuvinte sunt segmentate în litere chiar în momentul în care le scrieți pe pagină. Având în vedere modelele care se potrivesc anumitor forme cu anumite litere, literele individuale pot fi identificate cu un grad ridicat de probabilitate. În cazuri de ambiguitate, secvențele de litere considerate probabile pot fi comparate cu o selecție de cuvinte scrise corect în limba în care este scris documentul (așa-numitul „lexicon”). [2] Dacă este necesar, caracteristicile sintactice ale limbajului pot fi aplicate pentru a obține o identificare în general precisă a cuvintelor în cauză. [3] Sistemele tipărite de recunoaștere a caracterelor sunt utilizate în mod obișnuit pentru a procesa documente guvernamentale standardizate, pentru a sorta corespondența după coduri poștale etc.

În scrierea cursivă, pe de altă parte, literele care alcătuiesc un cuvânt dat curg de obicei în ordine, fără spații care le împart. Spre deosebire de o secvență de litere tipărite, literele scrise cu caractere italice nu sunt segmentate a priori . Aici intră în joc paradoxul Sayre: dacă un cuvânt nu este deja segmentat în litere, tehnicile descrise anterior care combină literele cu tiparele nu pot fi aplicate, deoarece segmentarea a priori este necesară pentru recunoașterea cuvintelor; pe de altă parte, nu există tehnici fiabile pentru segmentarea unui cuvânt în litere decât dacă cuvântul în sine a fost deja identificat anterior. Recunoașterea cuvintelor necesită segmentarea literelor, iar segmentarea literelor necesită recunoașterea cuvintelor: niciun sistem de recunoaștere cursivă a scrisului de mână nu poate efectua ambele sarcini simultan folosind tehnici standard de potrivire a literelor și a modelelor.

Utilizarea sistemelor automate de recunoaștere cursivă ar include sortarea e-mailurilor cu adrese scrise de mână, citirea cecurilor bancare scrise de mână și digitalizarea automată a documentelor scrise de mână. [4] Acestea sunt stimulente practice pentru a găsi căi în jurul paradoxului lui Sayre.

Evitați paradoxul

O modalitate de a reduce efectele negative ale paradoxului este de a normaliza cuvintele care trebuie recunoscute. Normalizarea constă în eliminarea idiosincrasiei prezente în scrierea de mână a scriitorului, de exemplu o pantă neobișnuită a literelor sau o înclinare neobișnuită a liniei cursive. [2] Această procedură poate crește probabilitatea unei potriviri corecte între literă și model, ceea ce duce la o creștere a ratei de succes a sistemului. Deoarece o astfel de îmbunătățire depinde din nou de segmentarea precisă, totuși, ea rămâne supusă limitărilor paradoxului lui Sayre. [4] Cercetătorii au ajuns la concluzia că singurul mod în jurul paradoxului este să nu se bazeze pe segmentarea precisă. [4]

Liniile actuale de cercetare

Segmentarea este exactă proporțional cu precizia cu care distinge diferitele litere din textele prezentate sistemului (intrarea); această segmentare este uneori denumită „segmentare explicită”. [2] Pe de altă parte, „segmentarea implicită”. este împărțirea liniei italice într-un număr de părți mai mare decât literele prezente în linia italică însăși: procesarea acestor „părți implicite” pentru a obține identificarea finală a cuvintelor necesită proceduri statistice specifice care implică modelul ascuns Markov (HMM).

Un model Markov este o reprezentare statistică a unui proces aleatoriu, adică un proces în care condițiile viitoare sunt independente de condițiile anterioare celui actual. Într-un astfel de proces, o condiție dată depinde doar de probabilitatea condiționată de a urma condiția imediat precedentă. Exemplu: o serie de rezultate obținute prin aruncarea unei matrițe de mai multe ori. Un model Markov ascuns este un model Markov în care condițiile individuale nu sunt pe deplin cunoscute. Probabilitățile condiționale dintre diferitele condiții sunt deja determinate, dar identitățile condițiilor individuale nu sunt complet clare.

Recunoașterea are loc prin potrivirea HMM a cuvintelor care urmează să fie recunoscute cu HMM pregătite anterior a cuvintelor conținute în lexicon. Cea mai bună potrivire într-un caz dat este utilizată pentru a indica identitatea cuvântului scris în mână în cauză. La fel ca sistemele bazate pe segmentarea explicită, sistemele bazate pe segmentarea implicită sunt considerate mai mult sau mai puțin fiabile pe baza procentului de identificări corecte pe care le fac.

Astăzi, majoritatea sistemelor de recunoaștere a textului scrise de mână utilizează segmentarea implicită asociată cu procedurile de potrivire bazate pe HMM. [4] Problemele rezumate în paradoxul Markov sunt în mare parte responsabile de această schimbare de abordare.

Notă

  1. ^ (EN) Kenneth M. Sayre, Machine Recognition of Handwritten Words: A Project Report, în Pattern Recognition, V, 1973, pp. 213-228.
  2. ^ a b c Vinciarelli, Sondaj .
  3. ^ A se vedea Introducerea informațiilor statistice .
  4. ^ a b c d Vinciarelli, Scriere manuală cursivă offline .

Bibliografie

Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT