MNOD

De la Wikipedia, enciclopedia liberă.
Salt la navigare Salt la căutare

Multi-Networks for Object Detection [1] (sau MNOD) este un algoritm de viziune computerizată pentru identificarea obiectelor de interes în imagini generice.

Ideea de bază este de a folosi multe modele neuronale antrenate individual fiecare pentru a rezolva o parte a problemei. Fiecare model neuronal devine un nod intern al unei structuri de copac care, începând de la nodurile frunzei către nodul rădăcină, rafinează și optimizează harta de segmentare pentru a fi asociată cu fiecare imagine de intrare.

Schema simplificată a procesului de instruire a sistemului MNOD.

Algoritm

MNOD constă dintr-o structură arborescentă ierarhică în care fiecare nod intern este alcătuit dintr-un model discriminator care primește ca intrare o serie de caracteristici sub formă de imagini și la ieșire returnează agregarea lor la rândul lor sub forma unei imagini. Procesul de citire a imaginilor de intrare are loc prin utilizarea unei serii de ferestre călătoare care la fiecare etapă transformă informațiile citite într-un model utilizat în modelul discriminator atât în ​​faza de antrenament, cât și în cea de predicție. Ieșirea modelului discriminator este apoi transformată din nou în imagine prin utilizarea unui mecanism de fereastră călătorie.

Nodurile frunze ale acestei structuri sunt alcătuite dintr-o serie de filtre care procesează imaginea de intrare într-o imagine filtrată care este apoi trecută la nivelurile următoare.

Fiecare nod produce o hartă de clasificare ușoară în care valoarea gri a fiecărui pixel reprezintă probabilitatea de apartenență a acelui pixel la obiectul de interes.

Diagrama simplificată a procesului de instruire pentru un singur nod al sistemului MNOD.

Aplicații

Sistemul MNOD a fost utilizat în diverse contexte de aplicații, cum ar fi cumpărăturile vizuale [2] și citirea automată a contoarelor de gaz și apă [3] .

Notă

  1. ^ Ignazio Gallo, Angelo Nodari (2011). Detectarea obiectelor de învățare folosind mai multe rețele neuronale . Vilamoura - Algarve, Portugalia: INSTICC Press Proceedings of International Conference on Computer Vision Theory and Applications (VISAPP).
  2. ^ Ignazio Gallo, Angelo Nodari și Marco Vanetti. Segmentarea obiectelor folosind mai multe rețele neuronale pentru oferte comerciale Căutare vizuală . Corfu, Grecia: aplicații inginerești ale rețelelor neuronale (EANN2011).
  3. ^ Angelo Nodari, Ignazio Gallo (2011). O abordare în rețea multi-neuronală pentru detectarea imaginilor și segmentarea contorului contorului de gaz . Nara Centennial Hall, Nara, Japonia: ACTA Press, IAPR Conference on Machine Vision Applications (MVA2011).
Informatică Portal IT : accesați intrările Wikipedia care se ocupă cu IT