Aktives Bildverstehen - Der Andere Verlag

Die Bilderkennung wird als Beschriftungsprozess bezeichnet, der auf ein segmentiertes Objekt einer Szene angewendet wird. Das heißt, die Bilderkennung geht davon aus, dass Objekte in einer Szene als einzelne Elemente (z.B. ein Bolzen, eine Dichtung, ein Schraubenschlüssel) segmentiert wurden. Die typische Einschränkung hierbei ist, dass die Bilder in einer bekannten Betrachtungsgeometrie (oft senkrecht zum Arbeitsbereich) aufgenommen werden.

Die Methoden der Bilderkennung werden im Folgenden unterschieden:

Strukturmethoden (hier wird ein Objekt in einem Satz von primitiven Elementmustern mit vordefinierter Länge und Richtung zerlegt). Ein einfaches Beispiel ist in Bild 4.11 dargestellt. Drei weitere Strukturmethoden sind (i) Shape Number Matching, (ii) String Matching und (iii) syntaktische Methoden (String-Grammatiken, Semantik, etc.).
Entscheidungstheoretische Methoden (diese Methoden verwenden geeignete Entscheidungs- oder Diskriminanzfunktionen, um die Objekte an einen von mehreren Prototypen anzupassen).