Zum Bookshop Abteilung Mathematik und Informatik
Zu den Autorenseiten

Dietrich Paulus

Aktives Bildverstehen



Osnabrück: Der Andere Verlag, 2001
ISBN 3-935316-87-9

Pb,  335 S., 180 Abb., davon 30 in Farbe, 16 Tab.
DM  79,80

lesen (5,4 MB)

Gegenstand der Arbeit von Paulus sind technische Systeme, die Bildinformation aus Kameras verwenden, um über ihre Umgebung Informationen zu sammeln. Der Vergleich der Techniken, derer sich die Natur bedient, mit denen, die sich technisch realisieren lassen, dient als Motivation für die Realisierung im Rechner. Die in Lebewesen vorhandene Fähigkeit der visuellen Erkundung einer Umgebung wird mit Maschinen nachgebildet. Einsatzmöglichkeiten bieten sich beispielsweise für autonome Systeme, die mit visuellen Sensoren ausgestattet sind. Weder Lebewesen noch Kameras können die Gesamtheit der Umwelt mit einem Blick erfassen. Stattdessen wird ein Ausschnitt der Umgebung betrachtet, der als Szene bezeichnet wird. Zur Erkundung einer Szene wird eine Wissensbasis verwendet, in der Objekte und Strategien repräsentiert sind; diese entspricht in der Natur dem Gehirn, das Wissen über Objekte ebenso wie Handlungsanweisungen speichert und kontrolliert. Für die technische Realisierung werden Kameras mit Motoren ausgestattet, die eine Veränderung der Blickrichtung und der Brennweite ermöglichen. Diese Einrichtungen erlauben es, eine Umgebung gezielt zu erkunden. Die Kamera wird hierzu in ihrer Blickrichtung verändert und inspiziert einzelne Bereiche mit höherer Brennweite. Dieser Vorgang wird als Exploration bezeichnet.
Zur Analyse der Umgebungsausschnitte, die von der Kamera erfasst werden, müssen eine Reihe von Einzelproblemen gelöst werden, die dem Rechnersehen zugeordnet werden und die in der Arbeit genauer betrachtet werden.
Grundlage der Mustererkennung ist die so genannte Klassifikation von Mustern. Hierbei ist es die Aufgabe, digitalisierte Signale -- so genannte Muster -- in eine endliche Indexmenge abzubilden, die die Menge der Muster in Musterklassen unterteilt. Eines der Grundprobleme, das im Rechnersehen gelöst werden soll, ist es, Objekte in einem Bild zu erkennen und ihre Lage zu bestimmen. Im Sinne der Mustererkennung handelt es sich bei der Objekterkennung um ein Klassifikationsproblem. Oft sind Objekte nur teilweise sichtbar oder sie verdecken sich gegenseitig. Zur Bestimmung der Lage eines Objekts in der Umgebung ist es hilfreich, wenn dreidimensionale Daten vorliegen oder aus den Bildern errechnet werden. Dies ist beispielsweise mit Stereoverfahren möglich, die in der Arbeit beschrieben werden. Für bewegte Objekte erweitert sich die Lokalisierungsaufgabe dadurch, dass die Position und Orientierung zu jedem Zeitpunkt zu ermitteln ist. Somit werden die zwei- oder dreidimensionalen so genannten Trajektorien eines Punkts ermittelt. Umgekehrt kann die Bewegungsdetektion als eine iterierte Lösung des Objekterkennungsproblems verstanden werden.
Die Bildsignale, die dem Rechner vom Sensor zugeführt werden und die im Rechner digital vorliegen, sind oft mit Rauschen überlagert, nicht gleichmässig ausgeleuchtet, in den Farben verfälscht, oder entsprechen sonst nicht den Anforderungen an ein "gutes" Bild, das für die Objekterkennung benötigt wird. Mit Methoden der Bildvorverarbeitung lassen sich manche dieser Störungen reduzieren oder eliminieren. In der Bildsegmentierung wird ein Bild in bedeutungstragende Bestandteile zerlegt, beispielsweise in interessante Punkte, in Linien oder in Flächen. Diese so genannten Primitive können zur Modellbildung herangezogen werden.
Die explizite Modellierung von Vorwissen über Objekte und Szenen ist zur maschinellen Analyse von Bildern zwingend erforderlich. Neben diesen Modellen ist auch der Sensor und die Optik geeignet zu beschreiben, sowie eine optimale Einstellung der Segmentierungs-parameter zu bestimmen. Auch die Lösungsstrategie kann explizit in ein Modell aufgenommen werden. Das Vorwissen des Menschen speichert das Gehirn. In der maschinellen Umsetzung werden die verschiedenen Objektmodelle in einer Wissensbasis zusammengefasst, worauf in der Arbeit ausführlich eingegangen wird. Das Erkennen von Objekten und die Analyse von Szenen auf der Basis von explizit repräsentierten Modellen wird als wissensbasierte Bildanalyse bezeichnet, die den Schwerpunkt der Arbeit darstellt.

Zum Bookshop Abteilung Mathematik und Informatik
Zu den Autorenseiten