Der Virtuelle Spiegel

07.03.2001 - (idw) Fraunhofer-Institut für Integrierte Schaltungen IIS

Computersysteme, die unsere Wünsche von den Augen ablesen:
Biometrische Forschung des Fraunhofer IIS-A, Erlangen auf
der CeBIT 2001 in Halle 16 Stand B23/2

Wie oft suchen wir entnervt nach unserem Schlüssel oder sind völlig verzweifelt angesichts einer unübersichtlichen Anzahl von Eingabefeldern? Wie schön wäre es, auf ein Computersystem zu treffen, das uns viele Wünsche von den Augen und Lippen ablesen würde! Nur frommer Wunsch oder demnächst Wirklichkeit?

Am Fraunhofer-Institut für Integrierte Schaltungen IIS-A, Angewandte Elektronik in Erlangen forschen die Ingenieure an Systemen, die soviel Intuition in sich haben, um auf unsere Stimme, den Gesichtsausdruck oder unsere Lippenbewegung reagieren zu können.

Auf der CeBIT 2001 in Hannover zeigen die Erlanger Forscher anhand eines virtuellen Spiegels, wie ein Computersystem Personen bzw. Gesichter zuverlässig erkennt. Diese möglichst störungsunempfindliche Erkennung ist Grundvoraussetzung für Systeme, die auf unsere Sprache, auf unseren Gesichtsausdruck oder auf unsere Stimmungen reagieren sollen und so intuitiv das Gewünschte ausführen.

"Der Virtuelle Spiegel demonstriert jedem Besucher anschaulich robuste Auswerteverfahren für die Gesichtserkennung", erläutert Dr. Christian Küblbeck. Die Betrachter werden trotz Störquellen wie sich verändernde Lichtverhältnisse oder wechselndem Hintergrund zuverlässig erkannt.

Wie findet nun das Computersystem in der aufgenommenen Szene ein oder mehrere Gesichter? Zunächst werden die Personen, die sich vor dem Spiegel befinden, von einer Kamera aufgenommen und auf den Bildschirm projiziert. In einem Grauwertbild wird die Stärke von Objektkanten - hier die Kanten des Gesichts bzw. der Augen und der Nase bestimmt. An den Kantengrenzen ändert sich die Intensität der Bildpunkte: Augen, Brauen, Nase und Mund sowie die Gesichtsform heben sich gegen den Hintergrund ab. Das System wertet statt Farbe Grauwertinformationen aus, um beleuchtungsunabhängig zu sein. Für den Betrachter erscheint die Szene farbig.

Das System verfügt über ein sogenanntes Gesichtsmodell, das gespeicherte und aktuelle Strukturen Bildpunkt für Bildpunkt in verschiedenen Auflösungen vergleicht und nach Gesichtern verschiedener Größe sucht. Trifft das System auf ähnliche Strukturen, so werden diese in Sekundenschnelle mit dem aktuellen Bild verglichen. Dieser Vorgang benötigt aufgrund spezieller Suchtechnik nicht mehr als eine Zehntelsekunde pro Bild. So können die Gesichter bzw. Teile des Gesichts bestimmt und zuverlässig gefunden werden, auch wenn sich die Person vor dem Spiegel bewegt.

Wie sieht der Einsatz dieser Technik aus? Heutige Computersysteme und Mensch-Maschine-Schnittstellen sind häufig noch an sehr formalisierte Abläufe gebunden, damit das System auch das tut, was wir von ihm verlangen. Menschen reagieren hier anders: Ausgestattet mit einer komplexen Wahrnehmung können Menschen nicht nur auf eine Informationsquelle oder Situation reagieren. Meist kennen wir mehrere Wege, um etwas zu tun oder einen Freund zu erkennen. Dies kann zum Beispiel über das Gesicht, aber auch über Stimme, Gang, Körperhaltung, Haarfarbe usw. geschehen. Bei dieser Vielzahl an Erkennungsmöglichkeiten ist es für uns nicht wichtig, ob wir mit einer Methode bereits alle Informationen erhalten. Stattdessen lernen wir, welche Methode sich in welcher Situation am besten eignet und welche nicht. Dieses menschliche Verfahren nachzugestalten, das relativ robust auf sich verändernde Gegebenheiten reagiert, ist Ziel weiterer Forschungen. Am Fraunhofer IIS-A verfolgen die Wissenschaftler daher auch verschiedene Ansätze, die durch die Kombination mehrerer Strategien die biometrische Erkennung deutlich verbessern werden. Mit dem Schlagwort "Sensor Fusion" sollen hier neben der Gesichtsfindung und Verfolgung, auch die Lippenbewegung, die Stimme sowie beispielsweise der Lidschlag analysiert werden.

"Wenn es uns gelingt, diese menschlichen Erkennungsstrategien für Computersysteme umzusetzen, wird mein Computer mir ansehen, ob ich Hilfe beim Ausfüllen eines Online-Formulars brauche oder ob ich etwas Musik hören möchte", erklärt der Fraunhofer-Forscher seine Vision von intuitiv auf den Benutzer reagierenden Computern.

Wesentlich realitätsnäher sind Anwendungen, die heute schon in der Erprobungsphase sind: Durch die Verfolgung von Gesichtsbewegungen bzw. der Kontrolle des Lidschlags und der Augenbewegung sollen sogenannte Fahrerüberwachungssysteme für PKW und LKW optimiert werden. Hier können intelligente, erkennungssichere Kontrollsysteme Unfälle durch Sekundenschlaf oder sonstige Beeinträchtigungen des Fahrers frühzeitig verhindern helfen. Ein weiteres Anwendungsfeld ist die Verbesserung von Video- oder Telekonferenzssystemen, die den Gesprächspartner unverzerrt und exakt abgebildet zeigen, so dass auch hier bald per Video das Lippenlesen möglich werden kann.

Die Fraunhofer-Gesellschaft gehört mit ihren 48 Einzelinstituten, zahlreichen nationalen und internationalen Arbeitsgruppen zu den führenden Forschungsgesellschaften Europas.

Das 1985 gegründete und erfolgreichste Fraunhofer-Institut für Integrierte Schaltungen, Angewandte Elektronik, in Erlangen, beschäftigt z.Zt. ca. 350 Mitarbeiterinnen und Mitarbeiter. Leiter des Instituts ist Prof. Dr. Heinz Gerhäuser.

In enger Kooperation mit den Auftraggebern aus Industrie und Forschung entwickeln und arbeiten die Erlanger Wissenschaftler an folgenden Projekten: Hochfrequenztechnik, Telekommunikation, Digitaler Rundfunk, Audio- und Multimediatechnik, Integrierte Schaltungen, Bildverarbeitung und Sensorik, Röntgen- und Medizintechnik.

Fotos auf Anfrage erhältlich.