Unser Ansatz geht schrittweise vor und beginnt mit dem Lernen von Merkmalsrepräsentationen der wichtigsten Gesichtskomponenten. Anschließend lenken wir die entsprechenden Teile der Eingabeskizzen auf die zugrunde liegenden Komponentenstrukturen, die durch die Merkmalsvektoren definiert sind, die aus einer Reihe von Gesichtskomponentenproben gewonnen wurden. Zusätzlich führen wir ein weiteres tiefes neuronales Netzwerk ein, das die Zuordnung von den eingebetteten Komponentenmerkmalen zu realistischen Bildern erlernt und dabei mehrkanalige Merkmalskarten als Zwischenergebnisse verwendet, um den Informationsfluss zu verbessern.