Visualisierung
| Die reine Darstellung der Positionen von Datensätzen im Kartenraums ist oft ungenügend zur Erkennung von Strukturen, weil die hochdimensionalen Distanzen verzerrt dargestellt sind. Jeweils auf dem Gitter benachbarte Neuronen können im Datenraum durchaus sehr unterschiedlich voneinander entfertn sein. Die U-Matrix (Ultsch 1993) stellt die lokalen Distanzbeziehungen im hochdimensionalen Datenraum als 3-dimensionale Landschaft mit Bergen und Tälern dar. Berge entsprechen dabei grossen Entfernungen der Daten. Daten in einem gemeinsamen Tal gehören zusammen. Das nebenstehende Bild zeigt die U-Matrix des hexa Datensatzes mit 6 klar getrennten Gruppen. Die Animation des Trainings zeigt wie die Strukturen auf der Karte hervortreten. |
tiled U-Matrix
hexa
|
| Die P-Matrix (Ultsch 2003) stellt die Dichte der Daten über dem Gitter dar. Die Dichte wird dabei unter Verwendung einer informationstheroretisch optimalen Dischteschätzung, der sog. Pareto-Dichteschätzung errechnet. Die U*-Matrix (Ultsch 2003) kombiniert Distanz- und Dichte so dass in dichten Bereichen die Distanz zwischen Daten wenig ins Gewicht fällt. In dünn besiedelten Bereichen des hochdimensionalen Datenraumes werden die Distanzstrukturen der U-Matrix hingegen betont. Das nebenstehende Bild zeigt die P-Matrix des hepta Datensatzes, bei dem ein Cluster eine höhere Dichte (dunkel) als die anderen besitzt. | tiled P-Matrix
hepta
|
| Bei der Verwendung von randlosen ESOM sollte man die Visualisierungen in einer gekachelten (tiled) Ansicht darstellen. Dabei wird die Karte viermal dargestellt. Die entstehende Redundanz kann man durch eine Inselansicht beheben. Dabei wird aus der gekachelten Ansicht eine Insel ausgeschnitten die jeden Gitterpunkt der Karte genau einmal darstellt. Die Darstellung als interaktive 3D Landschaft erzeugt eine intuitive Visualisierung der Daten als Landschaft, wie in diesem animierten Beispiel. | hexa U-Matrix island
hexa
|

