Im vorletzten Customer Projekt hat sich der Kunde ausdrücklich gewünscht, dass wir ihm ein Sankey Diagramm bauen, damit er dieses dann nachbauen kann. Ein Sankey Diagramm bildet die Aufteilung von Kennzahlen ab, beispielsweise einen Stromfluss, der zunächst als Gesamtsumme am Hauptzähler gezählt wird und sich dann aufspaltet, so dass jeweils Untersummen an nachgelagerten Zählern gezählt werden.
Wenn man weiß, wie, ist es nicht schwer, ein Sankey Diagramm zu bauen. Das Geheimnis, ein Sankey Diagramm zu bauen, liegt darin, ein Template zu benutzen. Templates finden sich dutzende auf Tableau Public; besucht man die Seite, fällt einem auf, dass es sehr viele Templates für Sankey Diagramme gibt- die wenigstens Sankey Diagramme werden „von Grund“ auf gebaut, denn dann sind die Berechnungen der Kurvenkrümmungen sehr kompliziert. Im Folgenden gibt es eine kurze Anleitung, wie ein Template zu verwenden ist und wie man damit ein Sankey Diagramm aufbaut.
Von Tableau Public kann man sich als Erstes ein Template herunterladen. Als Beispiel benutze ich das Multilevel Sankey von Ken Flerlage. Ein Multilevel Sankey hat mehrere Stationen, an denen sich der dargestellte Strom aufspaltet, funktioniert aber vom Prinzip her gleich. Wichtig ist, das heruntergeladene Workbook zu entpacken (ein Workbook ist nichts anderes, als eine gezippte Datei). In diesem Workbook befindet sich- meist leicht auffindbar sortiert im Ordner „Daten“ oder ähnliches, eine Hyper-Datei, die alle Berechnungen des Diagramms enthält und die später benötigt wird.
In Tableau öffnet man die Datenquelle, deren Daten als Sankey Diagramm dargestellt werden soll. Parallel wird die Arbeitsmappe des Templates geöffnet. Aus dieser Arbeitsmappe wird das Dashboard mit dem Diagramm über den Dashboardreiter kopiert und in die Arbeitsmappe mit den eigenen Daten eingefügt.
Jetzt werden im Data Pane zwei Datenquellen angezeigt: die eigene und die des Sankey Templates.
Danach navigiert man über den Reiter Data Source zu der Datenquelle. Über „Add“ kann man eine weitere Datenquelle hinzufügen. Hier wird nun die Hyper Datei hinzugefügt, die vorhin entpackt wurde. Da jene Hyper Datei natürlich kein gemeinsames Feld mit der eigenen Datenquelle besitzt, behilft man sich eines Trickes. Zunächst zieht man die Hyper Datei auf die Canvas, um eine Relationship mit der eigenen Datenquelle herzustellen. Dann bearbeitet man diese Relationship, indem man jeweils im Dropdown Menü „Create Relationship Calculation“ auswählt und in das Calculation Field eine „1“ einträgt. Dadurch hat man eine Relationship hergestellt.
Nun kann man zurück zum Sheet navigieren. Im Data Pane tauscht man nun die Datenquellen, die eigne und die des Sankey Diagramms, gegeneinander aus.
Durch das Auswechseln der Datenquelle sind einige Kennzahlen fehlerhaft geworden und nun mit einem roten Ausrufezeichen gekennzeichnet. Um das zu beheben, navigiert man zu einer Pille, die originär ist, also nicht über ein berechnetes Feld erstellt wurde. Über das Drop Down Menü der Pille navigiert man zu „Replace References“ und sucht nach der richtigen Referenz. Wenn alle Pillen repariert sind, kann man beginnen, das Template auf die eigenen Daten zu „stülpen“. Meist verwenden die Ersteller von Templates leicht verständliche Namen, um die Benutzung einfach zu machen. Die Anfangs- und Endbalken, an dem der Strom beginnt bzw. endet, sind in den Sheets „Bars“ zu finden. Um die Bars anzupassen, muss man die Pillen, die als „Steps“ benannt sind und auch um Mark Field liegen, neu zuordnen. Ebenfalls ändert man hier über „Replace Reference“ die Bezugsgröße, diesmal allerdings gibt man jene Größe der eigenen Datenquelle an, die dargestellt werden soll. Diese Anpassung macht man für den Anfangs- und den Endbar, bei einem multilevel Sankey Diagramm ebenfalls für die Bars dazwischen. Sind alle Bars angepasst, passen sich die Kurven dazwischen automatisch an. Zuletzt muss noch die Kennzahl, die als Kurve dargestellt werden soll, ausgetauscht werden und fertig ist das Sankey Diagramm. Die Formatierung kann man im Anschluss wie gewohnt vornehmen. Zuletzt sei noch gesagt, dass man, verwendet man Templates, die andere User zur Verfügung gestellt haben und veröffentlicht das Ergebnis, diese User unbedingt auch namentlich erwähnen.