Tableau Prep - modelowanie danych
Praca na Tableau Server i Tableau Cloud
Blendowanie w przeciwieństwie do Relacji i Joins nie oznacza tak naprawdę łączenia źródeł danych. Pozwala ono na zestawienie dwóch i więcej różnych źródeł danych, ale podczas pracy Blend kieruje zapytania bezpośrednio i niezależnie do każdego ze źródeł. Wyniki są agregowane na pewnym określonym poziomie, a następnie zaprezentowane w formie wizualnej. Z tego powodu blendowanie może odbywać się na różnym poziomie szczegółowości i z użyciem publikowanych źródeł danych.
Blendy nie tworzą nowego źródła danych (zblendowanego) i stąd też nie może ono zostać opublikowane jako „blended data source”.
Blendowanie odbywa się indywidualnie na poziomie konkretnego arkusza, stąd jest ono szczególnie przydatne, gdy do naszej analizy potrzebujemy stworzyć relacje w sposób różny w każdym z arkuszy bądź przy użyciu publikowanych źródeł danych.
Blend niejako przypomina tylko w swoim działaniu typ połączenia Join z lewej strony.
Jak wcześniej napisaliśmy, blendowanie odbywa się w każdym arkuszu oddzielnie i ustanawia się w momencie, gdy pole z drugiego źródła danych zostanie użyte na widoku.
Aby utworzyć połączenie typu blend w workbooku, musisz połączyć się z co najmniej dwoma źródłami danych. Przenieś pole z jednego źródła danych do arkusza, wówczas stanie się ono głównym źródłem danych. Przełącz się na drugie źródło danych i użyj pola na tym samym widoku - stanie się ono drugim źródłem danych. W panelu danych pojawi się ikona łączenia, wskazująca, które pole lub pola są używane do połączenia źródeł danych.
Upewnij się, że workbook ma wiele źródeł danych. Drugie źródło danych należy dodać przechodząc do Data
i New data source
.
(Do blenda wymagane są dwa lub więcej odrębnych źródeł danych, które pokazują się niezależnie w panelu Data
. Dodanie kolejnego połączenia do pierwszego źródła danych umożliwia relacje i łączenia na stronie Data Source
.
Przeciągnij dowolne pole z pierwszego źródła do widoku. To źródło danych będzie głównym źródłem danych.
Przełącz się na inne źródło danych i sprawdź czy istnieje relacja łączenia z głównym źródłem danych:
ikona pola łączącego, która oznacza źródła danych są automatycznie połączone. Dane można łączyć, o ile istnieje co najmniej jedno aktywne łącze.
ikona przerwanego łącza. Jeśli pole takie powinno łączyć dwa źródła danych, kliknij ikonę obok niego (prawym przyciskiem). Ukośnik zniknie reprezentując aktywne łącze.
❔
Jeśli ikona łącza nie pojawi się obok żądanego pola, zobacz Definiowanie połączeń do blendowania.
Przeciągnij pole do widoku z pomocniczego źródła danych.
Gdy tylko to drugie źródło danych zostaje użyte na tym samym widoku, blend znajduje zastosowanie. W poniższym przykładzie naszym podstawowym źródłem danych jest Sample - Superstore, a pomocniczym źródłem danych jest Sales Target.
→ Podstawowe źródło danych jest oznaczone niebieskim znacznikiem na źródle danych (1). Pola z podstawowego źródła danych używane na widoku nie mają żadnego wskazania.
→ Pomocnicze źródło danych jest oznaczone pomarańczowym znacznikiem na źródle danych (2) i pomarańczowym paskiem z boku panelu Data (3). Pola z pomocniczego źródła danych używane w widoku mają pomarańczowy znacznik wyboru (4).
Łączenie danych w blend wymaga podstawowego źródła danych i co najmniej jednego dodatkowego źródła danych. Pierwsze źródło danych używane w widoku staje się podstawowym źródłem danych i definiuje widok. Może to ograniczyć wartości z pomocniczego źródła danych - w widoku pojawiają się tylko wartości, które mają odpowiadające dopasowania w podstawowym źródle danych. Jest to porównywalne z połączeniem Join z lewej strony.
Przykładowo, jeśli podstawowe źródło danych ma pole Miesiąc, które zawiera tylko styczeń, luty, marzec, każdy widok zbudowany wokół miesięcy będzie wyświetlał tylko styczeń, luty i marzec, nawet jeśli dodatkowe źródło danych ma wartości dla pozostałych dziewięciu miesięcy. Jeśli pożądana analiza obejmuje wszystkie dwanaście miesięcy, należy zmienić źródło danych, które jest podstawowe, przebudowując arkusz i najpierw używając tego drugiego źródła danych.
Do budowania połączeń typu blend Tableau musi rozpoznać wspólny wymiar lub wymiary między łączonymi źródłami danych. Ten wspólny wymiar nazywa się polem łączącym, ang. link. Aktywne linki są identyfikowane w panelu Data
dla drugorzędnego źródła danych za pomocą ikony aktywnego łącza, a potencjalne pola łączące są identyfikowane za pomocą ikony przerwanego łącza. Linki nie są wskazywane w podstawowym źródle danych. Np. w mieszance danych transakcyjnych i wartościowych, pole geograficzne może być pożądanym polem łączącym, dzięki czemu można analizować zarówno kwotę, jak i wydajność w odniesieniu do tej kwoty dla tego samego miasta, stanu, kraju.
<aside> 📢
Wskazówka: Aby blend zadziałał, pola łączące muszą również współdzielić wartości albo pewne elementy. Tableau tworzy widok z połączonych danych na podstawie współdzielonych wartości. Np. jeśli Kolor jest polem łączącym w obu źródłach danych, Tableau dopasuje Biały z podstawowego źródła z kolorem Biały z pomocniczego. Z kolei Róż nie będzie poprawnie dopasowany do Różowy. Aby pomóc Tableau zidentyfikować pola łączące, możesz zmienić nazw pól bądź edytować aliasy dla określonych wartości w tych polach.
</aside>
Jeśli pole łączące w podstawowym i pomocniczym źródle danych ma taką samą nazwę, Tableau automatycznie tworzy relację. Gdy podstawowe źródło danych zostanie ustanowione (tj. pole zostanie użyte na widoku) i pomocnicze źródło danych zostanie wybrane w panelu Data
, wszystkie pola o tej samej nazwie między dwoma źródłami danych będą wyświetlać ikonę łącza w pomocniczym źródle danych. Jeśli powiązane pole z podstawowego źródła danych jest używane w widoku, łącze staje się automatycznie aktywne.
Jeśli w źródle danych pomocniczych nie ma ikon linków, konieczne może okazać wsparcie Tableau w ustanowieniu takiego linku na jeden z dwóch sposobów:
Wybierz Data
– Edit Blend Relationships…
.
W oknie dialogowym Blend Relationships
sprawdź czy podstawowe źródło danych zostało wybrane z listy rozwijanej jako Primary data source
.
Wybierz źródło danych pomocniczych w sekcji Secondary data source
. W tabeli z prawej strony przy zaznaczeniu Automatic
widoczne są wszystkie łączniki automatycznie wykryte przez Tableau.
Wybierając Custom
zyskujemy możliwość ręcznego dodawania pól mapujących na liście relacji blenda. W tym celu wybierz Add
. W nowym oknie dialogowym Add/Edit Field Mapping
: wybierz pole z podstawowego źródła danych oraz porównywalne pole z pomocniczego źródła i kliknij OK
.
⭐ Ważne: W przypadku dat, blend można określić bardzo precyzyjnie. Rozwiń pole daty i wybierz pożądany jej aspekt, tj. dokładna data, miesiąc, kwartał, rok, itp.
Utwórz tyle mapowań pól, ile chcesz, a następnie kliknij OK.
Podobnie jak w przypadku relacji lub połączeń, zdarzają się sytuacje, gdy powiązania między źródłami danych są definiowane przez więcej niż jedno pole. Np. jeśli regionalne limity sprzedaży są tygodniowe, połączenie danych transakcyjnych sprzedaży i danych limitów musi zostać ustanowione zarówno dla regionu, jak i tygodni, aby poprawne dane zostały zebrane razem na widoku. To oznacza, że wiele linków może być aktywnych w tym samym czasie.
Ze względu na charakter danych zblendowanych, należy pamiętać o kilku kwestiach podczas pracy na połączonych źródłach danych.
Wykonywanie kalkulacji z polami z więcej niż jednego źródła danych może się nieznacznie różnić od zwykłych kalkulacji. Kalkulacje muszą zostać utworzone w jednym źródle danych. Górna część edytora obliczeń wskazuje, w którym źródle danych znajduje się obliczenie - tuż obok nazwy nadanej kalkulacji.
Oprócz nieco innego sposobu obsługi obliczeń istnieją pewne ograniczenia dotyczące drugorzędnych źródeł danych. Sortowanie według pola z drugorzędnego źródła danych może nie być możliwe, a filtry akcji mogą nie działać zgodnie z oczekiwaniami w przypadku danych mieszanych.
Przeczytaj więcej w temacie blendowania na stronie: