Tableau Prep - modelowanie danych
Praca na Tableau Server i Tableau Cloud
Filtry w Tableau pomagają w efektywnej i szybkiej wizualizacji danych. W zależności od charakteru danych, potrzeb i wymagań Tableau oferuje szereg różnych sposobów i rodzajów filtrowania. Każdy filtr jest zaprojektowany w ten sposób, by spełniał się najlepiej w danym scenariuszu biorąc pod uwagę to, czy dane pole jest wartością numeryczną bądź ciągiem znaków oraz w zależności od tego czy jest wymiarem czy też miarą. Korzystanie z filtrów w Tableau jest bardzo jasne i łatwe, a założenie filtrów może być wykonane bardzo szybko.
Filtrowanie jest niczym innym jak procesem ograniczania albo bardziej dosadnie „pozbywania się” pewnych wartości bądź zakresów wartości z pożądanych wyników. W przypadku na przykład, gdy dane źródłowe zawierają 50 tysięcy wierszy i z góry wiadomo, że w analizie potrzebne będzie jedynie 10% z nich, filtrowanie w Tableau zdecydowanie zmniejszy czas pracy z takimi danymi, ale i zwiększy jej efektywność. Jeśli chodzi o filtrowanie w Tableau, pozwala ono z jednej strony na użycie prostych scenariuszy, a z drugiej zaawansowanych kalkulacji czy filtrów kontekstowych.
Przed samym rozpoczęciem pracy w Tableau warto uzmysłowić sobie pewien porządek, według którego Tableau wykonuje operacje filtrowania. Porządek ten jest bardzo specyficzny i opera się na ściśle określonej kolejności wykonywania działań (w angielskim znany pod pojęciem Order of Operations czy Query Pipeline). Wygląda ona następująco:
Filtr może być założony na marks, które pokazują się już na samym widoku. Przykładowo, dla wizualizacji w formie Scatter Plot wartości odstające można wykluczyć z widoku, aby skupić uwagę odbiorcy na pozostałych. Aby to zrobić, wybierz taki konkretny punkt. W okienku, które się pojawi, wybierz Exclude
.
Wynik będzie następujący:
Jeśli z kolei konieczne jest skupienie uwagi na kilku punktach odstających, kliknij w dowolne miejsce na widoku i przeciągnij myszką zaznaczając kilka marks.
W okienku, które się pojawi, wybierz Keep Only
, aby zachować tylko te wartości na widoku:
Wynik będzie następujący:
Innym sposobem wykorzystania funkcjonalności filtrowania na widoku jest oznaczenie nagłówków wierszy lub kolumn. W tym celu wybierz dany nagłówek. W okienku, które się pojawi wybierz Keep Only
bądź Exclude
podobnie jak w przykładach omówionych wcześniej.
Jeśli wybierzesz nagłówek tabeli, który jest częścią składową hierarchii, podświetlone zostaną także wszystkie nagłówki poziomu niższego. Przykładowo, przytrzymując klawisz CTRL zaznaczono dwa niezależne wymiary, z których każdy ma swoją hierarchię - w kolumnach region East i w wierszach kategorię Office Supplies. Wszystkie wartości które są zawarte w (wewnątrz) hierarchii w poziomie niższym zostały automatycznie zaznaczone. Dalej w okienku, które się pojawia można dokonać wyboru uwzględnienia bądź wykluczenia tych wartości.
Poniżej wynik po wybraniu opcji Keep Only
.
Jeśli wybierzesz nagłówek tabeli, który jest częścią składową hierarchii, ale jest na najniższym jej poziomie, podświetlony zostanie jedynie ten nagłówek, który wybierzesz. Przykładowo, przytrzymując klawisz CTRL zaznaczono wymiary: stan Kansas i Nebraska oraz sub-kategorię Accessories, każdy indywidualnie. Dalej w okienku, które się pojawia można dokonać wyboru uwzględnienia bądź wykluczenia tych wartości.
Poniżej wynik po wybraniu opcji Keep Only
.
Kolejnym sposobem na stworzenie filtra jest przeciągnięcie danego pola bezpośrednio z panelu danych (Data Pane
) na półkę filtrowania (Filters Shelf
).
Po przeciągnięciu pola, wyskakuje okienko dialogowe, w którym możesz określić szczegóły działania filtra. To, jak będzie wyglądać okienko dialogowe filtrowania, zależy czy do filtrowania użyjesz pola wymiaru, miary bądź daty.
Wybierając przykładowo pole Product ID, pojawi się okno, jak poniżej.
W zakładce:
GENERAL
WILDCARD
CONDITION
TOP