Tableau Prep - modelowanie danych
Praca na Tableau Server i Tableau Cloud
Podczas czyszczenia danych (zwłaszcza na początku swoich doświadczeń z Tableau Prep) możesz chcieć co jakiś czas sprawdzać dotychczasowe wyniki swojej pracy i zobaczyć swoje „nowe” dane w Tableau Desktop. Jest taka możliwość. Kiedy otworzysz przepływ w Tableau Desktop, Tableau Prep Builder utworzy dwa pliki: ekstrakt danych .hyper i plik źródła .tds. Oba te pliki są zapisywane w repozytorium Tableau w folderze Datasources. Dzięki temu masz możliwość, by eksperymentować z danymi w dowolnym momencie.
Po otwarciu przepływu w Tableau Desktop zobaczysz próbkę swoich danych wraz z zastosowanymi do niej operacjami, aż do wybranego kroku.
<aside> 💡
Wskazówka: Podczas takiej pracy na próbce danych nie będziesz mógł zapisać workbooka jako .twbx. Dopiero w momencie, gdy będziesz pewny i gotowy do pracy z danymi, tworzysz krok wyjściowy w przepływie w Tableau Prep i zapisujesz dane wyjściowe do pliku lub jako opublikowane źródło danych, a następnie łączysz się z takim źródłem danych w Tableau.
</aside>
Aby wyświetlić próbkę danych w programie Tableau Desktop:
Prawym przyciskiem myszy kliknij krok, w którym chcesz wyświetlić dane i wybierz opcję Preview in Tableau Desktop
z menu kontekstowego, które się pojawia.
Po bardzo krótkiej chwili wyświetli się okno z potwierdzeniem o zakończeniu uruchomionego przepływu.
Tableau Desktop otworzy się automatycznie na pustej zakładce – nazwa źródła odpowiadać będzie nazwie pliku .hyper.
Plik ekstraktu .hyper i plik źródła (.tds) zapisane w repozytorium Tableau w folderze Datasources.
Aby utworzyć dane wyjściowe (OUTPUT) przepływu, uruchom swój przepływ. Kiedy uruchomisz przepływ, zmiany zostają zastosowane do całego zestawu danych i to powoduje utworzenie pliku Tableau Data Source (.tds) i pliku Tableau Data Extract (.hyper).
Tutaj masz możliwość stworzyć plik ekstraktu danych wyjściowych przepływu, aby użyć go później w Desktopie albo udostępnić osobom trzecim. Plik ekstraktu możesz wygenerować w następujących formatach:
Hyper Extract (.hyper)
- najnowszy typ pliku ekstraktu Tableau.Comma Separated Value (.csv)
- umożliwia udostępnianie danych osobom trzecim. Kodowanie pliku CSV to UTF-8 z BOM.Microsoft Excel (.xlsx)
- arkusz kalkulacyjny Excel.Tu możesz opublikować dane wyjściowe przepływu jako źródło danych lub dane wyjściowe do bazy danych.
✔️ Zapisz dane wyjściowe przepływu jako źródło danych w Tableau Server lub Tableau Cloud, by dzielić się danymi i zapewnić jednolity dostęp do nich po oczyszczeniu.
✔️ Zapisz dane wyjściowe przepływu w bazie danych, aby utworzyć, zastąpić lub dołączyć dane tabeli do przygotowanych oczyszczonych danych przepływu.
✔️ Użyj odświeżania przyrostowego podczas uruchamiania przepływu, by zaoszczędzić czas i zasoby odświeżając tylko nowe dane zamiast całego zestawu.
<aside> 📢
Uwaga! Aby opublikować dane wyjściowe Prepa na Tableau Server, musi być włączony interfejs API REST serwera Tableau. Aby publikować na serwerze, który używa certyfikatów szyfrowania Secure Socket Layer (SSL), wymagane są dodatkowe kroki konfiguracji na komputerze, na którym działa Tableau Prep.
</aside>
Parametry w wynikach przepływu
Ciekawą i przydatną opcją w Tableau Prep (od wersji 2021.4) jest możliwość dodawania wartości parametrów w nazwach plików wyjściowych przepływu, ścieżkach, nazwach tabel lub niestandardowych skryptach SQL (od wersji 2022.1.1), aby łatwo uruchamiać przepływy dla różnych zestawów danych. Więcej na ten temat napiszemy w oddzielnym artykule.
Ta opcja generowania outputu nie jest dostępna podczas tworzenia lub edytowania przepływów w sieci.
Kliknij ikonę plusa ➕ na wybranym kroku i wybierz Add output
. Jeśli uruchomiłeś przepływ wcześniej, kliknij przycisk ▶️ uruchamiania przepływu na kroku Output
. Spowoduje to uruchomienie przepływu i zaktualizowanie outputu.
Otworzy się panel Output
, który wyświetli próbkę danych.
W panelu z lewej strony wybierz File
z listy rozwijanej Save output to
. W poprzednich wersjach była to Save to file
.
Kliknij przycisk Browse
, a następnie w oknie dialogowym Save Extract As
wprowadź nazwę pliku i kliknij Accept
.
W polu Output type
wybierz jeden z następujących typów:
▷ Ekstrakcja danych Tableau (.hyper)
▷ Arkusz kalkulacyjny Microsoft Excel (.xlsx)
▷ Wartości rozdzielone przecinkami (.csv)
W sekcji Write Options
wyświetl domyślną opcję aktualizacji, aby zapisać nowe dane do plików i wprowadzić wszelkie zmiany w razie potrzeby.
▷ Create table
tworzy nową tabelę lub zastępuje istniejącą tabelę nowym outputem.
▷ Append table
doda nowe wiersze do istniejącej tabeli. Jeśli tabela w momencie uruchomienia nie będzie istnieć, zostanie utworzona od nowa. Każde następne jej uruchomienia będą dodawać do niej wiersze. (Ważne: opcja Append to table
nie jest dostępna dla plików tekstowych .csv.)
Kliknij Run Flow
, aby uruchomić przepływ i wygenerować plik ekstraktu.
Ta opcja jest obsługiwana w Tableau Prep od wersji 2021.1.2 i nie jest dostępna podczas tworzenia lub edytowania przepływów w sieci.
Podczas budowania outputu danych przepływu do arkusza kalkulacyjnego Excel można utworzyć nowy arkusz albo dołączyć albo zastąpić dane w istniejącym arkuszu. Obowiązują następujące zasady:
Tworzenie outputu przepływu do arkusza kalkulacyjnego Microsoft Excel
Add Output.
File
z listy rozwijanej Save output to
.Browse
, a następnie w oknie Save Extract As
wprowadź lub wybierz nazwę pliku i kliknij Accept
.Output type
wybierz Microsoft Excel (.xlsx).Worksheet
wybierz arkusz, do którego chcesz zapisać wyniki lub wprowadź nową nazwę w polu, a następnie kliknij Create new worksheet „ „
.Write Options
wybierz jedną z następujących opcji zapisu:Run Flow
, aby uruchomić przepływ i wygenerować plik ekstraktu Excel.Add Output
.Save output
to wybierz Published data source
(Publish as data source
w poprzednich wersjach). Wypełnij następujące pola:Write Options
wyświetl domyślną opcję zapisu, aby zapisać nowe dane w plikach i wprowadzić wszelkie zmiany w razie potrzeby. Aby uzyskać więcej informacji, zobacz Konfigurowanie opcji zapisuRun Flow
, aby uruchomić przepływ i opublikować źródło danych.