Tableauで大規模データソースをパブリッシュしたかった背景
この記事を読んで頂いている方はご存じかと思いますが、Tableauには「抽出」「ライブ」というデータソースへの接続方法の違いがあります。(簡単にまとめていますのでよろしければTableauデータソースの抽出とライブ接続の違いご参考ください)
そして、データソースのサーバー負荷軽減やTableauのパフォーマンス向上を考えると抽出接続が望ましい状況でした。しかし、データ量が多く一回では実施できない状況でした。(データソース側の設定で、抽出の実行が10分を過ぎるとクエリkillされてしまう状況だった)
その時に実行した方法をまとめてみます。
Tableauで大規模データソースを抽出パブリッシュする方法
パラメータと計算フィールドを利用して抽出を作成する方法
任意の期間にデータを分けて抽出ファイルを作成していく方法となります。
今回の例では、計算フィールド「DATEPART(‘year’, [Order Date]) = DATEPART(‘year’, DATE(‘2019/01/01’))」と増分更新を利用し年単位でデータを分けて、抽出ファイルを作成していきます。
- Tableau Desktopを開きます。
・データベースへ接続します。
・計算フィールド”抽出更新分け用”「DATEPART(‘year’, [Order Date]) = DATEPART(‘year’, DATE(‘2019/01/01’))」を作成します。 - 計算フィールド”抽出更新分け用”を「真」の条件で抽出のフィルタにします。
- 最初の抽出は完全更新で実行します。
- 計算フィールド”抽出更新分け用”の計算式の年の値を次の年に変更します。
- 抽出の増分更新に変更します。
※以後の抽出分は増分更新を使用します。 - 「保存」ボタンをクリックします。
※「保存」ボタンを押すまで、増分更新分のデータが抽出ファイルに反映されないので、ご注意ください。 - 計算フィールド”抽出更新分け用”の計算式の年の値を翌年に変更します。
- データソースを右クリックして、「抽出」→更新(増分)をクリックします。
- 「保存」ボタンをクリックします。
- 9-11の手順を繰り返し、抽出ファイルを最新の年のデータまで更新します。それ以後、日頃に抽出ファイルを更新する場合、計算フィールドで「TODAY() > #2022-07-20#」のように、特定の日付以降は「真」となる条件を作成し、増分更新のフィルタ条件とします。
空のデータソースをパブリッシュして増分更新で追加する方法もあるようです!
https://www.tableau.com/ja-jp/blog/easy-empty-local-extracts
Tableauで大規模抽出データソースをパブリッシュする方法まとめ
以上が、大規模データソースをパブリッシュする方法となります。
今回は、パラメータと計算フィールドを利用してから抽出を作成する方法を紹介いたしました。
ケースに応じてご活用ください!
Tableauを使いこなせると、データアナリストやWEBアナリストといった職種の方は業務の幅が広がるかと思います!
また、もしIT業界への転職でお悩みの方はIT転職に特化した Geekly へのご相談をご検討ください!(わたくしも転職の際に利用させていただき、ご縁を頂きました)
- Tableauおススメ学習本
Tableau関連記事
そのほかのTableau関連記事はこちらにまとめておりますのでご参考ください。
>Coffee Tech Blog Tableau関連記事
参考になれば幸いです☕
コメント