Tableauでデータ量の多い抽出データソースをパブリッシュする方法(増分更新)

Tableau
※本ページにはプロモーションが含まれます
※本ページにはプロモーションが含まれます
スポンサーリンク

Tableauで大規模データソースをパブリッシュしたかった背景

この記事を読んで頂いている方はご存じかと思いますが、Tableauには「抽出」「ライブ」というデータソースへの接続方法の違いがあります。(簡単にまとめていますのでよろしければTableauデータソースの抽出とライブ接続の違いご参考ください)

そして、データソースのサーバー負荷軽減やTableauのパフォーマンス向上を考えると抽出接続が望ましい状況でした。しかし、データ量が多く一回では実施できない状況でした。(データソース側の設定で、抽出の実行が10分を過ぎるとクエリkillされてしまう状況だった)

その時に実行した方法をまとめてみます。

Tableauで大規模データソースを抽出パブリッシュする方法

パラメータと計算フィールドを利用して抽出を作成する方法

任意の期間にデータを分けて抽出ファイルを作成していく方法となります。

今回の例では、計算フィールド「DATEPART(‘year’, [Order Date]) = DATEPART(‘year’, DATE(‘2019/01/01’))」と増分更新を利用し年単位でデータを分けて、抽出ファイルを作成していきます。

  1. Tableau Desktopを開きます。
    ・データベースへ接続します。
    ・計算フィールド”抽出更新分け用”「DATEPART(‘year’, [Order Date]) = DATEPART(‘year’, DATE(‘2019/01/01’))」を作成します。
  2. 計算フィールド”抽出更新分け用”を「真」の条件で抽出のフィルタにします。
  3. 最初の抽出は完全更新で実行します。
  4. 計算フィールド”抽出更新分け用”の計算式の年の値を次の年に変更します。
  5. 抽出の増分更新に変更します。
    ※以後の抽出分は増分更新を使用します。
  6. 「保存」ボタンをクリックします。
    ※「保存」ボタンを押すまで、増分更新分のデータが抽出ファイルに反映されないので、ご注意ください。
  7. 計算フィールド”抽出更新分け用”の計算式の年の値を翌年に変更します。
  8. データソースを右クリックして、「抽出」→更新(増分)をクリックします。
  9. 「保存」ボタンをクリックします。
  10. 9-11の手順を繰り返し、抽出ファイルを最新の年のデータまで更新します。それ以後、日頃に抽出ファイルを更新する場合、計算フィールドで「TODAY() > #2022-07-20#」のように、特定の日付以降は「真」となる条件を作成し、増分更新のフィルタ条件とします。

空のデータソースをパブリッシュして増分更新で追加する方法もあるようです!
https://www.tableau.com/ja-jp/blog/easy-empty-local-extracts

Tableauで大規模抽出データソースをパブリッシュする方法まとめ

以上が、大規模データソースをパブリッシュする方法となります。

今回は、パラメータと計算フィールドを利用してから抽出を作成する方法を紹介いたしました。
ケースに応じてご活用ください!

Tableauを使いこなせると、データアナリストやWEBアナリストといった職種の方は業務の幅が広がるかと思います!

また、もしIT業界への転職でお悩みの方はIT転職に特化した Geekly へのご相談をご検討ください!(わたくしも転職の際に利用させていただき、ご縁を頂きました)

  • Tableauおススメ学習本

Tableau関連記事

そのほかのTableau関連記事はこちらにまとめておりますのでご参考ください。
>Coffee Tech Blog Tableau関連記事

参考になれば幸いです☕

コメント

タイトルとURLをコピーしました