はじめに
Tableauでは、データソースへのアクセス方法として「抽出(Extract)」と「ライブ接続(Live Connection)」の2つの方法があります。
Tableau Desktop使い始めころに気になったのでこちらの違いをまとめてみたいと思います。
この様な方向けの記事となります
- Tableau Desktop使い始めの方
- Tableauのデータソース接続方法の違いを知りたい
Tableau Desktop データソースの「抽出」「ライブ」接続の違い
データソースの抽出(Extract)
データをTableauの独自の形式(.hyper)で抽出し、Tableauのワークブックに保存する方法です。
以下はデータソースの抽出の特徴となります。
- データの抽出と保存
- データソース全体または特定の範囲を抽出し、ワークブックに保存します。このデータはTableauの独自のデータ形式であり、ワークブックに組み込まれます。
- ローカルデータ
- データソースの抽出は、データをローカルのワークブックに格納するため、ネットワーク接続がない場合でもデータを表示できます。
- パフォーマンス
- データソースの抽出は、データを事前に抽出しており、データの読み取り速度が高速になることがあります。
- ファイルサイズ
- 抽出データは、ワークブック内のデータのコピーとして保存されるため、抽出データが大量にある場合はワークブックのサイズが大きくなります。
ライブ接続(Live Connection)
データソースに対してリアルタイムでクエリを発行し、データを取得する方法です。
以下はライブ接続の特徴となります。
- リアルタイムデータ
- ライブ接続では、データソースに対して直接クエリを発行し、データを取得します。データの最新情報が表示されます。
- ネットワーク接続が必要
- ライブ接続では、データソースに対してネットワーク接続が必要です。データソースが更新されるたびに最新のデータを取得できます。
- パフォーマンス
- クエリの実行時にデータベースやデータソースに対する処理が行われるため、データの読み取り速度はデータベースやデータソースのパフォーマンスに依存します。
- ファイルサイズ
- ワークブックにはデータが保存されないため、ワークブックのファイルサイズは比較的小さくなります。
- データ更新の柔軟性
- ライブ接続では、データソースが更新されるたびに最新のデータを表示できます。データの変更や更新は即座に反映されます。
- データのセキュリティ
- ライブ接続では、データソース自体が保持しているセキュリティ対策が適用されます。データの抽出や保存が行われないため、データの保護が容易です。
Tableauでの抽出とライブの適用例
どちらの方法を選択するかは、具体的な要件や状況によって異なります。以下は、一般的なシナリオでの適用例です。
- データのサイズが大きい場合やオフラインでの作業が必要な場合は、データソースの抽出を使用したほうがよいかもしれません。データの読み込み速度が向上し、ワークブックをネットワークに接続せずに表示できます。
- データソースにクエリ従量課金のデータベースを使用している場合も、抽出がよいかもしれません。デスクトップでダッシュボード作成する際のドラッグアンドドロップやフィルタ操作のたびにデータソースに対してクエリが走るためです。これらの操作で課金が発生します。
- データが頻繁に変更される場合やリアルタイムの分析が必要な場合には、ライブ接続を使用します。最新のデータが表示され、リアルタイムでの分析やダッシュボードの作成が可能になります。
データソースの抽出とライブ接続の両方を使用することもできます!
必要に応じて適切な方法を選択し、データの分析や視覚化に活用してみてください!
Tableauでの抽出とライブの変更方法
デスクトップ右上の接続「ライブ」「抽出」を選択することで変更可能です。抽出を選択すると.hyperファイルが作成されます。
データ量が多いとかなり時間がかかりますので、Tableau Desktopで開発の際にはフィルタして一部のデータのみで開発する、というのもよいかと思います
補足
- 大規模データをパブリッシュする際のテクニックも紹介しておりますのでご参考ください
参考になれば幸いです☕
コメント