BigQuery が Google Drive と統合
2016年5月13日金曜日
* この投稿は米国時間 5 月 6 日、BigQuery の Technical Program Manager である Tino Tereshko によって投稿されたもの(投稿はこちら)の抄訳です。
Google BigQuery は、サーバーレスでフルマネージドのアナリティクス データ ウェアハウスです。ユーザーにダウンタイムなどの負担をかけることなく、頻繁に新機能とアップグレードを提供しています。
BigQuery をさらに使いやすくするため、BigQuery チームはユーザーの生産性や相互運用性を高める機能の提供に力を注いでいます。チームが先ごろ発表した Google Drive との統合はその一環であり、これによって次のことが可能になります。
人気モバイル ゲームの Fruit Ninja を開発している Halfbrick Studios では、こうした新機能を一足早く体験しました。同社のデータ アナリストである Sam Gillespie 氏は、その感想を次のように語っています。
私の音楽的センスは別として、これらのアーティストが出している人気の曲のリストを、BigQuery の公開プレイリスト データを使って作りたいと思います。私の好みは頻繁に変わるので、プレイリストも頻繁に変えられるようにしたいところです。
まず、BigQuery の新テーブル作成 UI を使用して、Google Sheets のアーティスト リスト スプレッドシートを直接読み出す BigQuery テーブルを定義します。
これでテーブルを定義できました。このテーブルを使ってクエリを発行すれば、プレイリストから人気曲を取り出すことができます。
ただし、今は単に楽しみたいだけなので、“Never Gonna Give You Up”(絶対に諦めない)という Rick Astley との約束を破り、Cyndi Lauper を聞くことにしましょう。その場合は Google Sheets スプレッドシートを更新するだけです。
そして、BigQuery で SQL クエリを再実行してみましょう。“artists” テーブルはスプレッドシートの内容を直接読み出してくるので、Cyndi Lauper の曲を知りたいということが BigQuery にシームレスに伝わるはずです。
Google Sheets スプレッドシートの内容を “Time After Time”(何度も何度も)変えても、スプレッドシートを使ったクエリを次に実行したときには、BigQuery が自動的に新しい内容を読み出してくれます。
これらの機能の詳細については、フェデレーション データ ソースのドキュメントを参照してください。
ちなみに、3 月に開催された GCP NEXT 2016 で、私たち Google は BigQuery と Google Drive の統合のほか、次のようなアップデートについても発表しました。
いつもと同じように、BigQuery はこれらの機能をシームレスにお届けします。ダウンタイムはなく、行動を起こしたり構成をいじったりする必要もありません。フルマネージドの真価はここにあるのです。
- Posted by Tino Tereshko, BigQuery Technical Program Manager
Google BigQuery は、サーバーレスでフルマネージドのアナリティクス データ ウェアハウスです。ユーザーにダウンタイムなどの負担をかけることなく、頻繁に新機能とアップグレードを提供しています。
BigQuery をさらに使いやすくするため、BigQuery チームはユーザーの生産性や相互運用性を高める機能の提供に力を注いでいます。チームが先ごろ発表した Google Drive との統合はその一環であり、これによって次のことが可能になります。
- BigQuery UI から Google Sheets へのクエリ結果の直接保存
- Google Drive からファイルへの直接クエリ(BigQuery へのロード不要)
- BigQuery から編集中の Google Sheets スプレッドシートへのクエリ
人気モバイル ゲームの Fruit Ninja を開発している Halfbrick Studios では、こうした新機能を一足早く体験しました。同社のデータ アナリストである Sam Gillespie 氏は、その感想を次のように語っています。
「Google Sheets の柔軟性と BigQuery の地力が結びつき、結果やインサイトをよりスピーディにシェアできるようになった。BigQuery に Google Sheets を直接リンクすることで、使い慣れたインターフェースでデータに新情報を加えることが可能だ。今まで以上に迅速にデータから学べるし、アナリストがどこにいても彼らのデータを取得できる」
Google Sheets を BigQuery テーブルとして利用
Google Sheets スプレッドシートを参照するテーブルを BigQuery に作ることができます。たとえば私は、Google Sheets を使ってお気に入りのミュージシャンを管理しています。私の音楽的センスは別として、これらのアーティストが出している人気の曲のリストを、BigQuery の公開プレイリスト データを使って作りたいと思います。私の好みは頻繁に変わるので、プレイリストも頻繁に変えられるようにしたいところです。
まず、BigQuery の新テーブル作成 UI を使用して、Google Sheets のアーティスト リスト スプレッドシートを直接読み出す BigQuery テーブルを定義します。
これでテーブルを定義できました。このテーブルを使ってクエリを発行すれば、プレイリストから人気曲を取り出すことができます。
ただし、今は単に楽しみたいだけなので、“Never Gonna Give You Up”(絶対に諦めない)という Rick Astley との約束を破り、Cyndi Lauper を聞くことにしましょう。その場合は Google Sheets スプレッドシートを更新するだけです。
そして、BigQuery で SQL クエリを再実行してみましょう。“artists” テーブルはスプレッドシートの内容を直接読み出してくるので、Cyndi Lauper の曲を知りたいということが BigQuery にシームレスに伝わるはずです。
Google Sheets スプレッドシートの内容を “Time After Time”(何度も何度も)変えても、スプレッドシートを使ったクエリを次に実行したときには、BigQuery が自動的に新しい内容を読み出してくれます。
クエリ結果の Google Sheets への保存
BigQuery UI に表示された “Save to Google Sheets” ボタンをクリックすると、クエリの結果が Google Sheets に保存され、スプレッドシートを開くためのプロンプトが表示されます。これらの機能の詳細については、フェデレーション データ ソースのドキュメントを参照してください。
ちなみに、3 月に開催された GCP NEXT 2016 で、私たち Google は BigQuery と Google Drive の統合のほか、次のようなアップデートについても発表しました。
- Long Term Storage(長期保存)の料金を 50 % 値下げ
- 多くのクエリのスピードを 10 倍以上に高速化する Capacitor ストレージ エンジン
- データのロード スピードを 5 倍に高速化する Poseidon データ インジェスト/イグレス エンジン
- Table Partitions のアルファ版
いつもと同じように、BigQuery はこれらの機能をシームレスにお届けします。ダウンタイムはなく、行動を起こしたり構成をいじったりする必要もありません。フルマネージドの真価はここにあるのです。
- Posted by Tino Tereshko, BigQuery Technical Program Manager
0 件のコメント :
コメントを投稿