* この投稿は米国時間 5 月 6 日、BigQuery の Technical Program Manager である Tino Tereshko によって投稿されたもの(投稿はこちら)の抄訳です。


Google BigQuery は、サーバーレスでフルマネージドのアナリティクス データ ウェアハウスです。ユーザーにダウンタイムなどの負担をかけることなく、頻繁に新機能とアップグレードを提供しています。


BigQuery をさらに使いやすくするため、BigQuery チームはユーザーの生産性や相互運用性を高める機能の提供に力を注いでいます。チームが先ごろ発表した Google Drive との統合はその一環であり、これによって次のことが可能になります。


  • BigQuery UI から Google Sheets へのクエリ結果の直接保存
  • Google Drive からファイルへの直接クエリ(BigQuery へのロード不要)
  • BigQuery から編集中の Google Sheets スプレッドシートへのクエリ


人気モバイル ゲームの Fruit Ninja を開発している Halfbrick Studios では、こうした新機能を一足早く体験しました。同社のデータ アナリストである Sam Gillespie 氏は、その感想を次のように語っています。

「Google Sheets の柔軟性と BigQuery の地力が結びつき、結果やインサイトをよりスピーディにシェアできるようになった。BigQuery に Google Sheets を直接リンクすることで、使い慣れたインターフェースでデータに新情報を加えることが可能だ。今まで以上に迅速にデータから学べるし、アナリストがどこにいても彼らのデータを取得できる」


Google Sheets を BigQuery テーブルとして利用

Google Sheets スプレッドシートを参照するテーブルを BigQuery に作ることができます。たとえば私は、Google Sheets を使ってお気に入りのミュージシャンを管理しています。



私の音楽的センスは別として、これらのアーティストが出している人気の曲のリストを、BigQuery公開プレイリスト データを使って作りたいと思います。私の好みは頻繁に変わるので、プレイリストも頻繁に変えられるようにしたいところです。

まず、BigQuery の新テーブル作成 UI を使用して、Google Sheets のアーティスト リスト スプレッドシートを直接読み出す BigQuery テーブルを定義します。



これでテーブルを定義できました。このテーブルを使ってクエリを発行すれば、プレイリストから人気曲を取り出すことができます。


ただし、今は単に楽しみたいだけなので、“Never Gonna Give You Up”(絶対に諦めない)という Rick Astley との約束を破り、Cyndi Lauper を聞くことにしましょう。その場合は Google Sheets スプレッドシートを更新するだけです。



そして、BigQuery で SQL クエリを再実行してみましょう。“artists” テーブルはスプレッドシートの内容を直接読み出してくるので、Cyndi Lauper の曲を知りたいということが BigQuery にシームレスに伝わるはずです。



Google Sheets スプレッドシートの内容を “Time After Time”(何度も何度も)変えても、スプレッドシートを使ったクエリを次に実行したときには、BigQuery が自動的に新しい内容を読み出してくれます。


クエリ結果の Google Sheets への保存

BigQuery UI に表示された “Save to Google Sheets” ボタンをクリックすると、クエリの結果が Google Sheets に保存され、スプレッドシートを開くためのプロンプトが表示されます。



これらの機能の詳細については、フェデレーション データ ソースのドキュメントを参照してください。

ちなみに、3 月に開催された GCP NEXT 2016 で、私たち Google は BigQuery と Google Drive の統合のほか、次のようなアップデートについても発表しました。


  • Long Term Storage(長期保存)の料金を 50 % 値下げ
  • 多くのクエリのスピードを 10 倍以上に高速化する Capacitor ストレージ エンジン
  • データのロード スピードを 5 倍に高速化する Poseidon データ インジェスト/イグレス エンジン
  • Table Partitions のアルファ版


いつもと同じように、BigQuery はこれらの機能をシームレスにお届けします。ダウンタイムはなく、行動を起こしたり構成をいじったりする必要もありません。フルマネージドの真価はここにあるのです。


- Posted by Tino Tereshko, BigQuery Technical Program Manager