Google、常時稼働型AIエージェント「Gemini Spark」発表。PCを閉じてもクラウド上で自律動作

3週間前

Googleは5月19日（現地時間）、開発者会議「Google I/O 2026」で、パーソナルAIエージェント「Gemini Spark」を発表した。GmailやGoogleドキュメントなどと連携し、ユーザーに代わって複数のタスクを継続的に処理する。今週から一部テスター向けに展開を開始し、来週には米国の「Google AI Ultra」加入者向けにベータ提供を始める。

近年の生成AIは、質問への回答や文章生成を中心に進化してきた。一方で各社は、ユーザーの代わりにアプリやWebサービスを操作し、複数の作業をまたいで処理する「AIエージェント」へと軸足を移し始めている。

「Gemini Spark」も、そうした流れの中で投入される新サービスだ。Googleは、これまで「Gemini」を検索、Workspace、Androidなど各種サービスに広げてきたが、Sparkではさらに踏み込み、ユーザーが常時起動している専属アシスタントとして機能させる考えだ。

「Gemini Spark」は、最新モデル「Gemini 3.5」と、エージェント開発基盤「Antigravity」をベースに構築されている。処理はGoogle Cloud上の専用仮想マシンで実行されるため、ノートPCを閉じたあとでもタスクを継続できる。端末側のリソースをほぼ消費せずに動作する点も特徴だ。

Google Workspaceとの連携も大きな柱となる。Gmail、Googleドキュメント、Googleスライド、Googleドライブなどと接続し、イベント準備や日程調整、メール返信、資料整理といった複数工程の作業をまとめて処理する。

macOS版「Gemini」も公開。ローカルファイル操作や音声入力強化

Googleはあわせて、macOS版の「Gemini」も全ユーザー向けに公開した。Gemini Sparkは同アプリ経由でも利用可能で、当面は米国のGoogle AI Ultraユーザー向けに提供される。

macOS版では、ローカルファイルの整理、PDFからのデータ抽出、Google SheetsやGmailへの直接転送などにも対応する。クラウドサービスだけでなく、Mac内のファイル操作まで含めて処理範囲を広げる構成だ。

新しい音声理解機能も搭載した。ユーザーが「えーっと」「ところで」といった言い淀みを含めて話しても、画面上の文脈を踏まえて内容を整理し、自然な文章としてカーソル位置へ反映する。Googleは、この新音声体験を今後数週間以内に全世界へ展開するとしている。

また、「Gemini Spark」では安全性対策も盛り込まれる。メール送信、支払い、カレンダー登録など影響の大きい操作を実行する際には、ユーザー確認を必須とする。専用ダッシュボードから、バックグラウンドで進行中のタスクを確認・管理することも可能だ。

外部サービス連携も今後拡大する。Googleは、MCP（Model Context Protocol）経由で、Canva、OpenTable、Instacartなどとの連携を今夏に開始予定としている。さらにChrome上で直接動作するエージェント機能も追加予定で、複数サイトを横断したタスク実行にも対応する計画だ。

なお、Googleは同時にAIサブスクリプション体系も改定した。新たに月額100ドルの「Google AI Ultra」プランを投入し、既存上位プランは250ドルから200ドルへ値下げする。

情報ソース