Tips

Google I/O 2026 深掘り解説。Gemini 3.5 × AI Mode が変える「検索」の常識

扇谷洋平

2026-06-17

💡 この記事のポイント

AIが「回答する存在」から「実行するエージェント」へ：Gemini 3.5では、Function Callingやバックグラウンドでの処理能力が強化され、情報生成だけでなく、タスクを自律的に実行できるようになりました。
高速・高品質・低コストを両立：Gemini 3.5 Flashは、動的な計算リソースの配分と100万トークン規模の長いコンテキスト処理に対応。高速かつ高度な分析性能を両立しています。
検索結果から対話へ、シームレスな移行：AI OverviewsとAI Modeが検索内容や閲覧していた情報を引き継いだまま、連続して質問できるようになりました。
画像・音声を組み合わせたマルチモーダル検索：テキストでは説明しにくい商品やグラフ、デザインなどを画像で示し、音声で質問するといった検索が可能になります。
24時間動き続ける情報収集エージェント：ブラウザを閉じた後も、AIがクラウド上で情報を検索し続け、条件に合う情報を見つけるとメールや通知で知らせてくれます。

Google I/O 2026でGoogleが示したのは、単なる新機能の追加ではありません。世界中のユーザーが情報を検索し、比較し、意思決定する方法そのものを大きく変える構想です。「AI Mode（AIモード）」はもはや検索結果の補足機能ではなく、日常的な検索体験の中心へと進化しつつあります。

これはGoogle検索誕生から25年で最も根本的なアーキテクチャの刷新といえるでしょう。

今回の発表では、次世代基盤モデル「Gemini 3.5」への進化と、ユーザーが直接触れる検索インターフェース「AI Mode」のアップデートが示されました。この2つが組み合わさることで、検索ボックスは「能動的に推論し、長期記憶を持つ仮想エージェント」へと変貌しました。

本記事では、Google I/O 2026で明らかになった2つの重要な進化を解説します。

※本記事は、awoo Intelligence Inc.が公開した下記ブログ記事を日本語に翻訳・編集したものです。
原文：https://www.awoo.ai/zh-hant/blog/google-i-o-2026-ai-mode/

コンテンツ

注目ポイント1：Gemini 3.5の進化。情報生成から自律実行型エージェントへ

Googleは今回、パラメータ数を競う量的な拡張ではなく、「実際に動けるシステム」としてGemini 3.5を設計しました。これがAI Modeのスムーズな動作を支える根幹となっています。

1. Gemini 3.5 フラッグシップモデル：Function Callingをモデルの中核に統合

これまでのモデルは「情報のまとめ役」に過ぎず、ウェブページのテキストを読んで出力するだけでした。新しいGemini 3.5は、「Function Calling」と呼ばれるツール呼び出し機能をトレーニング段階からニューラルネットワークの深層に組み込んでいます。

Gemini 3.5はWebページを読み取る際、自律的にセマンティック推論を行い、検索ボックス・プルダウン・購入ボタンを「操作可能な外部ツール」として認識します。これにより、複数のWebサイトをまたぐ複雑なタスクを分解し、必要に応じて実際の操作まで進める「エージェント」としての能力を獲得しました。

2．Gemini 3.5 Flash：100万トークン規模の長期記憶でパーソナルエージェントを実現

もう一つの注目株は、大規模かつ効率的な処理を想定して設計された「Gemini 3.5 Flash」です。AI Modeとパーソナルアシスタントのバックエンドとして採用されたこのモデルの最大の特長は、圧倒的なコストパフォーマンスと、100万トークン規模のロングコンテキストウィンドウの両立です。

ユーザー体験の変化：AIが大量の情報を一度に処理し、長い文脈を維持できるようになります。従来のAIは、比較的短い文章を扱う用途が中心でした。Gemini 3.5 Flashでは、数か月分のメール、旅行に関する契約書、数時間にわたる音声や動画などをまとめて読み込み、横断的に分析できます。
Googleが紹介した活用例： 例えば引っ越し先を探す場合、ユーザーが希望条件を入力すると、Gemini 3.5 Flashが特定の都市における家賃以外の生活コストまで分析し、構造化された比較表を作成します。複雑な行政手続きの進捗管理や、教育動画をもとにした子どもの学習スケジュール作成など、長期間にわたる情報整理にも活用できます。

(Gemini 3.5 Flashは、AI評価機関Artificial Analysisからも、高速性と処理性能の両面で高い評価を受けています。)

注目ポイント2：AI Modeの進化。検索行動を変える3つの新機能

Gemini 3.5の技術が検索インターフェースに組み込まれることで、ユーザーは、より連続的で文脈を理解した対話型検索を利用できるようになります。今回発表されたAI Modeのアップデートには、大きく3つの変化があります。

変化1．検索と対話の統合：文脈を保持したシームレスな会話

これまでのAI Overviews（AIO）は、1回限りの静的な情報まとめでした。追加質問をしたい場合は手動でAI Modeのチャット画面に切り替える必要があり、画面を切り替えた際に、最初の検索条件や閲覧していたページの文脈が失われる問題がありました。

新しいアーキテクチャでは、AI OverviewsとAI Modeの処理基盤が統合されています。複雑な指示に対して「コンテキスト継続型の対話（Continuous Conversation）」が自動で起動し、追加質問をしてもページ遷移なしにシームレスに対話モードへ移行。最初に入力した複雑な条件と、これまでに読んだウェブページの文脈が100%保持されたまま会話が続きます。会話が深まるほど、関連リンクの精度も上がります。

変化2．マルチモーダル検索：画像と音声を同時に理解する

マルチモーダル技術の成熟により、検索は文字入力の制約から解放されます。現実の商品の写真、画面上のグラフ、デザインのプロトタイプなどを、写真やショート動画、画面上の範囲指定でAI Modeに送り、同時に自然な音声で追加質問できます。例えば商品画像を共有し、「この素材とスペックを確認して、現在最短で届く購入先を比較してください」と音声で指示するだけで、画像による視覚情報と、音声による指示を同じ処理の中で組み合わせて分析します。ユーザーが目の前のものを正確な検索キーワードへ変換する必要はありません。AIが「見て、聞いて、考える」ことで、数秒以内に具体的で構造化された回答を提示します。

変化3．自動情報収集エージェント：ブラウザを閉じても検索を継続

今回発表されたエージェント機能の中でも、特に実用性が高いのが「Information Agent」です。ユーザーは、予算、部屋の日当たり、駅からの徒歩時間など、細かな条件をまとめてAI Modeへ伝えれば、あとはページを閉じるだけ。エージェントはクラウドで24時間自律的にWeb上の情報を確認します。

(Googleの新しい自律型エージェントが、予定や天気を分析し、その日の行動プランを提案する様子)

この機能の最大の革新は、「ブラウザの前で答えを待つ」という受動的な行動からの解放です。条件に合う情報が見つかった場合、AIは主に次の経路でユーザーへ報告します。

Googleアプリの管理画面： スマートフォンのGoogleアプリに用意された「Search Agents」のコントロールパネルから、AIが整理した情報や構造化されたレポートを確認できます。
GmailやGoogle Chatへの通知：設定に応じて、最新の進捗や要点をGmailまたはGoogle Chatへ送信します。予約ページや購入ページなど、次のアクションへ直接移動できるリンクも提示されます。
Android Haloのシステムウィジェット： Androidユーザーは、アプリを起動しなくてもシステム上部の「Android Halo」エリアで、バックグラウンドエージェントの進捗をリアルタイムに把握できます。

Google I/O 2026の発表からは、Googleの戦略が明確に見えてきます。アップグレードされたGemini 3.5シリーズをAI Modeの技術的バックボーンとし、検索体験を全面的に底上げするというアプローチです。

ユーザーにとっては、複数のWebページやタブを行き来する検索から、文脈を理解するAIアシスタントとの対話へと体験が変化します。

ただし、月間10億ユーザーがAI Modeの対話の中で「検索・評価・意思決定」を完結させるようになれば、Web上のトラフィック配分も大きく変わります。これからのWebサイトは、キーワード検索でクリックを獲得する時代から、「AIにいかに正しく理解・引用されるか」を競う時代へ。企業やブランドには、情報を明確に整理し、具体的かつ実用的なコンテンツを提供することが、これまで以上に求められます。

AIモードを中心とした新しい検索環境においてユーザーとの接点を維持するには、Webサイトを「人が読むためのページ」としてだけでなく、「AIが理解し、活用できる情報基盤」として設計するGEO（Generative Engine Optimization：生成AIエンジン最適化）の視点が重要になるでしょう。

FAQ：Gemini 3.5とAI Modeに関するよくある質問

Q1. 新しい「AI Mode」と従来の「AI Overviews」は何が違うのでしょうか？

従来のAI Overviewsは1回限りの静的まとめで、追加質問のたびに別チャット画面へ手動で切り替える必要があり、文脈が失われがちでした。2026年の新アーキテクチャでは両者が内部で統合され、要約を読んだ後、その場で追加の質問を入力でき、最初の条件や閲覧文脈を引き継いだまま対話を続けられます。

Q2．Gemini 3.5 Flashが高速かつ高性能になると、日常の検索はどう変わりますか？

複雑な調査タスクで「速度」と「回答の質」のどちらかを犠牲にする必要がなくなります。指示の難易度を自動判定してモデルの処理を動的に切り替えるため、天気の確認のような簡単な質問には素早く回答し、契約書全体の分析のような複雑な依頼では、より高度な推論を行います。

Q3. マルチモーダル検索は、どのような課題を解決しますか？

「見ているものを言葉で正確に表現しなければならない」という根本的な不便さを解消します。目の前の実物を撮影したり、画面上の複雑なグラフやデザインを選択して音声で追加質問するだけで、AIが数秒で構造化された結論を出力します。

Q4．自動情報収集エージェントの検索結果は、どこで確認できますか？

AIエージェントはクラウド上で動作するため、ブラウザを開いたまま待つ必要はありません。検索結果や進捗は、Googleアプリ内の管理画面から確認できます。設定に応じて、GmailやGoogle Chatにも最新情報や要約が送信されます。Androidユーザーは、システムに統合された通知機能から重要な更新を確認できます。

Webサイトの最適化やAI SEO／GEOについて詳しく知りたい方は、awooまでお問い合わせください。

AIエージェント「OpenClaw」。熱狂と論争のはざまで見えた、“実行するAI”とGEOの新たな価値

【マーケター必読のGEO実践ガイド】生成AIに「選ばれるブランド」になる6つのマーケティング戦略