2026-05-08 AI News Daily

トップ5 ヘッドライン

OpenAIの新音声モデル、GPT-5級推論でリアルタイム音声エージェントを強化

VentureBeatは、OpenAIのGPT-Realtime-2が音声エージェントの設計を変えると分析した。従来の音声ボットは会話の維持が中心だったが、GPT-Realtime-2は長い文脈、推論努力の調整、ツール呼び出し、専門用語の保持により、住宅検索や顧客対応のような複雑な業務を音声で進められる。音声はUIの補助ではなく、エージェント実行の入口になりつつある。

OpenAI voice agents GPT-Realtime-2 VentureBeat OpenAI

Sakana AI、GPT・Claude・Geminiを動的に使い分ける7B「RL Conductor」を提示

Sakana AIは、GPT-5、Claude Sonnet 4、Gemini 2.5 Proなど複数LLMを固定ルールではなく強化学習で動的に組み合わせる7Bモデル「RL Conductor」を提示したと報じられた。小型モデルがタスクを分解し、適切なワーカーモデルと通信構造を選ぶ設計で、単一フロンティアモデル依存を下げる。企業にとっては、性能・コスト・レイテンシをタスクごとに最適化するマルチモデル運用の現実解になる。

Sakana AI model orchestration RL Conductor VentureBeat Le Fil IA

ServiceNow、AI Control Towerを拡張し企業AIエージェント統制を強化

ServiceNowはKnowledge 2026で、AI Control TowerをMicrosoft、NVIDIA基盤、セキュリティ領域へ広げる複数発表を行った。30以上の統合を通じてクラウド、SaaS、AIエージェント、非人間IDを検出・観測・統制する設計で、AI導入の「見えない実行主体」を管理する。Microsoft Agent 365と同様、企業AIの次の競争領域はモデルではなく統制面になっている。

ServiceNow AI Control Tower AI governance CX Today CIO

Gemini API、長時間ジョブ向けWebhooksを追加

GoogleはGemini APIにイベント駆動Webhooksを追加し、長時間ジョブ完了をポーリングではなくプッシュ通知で扱えるようにした。Deep Research、長尺動画生成、Batch APIなど、分単位から時間単位で走るエージェント処理では、待ち時間とAPI負荷の削減が重要になる。モデル性能の改善だけでなく、開発者体験と運用効率を支える基盤整備が進んでいる。

Gemini API Webhooks agentic apps Google Blog

Google Gemini「Remy」報道、24時間個人エージェント競争を加速

TechRadarは、GoogleがGeminiを「24/7 digital partner」として動くRemyへ発展させる計画を報じた。メール、書類送付、購入、予定調整などをユーザーの代わりに進める構想は、OpenAIやOpenClaw系の自律エージェントと正面から競合する。Googleの場合、Gmail、Search、Android、Workspaceという文脈を持つため、実行範囲とプライバシー設計の両方が重要になる。

Google Gemini Remy TechRadar Android Central

▶ Web ニュース全5件を見る

キーインサイト

テーマ	要点
単一モデルよりオーケストレーション	SakanaのRL Conductorは、最強モデルを一つ選ぶより複数モデルを使い分ける方向を示す。企業利用ではコスト、精度、データ制約をタスクごとに調整する必要がある。
長時間ジョブが標準化する	Gemini API Webhooksは、AI処理が同期応答だけでは収まらなくなった証拠だ。エージェントが数分から数時間動く前提では、通知、再試行、監査が開発基盤の一部になる。
統制レイヤーの競争が始まった	ServiceNowやMicrosoftの動きは、AI導入が増えるほど管理すべきエージェントIDや権限が増えることを示している。IT部門の主戦場はモデル選定からガバナンス運用へ広がる。