2026-03-06 (金) — Web ニュース 30件 / X ポスト 18件
OpenAIがGPT-5.4をリリース。GPT-5.2比で個別クレームの誤り率33%減、全体レスポンス誤り率18%減。ネイティブのコンピュータ操作機能を初搭載し、APIでは最大100万トークンのコンテキストウィンドウに対応。GPT-5.4 Thinkingは高度な推論バージョン。
Cursorが「Automations」を発表。Slack、Linear、GitHub PR、PagerDuty等のイベントをトリガーに、クラウドサンドボックス上でエージェントを自動起動。年間収益20億ドル超、過去3ヶ月で倍増。
1兆パラメータのMoEモデル(アクティブ約320億)。テキスト・画像のネイティブマルチモーダル対応、100万トークンコンテキスト。Huawei Ascendチップ最適化、GPT-5比で約1/20の推論料金。
ChatGPT for ExcelとGoogle Sheetsをベータ提供開始。Moody's、Dow Jones Factiva、MSCI等の金融データ統合も発表。投資銀行ジュニアアナリスト向けベンチマークで87.3%を達成。
サイバーセキュリティ分野で「High」能力に対する緩和策を実装した初の汎用モデル。ジェイルブレイク耐性向上、推論の透明性確保。推論の隠蔽を検出するオープンソース評価ツールも公開。
GPT-5.3のチャット最適化バージョンがChatGPT全ユーザーとAPI開発者に提供開始。ウェブ検索時のハルシネーション率26.8%減、内部知識のみの場合は19.7%減を実現。
Elon Muskが「Grokが新たなパフォーマンス最高記録に到達」と発表。約6兆パラメータのMoEアーキテクチャでColossus 2スーパークラスターでトレーニング中。3〜4月ベータ公開予定。
PerplexityのAIブラウザ「Comet」がiOS版を3月11日にリリース。ページ自動要約、対話的ブラウジング、マルチステップアクション対応。複数AIモデル選択可能。
CNBCが国防総省がAnthropicを正式にサプライチェーンリスクとして指定した件を詳報。Claude技術が完全自律兵器や国内大規模監視に使用されない保証を求めたが、DoD側は無制限アクセスを要求し対立深刻化。
JiraのissueをCopilotに割り当てると、説明やコメントを分析してコンテキストを収集し、自律的に変更を実装してドラフトPRを作成。バグ修正やドキュメント更新などの反復タスクの加速が期待される。
50万人以上のウェイトリスト登録を経てリリース。ネイティブエージェントサンドボックス、並列タスク処理、PowerShell統合を搭載。週間アクティブユーザーは160万人に到達。
v2.1.69で/claude-apiスキル追加、音声STT 10言語追加(計20言語)、/mcpコマンドでMCPサーバー管理ダイアログ、大規模メモリリーク修正。v2.1.70でRedisポーリングレート削減(負荷300倍削減)。
約1000人規模調査で、発売8ヶ月のClaude CodeがGitHub CopilotやCursorを抜き1位。95%が週1回以上AIツール使用、75%が作業の半分以上でAI活用と回答。
評価テスト機能、ベンチマークモード、マルチエージェント並行評価、A/Bテスト(2スキル版をブラインド比較)を追加。公開スキル6つ中5つで改善効果を確認。
Devin開発元がSWE-1.6の早期プレビューを公開。SWE-Bench Proで11%高いスコアを達成しつつ推論速度同等(950 tok/s)。エージェントRL環境の大幅スケーリングとトレーニング6倍高速化。
自律AIエージェントの安全・相互運用性標準策定。業界主導の標準策定、オープンソースプロトコル開発、エージェントセキュリティ・ID研究の3つの柱。RFI回答期限が3月9日に迫る。
FLUX開発元が「Self-Supervised Flow Matching」を発表。外部教師モデルに頼らず画像・音声を統合的に学習。従来比2.8倍の効率で収束、テキスト描画精度も向上。
創業者David Holzが3月4日のオフィスアワーで発表。ネイティブ2K解像度、大幅改善されたテキスト描画、プロンプト理解力向上。編集モデル、V2ビデオモデル、V9開発も言及。
AI生成音楽を識別するメタデータシステムを導入。レーベルやディストリビューターがAI制作タグを付与可能に。ただしオプトイン方式のため実効性に課題。
グラミー賞ノミネート歌手がMoisesのChief Music Officerに。ボーカル分離・コード生成等AIツールを7000万ユーザーに提供。「AIはミュージシャンを代替しない」と発言。
3月5日に3バージョンを連続リリース。xAIモデル・価格更新、Kling 3.0モーションコントロール対応、CPUウェイト処理改善、LTXオーディオVAE修正など。
Firefly Fill & Expandモデルが2K解像度出力に対応。Generative Fill、Generative Expand、Removeツールの品質が大幅向上。
通信ネットワーク直接組み込み型AI通話アシスタントをMWC 2026で世界初公開。「Hey Magenta」で起動、50言語リアルタイム翻訳対応予定。アプリ不要。
OpenAI WhisperモデルをvLLM経由でローカルデプロイし本番環境にスケールする技術記事。HIPAA、PCI-DSS、政府機関向けオンプレミス文字起こしソリューション。
SB 1546を上院26-1、下院52-0の超党派で可決。AIであることの開示、1時間ごとの休憩リマインダー、エンゲージメント最大化報酬禁止、危機対応リソース誘導を義務化。
SB 5はAIチャットボット規制・自動意思決定の反差別保護・AI Policy Office設置を含む包括法案。SB 86はAIイノベーション促進と規制サンドボックス設立。
SB 482が上院35-2で可決もTrump派下院議長が審議拒否。未成年者チャットボット利用への親の管理権確立、AI政治広告開示義務、懸念国AI企業との政府契約禁止を含む。
立法シーズン開始6週間で27州78件が審議中。オレゴンSB 1546最終可決、ユタ州2法成立、ワシントン州SB 5105可決。NY州AIトレーニングデータ透明性法案が上院第三読会へ。
フロンティアAIモデル開発者に安全プロトコル策定、テスト結果記録、年次レビュー、安全インシデント72時間以内報告を義務付け。10^26超演算・1億ドル超コストの「フロンティアモデル」が対象。
80%の組織がAIエージェントの不正アクセスやデータ露出を報告。権限・データアクセスの完全な可視性を持つ経営幹部はわずか21%。セキュリティ対策が追いついていない。
| テーマ | 要点 |
|---|---|
| GPT-5.4の衝撃 | ネイティブコンピュータ操作・100万トークン・金融ツール統合を一挙リリース。エージェント時代の本格到来 |
| AIコーディング競争激化 | Cursor Automations、Codex Windows版、Claude Code更新、Copilot for Jiraが同日に集中。イベント駆動型自動化が新トレンド |
| Claude Code市場席巻 | Pragmatic Engineer調査で8ヶ月でAIコーディングツール1位。Agent Skill Creatorも改善継続 |
| 大型モデル競争再燃 | DeepSeek V4(1兆パラメータ)リリース間近、Grok 5(6兆パラメータ)トレーニング中。パラメータ規模競争が再燃 |
| 米国AI規制ラッシュ | オレゴン州が全米初チャットボット安全法可決。27州で78法案進行。NY RAISE Act 3/19施行 |
| AI音楽の転機 | Apple Music Transparency Tags導入、Charlie PuthがAI音楽CMO就任。透明性・正当性確立の動き加速 |
| 画像生成次世代 | Midjourney V8ローンチ準備完了(2K解像度)、Self-Flow発表、Photoshop Firefly 2K対応。高解像度が新基準 |