最新動向

2024年 年末のAI関連発表について

2024年の年末は、AIに関連する人々にとって非常に忙しい時期でした。
アメリカのホリデーシーズンに合わせて、各社が数多くの発表をしたのです。質量ともに
多岐にわたっており、「そもそもどんな発表があったのか」を把握することすら難し
レベルだと感じています。

そこでこの記事では、特に重要と思われるOpenAIGoogleの発表について、代表的な
ものをまとめて整理することにしました。

OpenAIの発表について

OpenAIは『12 Days of OpenAI』と題して、12月5日から16日まで連続で発表を
行いました。(公式サイト:12 Days of OpenAI )日本語では、ITmediaによる
まとめがあります。

OpenAIの「12 Days」まとめ
ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2412/21/news083.html


発表の概要は、それぞれ以下のようなものです。

Dayタイトル概要種別
1
o1 & ChatGPT Pro
Previewだったo1の正式発表と月200ドルのPro
言語モデル
2
OpenAI's Reinforcement Fine-Tuning Research Program
強化ファインチューニングの研究プログラム
言語モデル
3
Sora
動画生成サービスSoraの発表
動画
4
Canvas
ChatGPT上のCanvas機能について
ChatGPTの新機能
5
ChatGPT in Apple Intelligence
Apple IntelligenceでのChatGPT利用
他社との連携
6
Advanced voice with video & Santa mode
ビデオ通話でChatGPTを利用、サンタモード
ChatGPTの新機能
7
Projects in ChatGPT
ChatGPT上のProjectsという管理機能
ChatGPTの新機能
8
Search
ChatGPTの検索が無料ユーザーにも提供開始
ChatGPTの新機能
9
Holiday treats for developers
開発者向けのプレゼント。Tier 5以上にAPIの
o1リリース。Realtime APIの品質向上、GPT-4o realtimeの音声トークンの価格が60%値下げ
開発者向け機能
10
1-800-CHATGPT
電話やWhatsAppでChatGPTを使えるように
ChatGPTの新機能
11
Work with apps
Mac版のChatGPTアプリをXcode、Notes、Notion、Quipと連携する。Windows板も近日
公開予定
他社との連携
12
o3 preview & call for safety researchers
o3とo3-miniの発表。
o3-miniは2025年1月下旬にリリースの可能性 
新しい言語モデル

言語モデルだけではなく、画像や動画、ChatGPTの新機能、ChatGPTを他社アプリケーションや電話(!)から使えるようにするなど、ChatGPTの普及に向けて積極的に活動している
ことがうかがえます。

Googleの発表について

 Googleの発表については、以下のURLを参考にしました。

Google AI announcements from December https://blog.google/technology/ai/google-ai-updates-december-2024/


発表内容は、概ね次のようになっています。

番号
タイトル
概要
種別
1
Gemini 2.0
エージェント時代の新しいモデル
言語モデル
2
gemini-exp-1206
実験的なモデル
言語モデル
3
Veo 2
最新の動画生成モデル
動画生成
4
Imagen 3
最新の画像生成モデル
画像生成
5
NotebookLMの
アップグレード
UIが新しくなり、Audio Overviewの最中に会話に
参加することが可能となり、サブスクリプション
プランのNotebookLM Plusが開始
NotebookLMの新機能
6
Android と Pixel に
新しい AI 機能を追加
Geminiをパーソナライズするsaved info、字幕に感情表現を付与する Expressive Captions、通話画面で簡単に応答できるようなアップデートなど
スマホとの連携
7
2025 年の企業向け 
AI トレンドを5つ紹介
紹介されているのは以下の5つのトレンド。
1. マルチモーダルAI  2. AIエージェント3. エンタープライズ検索  4. AIを活用したカスタマー
エクスペリエンス 5. AIによるセキュリティ強化
トレンドの紹介
8
Google Agentspace
AIエージェントとAI検索を企業にもたらす Google Agentspaceについて。特徴は次の3つ。
1. 企業データを活用するためのNotebookLM 
 2. 企業全体の情報発見
 3. ビジネスを自動化する
エキスパートエージェント
AIエージェントや
RAGを活用したサービス
9
AI 気象モデル GenCast
拡散モデルのGenCastで現状最高の最高のシス
テムである欧州中期予報センター (ECMWF) ENS よりも優れた予報を提供。台風などの極端な気象も高精度で予測可能
天気予報
10
量子チップ Willow
量子エラー訂正によるエラーの削減と、
スーパーコンピュータでも10の25乗年かかる
ベンチマークを5分で処理
量子コンピュータ

こちらも言語モデル、画像と動画の生成、既存のサービスの新機能などが発表された上で、企業向けのGoogle Agentspaceや量子コンピュータチップのWillowなど、今後有望と思われる領域の発表が含まれているようです。

それぞれの発表についての整理

両社ともに、大規模言語モデル、画像と動画の生成についての発表を行っています。
言語モデルはさらに高性能なものが提供され、画像や動画生成はこれまでよりも高品質な
ものが生成できるようになりました。それぞれ得意な領域や精度は違いますが、これらの
領域はこれからも各社が競って発展していくことが期待されます。

一方で、全体的な方針には差が見られます。
OpenAIは、 サービスとしてのChatGPTの機能と連携の強化に注力しているようです。ChatGPT 最も有名なLLMで、他にも数多くのLLMが公開されている現在においても、「LLMといえばChatGPT」という地位を獲得しています。
この知名度を利用して、アプリや電話など様々なところからアクセス可能にして一般に
普及させることで、人々の生活の基盤となることを目指しているように見えます。

Googleは、AIエージェントに注力しているようです。
Gemini 2.0 "our new AI model for the agentic era" として紹介されていますし、
企業向けのGoogle Agentspaceも開始しています。
今後は単なる言語モデルではなく、AIエージェントとしての利用が増えるという考え
なのでしょう。また、量子コンピュータや気象モデルなど、新しい分野にも積極的に
取り組んでいるようです。


まとめ

この記事では、2024年末のOpenAIGoogleの発表について簡単にまとめました。
どちらも非常に活発な開発研究を行っており、追いかけるだけでも大変になっています。
今年は更に増えるのでしょうか?一体どんな技術が発表されるのか、今後がとても楽しみ
です。




記事を書いた人
石岡卓也

2007年に北海道大学大学院博士課程修了。 2020年より株式会社調和技研でシステム開発や人材育成事業に従事。 複雑ネットワークとしてのSNSの研究や、ニュース記事の分類システム、コンテンツの推薦システムの開発等を経験。現在は言語分野の研究開発を行うとともに、Sapporo AI Laboのプロジェクト「札幌AI道場」において技術指導とチームのメンターを担当している。