
2024年 年末のAI関連発表について

2024年の年末は、AIに関連する人々にとって非常に忙しい時期でした。
アメリカのホリデーシーズンに合わせて、各社が数多くの発表をしたのです。質量ともに
多岐にわたっており、「そもそもどんな発表があったのか」を把握することすら難しい
レベルだと感じています。
そこでこの記事では、特に重要と思われるOpenAIとGoogleの発表について、代表的な
ものをまとめて整理することにしました。
OpenAIの発表について
OpenAIは『12 Days of OpenAI』と題して、12月5日から16日まで連続で発表を
行いました。(公式サイト:12 Days of OpenAI )日本語では、ITmediaによる
まとめがあります。
▍OpenAIの「12 Days」まとめ
ITmedia NEWS
https://www.itmedia.co.jp/news/articles/2412/21/news083.html)
発表の概要は、それぞれ以下のようなものです。
Day | タイトル | 概要 | 種別 |
1 | o1 & ChatGPT Pro | Previewだったo1の正式発表と月200ドルのPro | 言語モデル |
2 | OpenAI's Reinforcement Fine-Tuning Research Program | 強化ファインチューニングの研究プログラム | 言語モデル |
3 | Sora | 動画生成サービスSoraの発表 | 動画 |
4 | Canvas | ChatGPT上のCanvas機能について | ChatGPTの新機能 |
5 | ChatGPT in Apple Intelligence | Apple IntelligenceでのChatGPT利用 | 他社との連携 |
6 | Advanced voice with video & Santa mode | ビデオ通話でChatGPTを利用、サンタモード | ChatGPTの新機能 |
7 | Projects in ChatGPT | ChatGPT上のProjectsという管理機能 | ChatGPTの新機能 |
8 | Search | ChatGPTの検索が無料ユーザーにも提供開始 | ChatGPTの新機能 |
9 | Holiday treats for developers | 開発者向けのプレゼント。Tier 5以上にAPIの o1リリース。Realtime APIの品質向上、GPT-4o realtimeの音声トークンの価格が60%値下げ | 開発者向け機能 |
10 | 1-800-CHATGPT | 電話やWhatsAppでChatGPTを使えるように | ChatGPTの新機能 |
11 | Work with apps | Mac版のChatGPTアプリをXcode、Notes、Notion、Quipと連携する。Windows板も近日 公開予定 | 他社との連携 |
12 | o3 preview & call for safety researchers | o3とo3-miniの発表。 o3-miniは2025年1月下旬にリリースの可能性 | 新しい言語モデル |
言語モデルだけではなく、画像や動画、ChatGPTの新機能、ChatGPTを他社アプリケーションや電話(!)から使えるようにするなど、ChatGPTの普及に向けて積極的に活動している
ことがうかがえます。
Googleの発表について
Googleの発表については、以下のURLを参考にしました。
▍Google AI announcements from December https://blog.google/technology/ai/google-ai-updates-december-2024/
発表内容は、概ね次のようになっています。
番号 | タイトル | 概要 | 種別 |
1 | Gemini 2.0 | エージェント時代の新しいモデル | 言語モデル |
2 | gemini-exp-1206 | 実験的なモデル | 言語モデル |
3 | Veo 2 | 最新の動画生成モデル | 動画生成 |
4 | Imagen 3 | 最新の画像生成モデル | 画像生成 |
5 | NotebookLMの アップグレード | UIが新しくなり、Audio Overviewの最中に会話に 参加することが可能となり、サブスクリプション プランのNotebookLM Plusが開始 | NotebookLMの新機能 |
6 | Android と Pixel に 新しい AI 機能を追加 | Geminiをパーソナライズするsaved info、字幕に感情表現を付与する Expressive Captions、通話画面で簡単に応答できるようなアップデートなど | スマホとの連携 |
7 | 2025 年の企業向け AI トレンドを5つ紹介 | 紹介されているのは以下の5つのトレンド。 1. マルチモーダルAI 2. AIエージェント3. エンタープライズ検索 4. AIを活用したカスタマー エクスペリエンス 5. AIによるセキュリティ強化 | トレンドの紹介 |
8 | Google Agentspace | AIエージェントとAI検索を企業にもたらす Google Agentspaceについて。特徴は次の3つ。 1. 企業データを活用するためのNotebookLM 2. 企業全体の情報発見 3. ビジネスを自動化する エキスパートエージェント | AIエージェントや RAGを活用したサービス |
9 | AI 気象モデル GenCast | 拡散モデルのGenCastで現状最高の最高のシス テムである欧州中期予報センター (ECMWF) ENS よりも優れた予報を提供。台風などの極端な気象も高精度で予測可能 | 天気予報 |
10 | 量子チップ Willow | 量子エラー訂正によるエラーの削減と、 スーパーコンピュータでも10の25乗年かかる ベンチマークを5分で処理 | 量子コンピュータ |
こちらも言語モデル、画像と動画の生成、既存のサービスの新機能などが発表された上で、企業向けのGoogle Agentspaceや量子コンピュータチップのWillowなど、今後有望と思われる領域の発表が含まれているようです。
それぞれの発表についての整理
両社ともに、大規模言語モデル、画像と動画の生成についての発表を行っています。
言語モデルはさらに高性能なものが提供され、画像や動画生成はこれまでよりも高品質な
ものが生成できるようになりました。それぞれ得意な領域や精度は違いますが、これらの
領域はこれからも各社が競って発展していくことが期待されます。
一方で、全体的な方針には差が見られます。
OpenAIは、 サービスとしてのChatGPTの機能と連携の強化に注力しているようです。ChatGPTは 最も有名なLLMで、他にも数多くのLLMが公開されている現在においても、「LLMといえばChatGPT」という地位を獲得しています。
この知名度を利用して、アプリや電話など様々なところからアクセス可能にして一般に
普及させることで、人々の生活の基盤となることを目指しているように見えます。
Googleは、AIエージェントに注力しているようです。
Gemini 2.0は "our new AI model for the agentic era" として紹介されていますし、
企業向けのGoogle Agentspaceも開始しています。
今後は単なる言語モデルではなく、AIエージェントとしての利用が増えるという考え
なのでしょう。また、量子コンピュータや気象モデルなど、新しい分野にも積極的に
取り組んでいるようです。
まとめ
この記事では、2024年末のOpenAIとGoogleの発表について簡単にまとめました。
どちらも非常に活発な開発研究を行っており、追いかけるだけでも大変になっています。
今年は更に増えるのでしょうか?一体どんな技術が発表されるのか、今後がとても楽しみ
です。

2007年に北海道大学大学院博士課程修了。 2020年より株式会社調和技研でシステム開発や人材育成事業に従事。 複雑ネットワークとしてのSNSの研究や、ニュース記事の分類システム、コンテンツの推薦システムの開発等を経験。現在は言語分野の研究開発を行うとともに、Sapporo AI Laboのプロジェクト「札幌AI道場」において技術指導とチームのメンターを担当している。