2024 年に AI は大きく進歩し、AGI が視野に入る

人工知能の誕生以来、その進化を目撃してきた経験豊富な AI 研究者として、私は 2024 年がこの分野においてまさに極めて重要な年であったと自信を持って言えます。 AI のさまざまなサブ分野での進歩は本当に驚くべきものであり、人間のような知能 (AGI) の実現にどれほど近づいているかを見るのは興味深いことです。

しかし、この業界に何十年も関わってきた私は、新たな進歩にはそれぞれ独自の課題が伴うという事実も証明できます。そのような課題の 1 つは、大規模言語モデル (LLM) の開発に不可欠なトレーニング データの問題です。使用可能なデータがますます不足していることと、その収集をめぐる法的影響は無視できない懸念事項です。

猫にコンピューターを使わせたらどうですか?なぜなら、彼らは文字を入力したり、ネットサーフィンをしたりすることができず、ただ座って「魚」が泳ぐのを眺めているだけだからです。冗談はさておき、AI 開発者として、私たちの創作物が安全で倫理的で人類にとって有益であることを確認しながら、常に警戒を怠らずに知識を追求することが重要です。

2024 年には、人工知能が大きな進歩を遂げました。人工知能は、見出しを飾っただけでなく、認識を集め、多額の投資を集め、金融市場に感銘を与え、微分方程式の説明を含む数学的問題を解決する能力を実証しました。

さらに、潜在的なプライバシーと安全性の問題を懸念していた国際的な監視機関の目に留まりました。また、AIが汎用人工知能(AGI)、さらには人工超知能へと急速に進歩し、人間の認知能力を超える可能性を懸念する人もいた。バイオテロ、自律型兵器システム、さらには絶滅レベルの結果をもたらす可能性のある出来事での AI の使用など、さまざまな悲惨なシナリオが熟考され、議論されました。

2024 年の AI のハイライト 10 を紹介します。

#1 GenAIが優勢

Generative AI または GenAI として知られるコンテンツを生成する人工知能は、実際には何もないところから何かを作成するのではなく、トレーニングされた膨大な量のデータに基づいて新しいコンテンツを生成します。一行のテキストなどの出発点を与えると、500 ワードの怪談を展開することができます。

2024 年に GenAI が脚光を浴びましたが、それに関与していたのは OpenAI の ChatGPT だけではありませんでした。 Google の Gemini、Microsoft の Copilot、Anthropic の Claude、Meta の Llama 3 シリーズもこの進歩に参加し、テキストだけでなくオーディオ、ビデオ、画像も処理および生成できるソフトウェアを作成しました。

AI 研究施設は、これらのブレークスルーを促進するために投資を大幅に増加しました。 Menlo Ventures の報告によると、AI への投資は 2024 年に 138 億ドルという驚異的な額に急増し、2023 年の投資の 6 倍以上に相当します。この大幅な成長は、企業が探索段階から実用化に移行し、AI を長期戦略に深く組み込むという決定的な傾向を裏付けています。

#2 AI が物理学、化学のノーベル賞を獲得

10月にスウェーデン王立科学アカデミーが2024年のノーベル賞を発表したことは、人工知能(AI)が単なる一過性のトレンドではなく、私たちの未来の成長部分であることのさらなる証拠となる。ジェフリー・ヒントンとジョン・ホップフィールドは、今日の AI テクノロジーの基礎を形成する人工ニューラル ネットワークを使用した機械学習に関する画期的な研究により物理学賞を受賞しました。

ジョージ・ヒントンは、コンピュータサイエンスと心理学を専門とするイギリス系カナダ人の科学者で、「AIの父」とよく呼ばれています。ニューラル ネットワークに関する彼の先駆的な研究は、ボルツマン マシンなどの統計物理学の概念を適用して機械学習を加速した 1980 年代に遡ります。

別の評価では、Google DeepMind の共同創設者兼 CEO であるデミス・ハサビスが、ジョン・ジャンパーとともにノーベル化学賞を受賞しました。これは、タンパク質の複雑な構造を予測できる AI モデルの作成に関する彼らの画期的な研究によるものです。

第 3 位 Nvidia が Apple を追い抜き、世界で最も価値のある企業の座に就く

2024 年に目立ったのは、大規模言語モデル (LLM) の開発と運用に不可欠な、先進的なコンピューター チップ、特に Nvidia のグラフィックス プロセッシング ユニット (GPU) でした。注目すべきことに、Nvidia は世界中のどの企業よりも多くのこれらの特殊な GPU を製造しました。

2024 年までに Nvidia が世界で最も価値のある企業となり、10 月下旬時点で時価総額 3 兆 5,300 億ドルを誇り、Apple の時価総額 3 兆 5,200 億ドルを上回ったことは驚くべきことではありません。

長年にわたって観察と分析を行ってきた経験豊かな研究者として、私は企業慣行の大きな変化に気づきました。日常業務の一部として人工知能 (AI) を導入する企業が増えています。プロセスを合理化し、効率を高め、成長を促進する貴重な洞察を提供する AI の可能性を考えると、この傾向は驚くべきことではありません。

この急増の中でも、Nvidia チップの需要は依然として堅調です。私は、これらの強力なプロセッサーによって AI アプリケーションがどのように最適に機能し、驚くべき速度と精度で複雑な計算を処理できるかを直接目撃してきました。その結果、企業は急速に進化する技術情勢の中で競争力を維持するために、Nvidia チップへの投資に熱心になっています。

AJ Bellの投資ディレクターであるRuss Mould氏も私の見解に同調し、今日のビジネス界におけるこれらの先進テクノロジーの重要性が高まっていることを強調しています。 AI と Nvidia が経済を形成し、世界中の産業を再構築し続けることから、未来は明るいと思われます。

Nvidia の次期 Blackwell GPU が設計上の問題が報告されているために遅延に直面していることを考慮すると、Nvidia が 2025 年まで、そしてそれ以降も主要な GPU メーカーとしての強力な地位を維持する可能性はありますか?こうした挫折にも関わらず、2023年には市場の約98%を握るエヌビディアの大幅な市場支配により、競合他社が近いうちに彼らに対抗するのは困難になるだろうと多くの人が考えている。

#4 EU における AI 法

安全、安心で、より大きな利益に役立つ人工知能 (AI) を誰もが持つことが望ましいですが、それを責任を持って規制するのは簡単な作業ではありません。しかし、2024 年までに、国際統治機関はこの課題に向けて最初の一歩を踏み出し始めました。

欧州連合の人工知能法は 8 月に発効し、一般用途向けに設計された AI システムの保護措置を確立し、特定のプライバシー問題に対処しました。この法律は、顔認識技術などでの AI の応用について厳しいガイドラインを課していますが、業務の自動化、オンラインでの誤った情報の拡散、国家安全保障への脅威など、より広範な懸念に対処することも目的としています。この法律の施行は 2027 年までに段階的に行われます。

期待にもかかわらず、2024年にカリフォルニア州で提案されたSB 1047法案が9月に州知事によって拒否権を発動されたことで実証されたように、AIの制御は困難であることが判明するだろう。この法案は、それまで「人工知能を規制する最も広範な試み」として歓迎され、この急速に発展する技術に必要なガイドラインを提供すると信じたジェフリー・ヒントンやイーロン・マスクのようなAI擁護者からの支持を集めた。

しかし、このアプローチは、AI 作成者に責任を課すものとして、DeepLearning.AI の創設者である Andrew Ng などの技術専門家仲間からの反対に遭いました。これにより、イノベーションが妨げられ、この分野の将来の進歩が阻害される可能性があります。

#5 小規模言語モデル (SLM) の出現

2024 年までに、数十億のデータを使用して教育された非常に膨大な AI モデルを使用することが標準になりました。たとえば、ChatGPT は、Web から収集した 570 ギガバイトのテキスト情報でトレーニングされました。これは、およそ 3,000 億語に相当します。

多くの企業にとって、AI の将来は、よりコンパクトで分野に焦点を当てた言語モデルに見出され、早ければ 2024 年に登場し始めるものもあります。

4 月に Microsoft は小型言語モデルの Phi-3 シリーズを発表しましたが、Apple は自社のポータブル デバイス向けに 8 つの同様のモデルを発表しました。現在、Microsoft と Khan Academy は、これらの Small Language Model (SLM) を活用して、学生向けの数学の個別指導を強化しています。

この分野で長年の経験を持つテクノロジー愛好家として、私は、特定のワークロードに合わせてモデルを小型化する傾向が高まり、エッジで利用できる計算能力が大幅に向上していることを証明できます。エッジ コンピューティングへのこの移行は、特にさまざまな業界での潜在的なアプリケーションを考慮した場合に、この追加の力を最大限に活用できるため、特にエキサイティングです。

私は職業生活の中で、エッジ コンピューティング ソリューションの先駆者である素晴らしい頭脳の人々と協力する機会がありました。この開発には、データ処理と分析へのアプローチ方法を変革する計り知れない可能性があると自信を持って言えます。計算能力をデータソースに近づけることで、ほぼリアルタイムの洞察を得ることができ、待ち時間を短縮し、全体的な効率を向上させることができます。これらはすべて、今日のペースの速いデジタル世界において不可欠な要素です。

私の意見では、エッジ コンピューティングの将来は、企業と個人にとって同様に変革をもたらし、イノベーションと成長のための新たな機会を提供するものになるでしょう。この進化に参加できるのはとてもエキサイティングな時期であり、今後数年間でどのように発展し続けるかを見るのが楽しみです。

小規模言語モデル (SLM) は、作成と実行に必要なトレーニング データとコンピューティング リソースの量が少なく、より大きな言語モデルの能力に急速に近づいていると指摘されています。

#6 Agentic AI が最前線に

ChatGPT などのチャットボットは、幅広い主題にわたるクエリに答えることに特化しています。それだけではありません。また、コンピューター プログラムを作成したり、電子メールの下書きを作成したり、レポートを作成したり、詩を作成したりすることもできます。

AI エージェントは、チャットボットのように単に会話するのではなく、ユーザーに代わって意思決定を行うことで物事をさらに一歩進め、ユーザーが特定の目標を達成できるように支援します。たとえば、ヘルスケア分野では、AI エージェントを使用して患者データを追跡し、必要に応じて治療計画の調整を提案することができます。

Gartner は、今後の取り組みを進めるにあたり、Agentic AI を 2025 年の重要な戦略的テクノロジー トレンドの 1 つとして挙げています。興味深いことに、2028 年までにエンタープライズ ソフトウェア アプリケーションの 3 分の 1 に Agentic AI が組み込まれると推定されており、これは 1 未満から大幅に増加しています。 2024 年には %。

AI エージェントは、現在利用可能なものよりも直感的でアクセスしやすいアプローチを使用して、ブロックチェーン ベースのスマート コントラクトの草案に採用される日が来るかもしれません。先駆的なブロックチェーン プラットフォームである Avalanche は、AI とブロックチェーンが融合した新しい仮想マシンを開発しており、ユーザーが英語、ドイツ語、フランス語、タガログ語、中国語などの自然言語、または母親から学んだあらゆる言語でスマート コントラクト プログラムを作成できるようにすることを目指しています。 。 Ava Labs の創設者 Emin Gün Sirer 氏は次のように述べています。「[スマート コントラクト] プログラムは、母親が教えてくれた言語そのもので書くことができます。

より簡単に言うと、スマート コントラクト プログラミングのための直感的な AI ツールが、ブロックチェーン テクノロジーの領域に「膨大な数」、さらには「数十億」の新たな個人を引き付ける可能性があるとサイラー氏は予測しています。

#7 「難しい問題」を解決するための推論モデル 

私はアナリストとして、チャットボットでは不十分な例に遭遇してきました。まず、基本的な数学の問題を解決したり、ソフトウェア コードを作成したりすることが難しいと感じることがよくあります。さらに、彼らは科学的な疑問に対する答えを提供することに特に熟達しているわけでもありません。

OpenAI は 9 月に、微分方程式などの複雑な問題に取り組むために設計された一連の高度な問題解決モデルである OpenAI o1 を発表しました。この動きは概ね好評でした。

最終的に、私が提示し続けている複雑な科学的、コーディング的、数学的課題をすべて管理できる人工知能モデルが、ニューヨーク タイムズのコラムニストであるケビン ルーズ氏によって Twitter で共有されました。

さまざまな試験で、学生 o1 は、米国数学オリンピックの出場資格を獲得した米国の上位 500 人の学生と同等のスキルを示しました。さらに、OpenAI の報告によると、物理学、生物学、化学の問題の標準テストにおいて、人間の博士号取得候補者に期待される精度を上回りました。

#8 AGI に焦点を当てる 

これまで説明してきたように、構造化された問題解決の進歩は、人工知能 (AI) を、汎用人工知能 (AGI) としても知られる人間のような知能を模倣する方向に徐々に移行させているため、重要です。これは、AI が特定のタスクを解決するだけでなく、人間と同じように幅広い知的タスクを理解して処理できることを意味します。

昨年末、OpenAI の o3 モデルは、特に数学とコーディングの試験に関して、o1 と比較して優れたパフォーマンスを実証しました。一方、Google の Gemini 2.0 などの他の取り組みも 2024 年に、複雑なタスクをより小さく管理しやすい部分に分割する、構造化された問題の解決に関する進歩を示しました。

それにもかかわらず、汎用人工知能 (AGI) の実現は、依然として多くの専門家にとっての将来の願望です。今日の洗練されたモデルは、重力や因果関係などの基本的な物理原理を直観的に理解するという点で不十分です。さらに、既存の AI システムは、予期せぬ状況に直面したときに自発的に質問を組み立てたり、学習を適応させたりすることができません。

基本的に、Forrester 社の新興テクノロジー担当副社長であるブライアン ホプキンス氏は、汎用人工知能 (AGI) は終着点に到達するというよりは、継続的な旅であると述べ、私たちがこのエキサイティングな冒険を始めたばかりであることを示唆しています。

#9 差し迫ったトレーニングデータ不足の兆候

2024 年は AI クリエイターや愛好家にとってスリリングな年となり、多くの人が AI の進歩が急速なペースで続くと予想しています。しかし、2024 年の一部の議論では、AI の言語学習モデル (LLM) の下位時代がすでにピークに達している可能性があることが示唆されています。

当面の問題は、差し迫ったデータ不足です。 OpenAI や Google などの企業は、大規模な人工知能システムの育成と開発に不可欠なデータ リソースを枯渇させる可能性があります。

すべてのデータをインターネットから収集できるわけではないことに注意することが重要です。また、言語モデルの開発者は、公開されているデータを必ずしも結果を伴わずに収集できるわけではないことに気づいています。たとえば、ニューヨーク・タイムズ紙は、ニュースコンテンツに関連した著作権侵害の疑いでOpenAIに対して法的措置を講じた。他の有力な報道機関も同様の状況で法的救済を求める可能性がある。

「業界の誰もが利益の減少を目の当たりにしている」とグーグルのデミス・ハサビス氏は語った。

別のアプローチには、シミュレートされたデータを使用してアルゴリズムを教えることが含まれる可能性があります。これは、本物の現実世界のデータによく似た、人工的に生成されたデータです。たとえば、AI 開発者 Anthropic の Claude 3 LLM は、少なくとも部分的には合成データについて教育を受けており、合成データを「内部で作成するデータ」と表現しています。

「合成データ」というフレーズは一見矛盾しているように思えるかもしれませんが、医療分野の研究者を含む研究者は、データを人為的に生成することには潜在的な利点があると主張しています。まばらなデータセットを補完することで医療分野における AI のパフォーマンスを強化し、例として特定の民族グループに対する偏見に対処できる可能性があります。

#10 より倫理的な AI の出現

Anthropic がトレーニング データをどのように収集するかについて参照論文で徹底的に説明していることは言及する価値があります。特に、同社の Web サイト クローリング システムはオープンに動作し、ニューヨーク タイムズなどのコンテンツ プロバイダーが Anthropic の訪問を簡単に認識できるようにしています。これらのプロバイダーは、直接信号を送ることで、その設定を Anthropic に伝えることもできます。

同社は、「安全な」AI の開発を目的として 2024 年にその役割が拡大される責任技術責任者を任命するなど、テクノロジーが悪用されないようにするために重要な措置を講じてきました。この取り組みは認識されなかったわけではありません。タイム誌は、同社を 2024 年に最も影響力のある企業 100 社の 1 社として表彰し、「安全性を賭けた AI 企業」と呼ばれることが多い、安全性がビジネス戦略の成功の可能性があるという同社のアプローチを賞賛しました。

2025-01-01 02:04