イーロン・マスク氏、Grok AI の次なる未来について明かす

イーロン・マスク氏の人工知能(AI)の次期バージョンでは、現実の画像の認識と解釈にさらに重点が置かれることになる。最新の Grok リリース、バージョン 1.5 は、選ばれたテスターと既存のクライアントの間でベータ テストを行う準備ができています。

イーロン・マスクによる Grok-1.5 ビジョン: 現実世界の空間理解に焦点を当てる

イーロン・マスクの AI チャットボット Grok は、待望の新バージョン Grok-1.5 を発表する予定です。このアップデートは、ドキュメント、図、チャート、スクリーンショット、写真などの視覚データの処理を対象としています。イーロン・マスク氏自身が、2024年4月13日に開催されたXのイベント「Grok-1.5 Vision Preview」でこれらの計画を発表した。

Grok-1.5 ビジョン

—イーロン・マスク (@elonmusk) 2024 年 4 月 13 日

文書の発表によると、今後のチャットボットのアップデートには、RealWorldQA という名前の堅牢な画像処理ツールが含まれており、視覚的な出来事や状況を理解できるようになります。

私たちは、物理世界を理解する上での Grok の機能に特に興奮しています

U.Today が以前に報じたところによると、Elon Musk 氏は、Grok の更新バージョンである Grok 1.5 には、X 件の投稿を読んで要約し、X 件のユーザーの作成を支援する機能があると述べました。

RealWorldQA の最初のバージョンには約 700 枚の画像が付属しており、それぞれに明確な質問とそれに対応する事実に基づく回答が付いています。このコレクションは、クリエイティブ コモンズ BY-ND 4.0 ライセンスに基づいて、興味のある人なら誰でも自由にアクセスできます。

Grok-1.5V が GPT4 および Gemini Pro 1.5 を上回るパフォーマンス: データ

この画期的なデータセットの大部分は、車から収集された匿名化された写真と、実際のさまざまな画像で構成されています。

添付された一連のサンプルでは、​​Grok-1.5 はブロック スキームを Python コードに変換し、子供の絵に基づいて就寝前のストーリーを作成し、スクリーンショットから CSV データセットを作成し、ミームを「拡張」します。

さらに、xAI グループは、Grok-1.5 が主な競合他社である OpenAI の GPT、Google の Gemini Pro 1.5、Anthropic の Claude 3 とどのように比較できるかについての評価を提供しました。

xAI のレポートによると、Grok-1.5 は他の競合他社と比較して、すべての数学問題、文章理解、現実の状況分析において優れていました。

2024-04-13 15:44