
著者:Wangshu Tencent Research Institute Post -Doctoral Post Doctoral
早くも2001年には、ゲーム内の人工知能の分野が人工知能(人間レベルAI)を実現または作成する大きな可能性があることを指摘しました[1]。人工知能の研究の出発点として、タスクシーンの複雑さと多様性を備えたゲームは、幅、深さ、柔軟性の観点から人工知能の保証を提供します。
現在、AI世代の急速な発展と意思決定AIテクノロジーを作成することで、ゲームと人工知能の共鳴の開発動向がより明白です。GDC2024(Global Player Development Conference 2024)で、AIは会議の焦点となり、AIをテーマにした64ゲームのスピーチで8%を占めました。Generation AIの分野では、ゲーム業界の62%がAIツールを使用してゲームコンテンツを作成しています[2]。意思決定の分野では、Google Deepmindチームは、Alphastarの後にGMA SIMA(スケーラブルインストラクターMultiWorldエージェント)を再び発売しました。
技術テスト分野:
GM AIエージェントは、ゲーム環境に基づいて練習します
このゲームは、意思決定の明確な測定基準を提供します。テクノロジー。現在、OpenAI、DeepMindなどを含むAIの研究チームのほとんどは、ゲームをトレーニングシナリオとして選択し、さまざまな種類のゲームシナリオでユニバーサルインテリジェンスを作成し、これを使用して一般的な人工知能を作成することに取り組んでいます。
2024年3月13日、Google Deepmindチームは、Sima(Scalable Instartor MultiWorldエージェント)という名前のAIインテリジェンスをリリースしました。強力な自然言語の理解と移行学習の能力により、多くの研究者がSIMAの出現を「SmartのChatgpt Moments」と見なすことができました。
DeepMindは、テクニカルレポートでSIMAの基本原則と技術的パスを説明し、複数の3D仮想世界でスケーラブルで指示できるユニバーサルゲームインテリジェントボディとして定義します。DeepMindチームは、Sima Smartトレーニング環境として、9つの人気のある3Dオンラインゲームと4つの3Dシーンを選択しました特定のトレーニングの過程で、インテリジェントエクスペリエンスは、学習画面のゲーム画像情報を継続的に観察し、ゲーム内のプレーヤーのさまざまな操作手順と組み合わせて、キーボードとマウスの出力を実現して、さまざまな操作を実行するロール実行を実行するゲーム[3]。
>
図1シマスマートプロジェクトの概要
SIMAプロジェクトは、人工知能の分野(AGI)のディープマインドチームの分野で重要なマイルストーンです。大規模な言語モデルに基づいているSimaでは、ゲーム環境の観点から、ゲーム環境で訓練された決定とアクション機能が移行することが期待されています。現実の世界に。
SIMAがリリースされる前に、業界には複数の一般的なゲームスマートリサーチプロジェクトがありました。
Gatoは2022年11月にDeepmindチームによってリリースされました。Atariゲームをプレイし、Real Robot Armスタッキングビルディングブロックを制御できます。Gatoは、GPTの大規模なモデルアーキテクチャを使用しています。2023年3月の研究で、Microsoftは、GATOなどのGatoがマルチモード情報の大きなモデルを組み合わせていることを指摘しました。これは、知性の初期段階で生まれる可能性が高い[5]。
>
図2 deepmindによって作成されたgato
GATOと同様に、「My World」ゲームが共同で作成したNobitaのCaltech、Caltech、StanfordのStanfordなどの研究機関があります。Minedojoは、「My World」ゲーム(YouTube)、Encyclopedia(Wiki)、およびユーザーコミュニティ(Reddit)のプレイヤービデオに関する情報を、「Minecraft」ゲームのテキストプロンプトに基づいているメッセージをトレーニングするトレーニング資料として使用しています。それぞれを完了します。Minedojoは、いくつかの単純なプログラムタスクを完了するだけでなく、説明に基づいてライブラリを構築するなど、簡単な説明に基づいて一連の創造的なタスクを完了することもできます[6]。
>
図3 Minedojo能力モデル
GatoとMinedojoの2つのタスクは、人工知能の研究における2つの異なるアイデアに対応しています。十分なタスクを解決するか、十分な複雑なタスクを解決します。ただし、上記の2つの研究の制限もあります。Minedojoは、特定のゲームを持つことなく、単一のゲームでのみさまざまなタスクを完了することができます学習能力は、特定の移行学習能力を備えていますが、特定の移行学習能力がありますが、特定の移行学習能力はあります。ゲーム環境は、現実世界のシーンと大きなギャップです。
現在、ゲーム環境のトレーニングに基づいたGMは、業界のコンセンサスになっています。TED AI 2023スピーチでは、Nvidiaの上級科学者であるJim Fanは、基礎エージェントの概念を提案しました。 7]。中国では、テンセントはまた、AIマルチインテリジェンスと複雑な意思決定 – 研究プラットフォームに啓発され、テンセントAIラボと「王の栄光」に依存して、アルゴリズム、コンピューティングパワー、および実験シナリオの中心的な利点に依存しています。学術研究者とアルゴリズム開発者は、主要な国内アプリケーション探査プラットフォームを提供しています。
新しいブレークスルー:
シマは大規模な言語モデルを実装しています
AIエージェントトレーニングによる効果的な融合
SIMAの出現は、大規模な言語モデルとスマートトレーニングを組み合わせて、AIスマートの意思決定 – 製造能力と一般化のブレークスルーを達成します。SIMAは、さまざまな3Dゲーム環境をよりよく理解するだけでなく、人間に従って人間のようなさまざまな3Dゲームの世界でさまざまなタスクを実行できます人間に[8]。DeepMindの創設者兼CEOであるDemis Hassabisは、インタビューでさらに鈍いです。「大規模な言語モデル、AIインテリジェンストレーニング、ゲーム環境を組み合わせた分野には、膨大な開発の見通しがあります。ディープマインドは、将来この分野への研究投資を増やし続けます。[9]エッセンス「全体として、他のSIMAの特性とブレークスルーは、主に次の側面に反映されています。
第一に、Simaはゲーム環境をトレーニングに使用しますが、スマートな動作と指示を受け取ることの一貫性にもっと注意を払っています。Deepmindチームの観点から、」ゲームは人工知能です(AI)システムの重要なテストフィールド現実の世界と同様に、ゲームは豊かな学習環境でもあり、実際のタイムの設定と敏感な反応を伴う目標を変更します。DeepMindチームが以前にリリースしたゲームインテリジェンスと比較して、トレーニングプロセス中に、多数の人間プレーヤーの動作データも観察されたことです。人間のプレイヤーまたはゲームでは、さまざまなゲーム環境で人間からの自然言語の指示に従うことを学び、ゲーム環境での指示と一致する行動をとることを学びます。
第二に、SIMAは大規模な言語モデルとスマートトレーニングを組み合わせて、統一された人間化されたインタラクティブインターフェイスを採用しています。「言語と環境の学習は補完的です。自然言語の学習を通じて、普遍的な表現と抽象的な概念を理解し、学習効率を改善することができます。導入され、すべてのトレーニングの優先順位に従いました。言い換えれば、SIMAはゲームのソースコードやカスタムAPIにアクセスする必要はありません。画面上の画像情報とユーザーが提供する自然言語の命令の2つの入力のみが必要です。キーボードとマウスを使用してゲーム内の文字を制御してこれらの命令を実行できます。特定の相互作用方法に関して、SIMAは統一された人間化されたインタラクティブインターフェイスを使用して、インタラクティブインターフェイスを直接呼び出して、SIMAに自然言語の指示を発行できます。
>
図4 Sima Smart Architecture
第三に、SIMAには優れた一般化機能があり、異なる仮想シナリオで高いレベルの能力を維持できます。Deepmindチームのデータによると、SIMAは600の基本スキルを通じて評価され、ナビゲーション(左ターンなど)、オブジェクトの相互作用(登山はラダー)、およびメニューをカバーし、同様のインテリジェンスよりも高いパフォーマンスレベルを使用しています。Deepmindの研究者は、SIMAが1,500の特定のゲーム(ゲーム内)ミッションを完了する能力を評価しました。同じタイプのインテリジェンス本体よりも(図5を参照)。
>
図5異なる環境での複数のインテリジェンスのパフォーマンス比較
新しいシーンアプリケーション:
AIはゲームの作成をヘルプします
コンテンツの作成効率を改善します
このゲームは、一般的なAIエージェントを作成するためのテストフィールドとインキュベーターになり、意思決定の最新イテレーションAIテクノロジーを継続的に促進しています。同時に、安定した拡散や変圧器などのAIテクノロジーを生成する成熟により、AIテクノロジーはゲームや、より広範な文化産業のコンテンツ作成を支援し始めました。 、製品の研究開発効率を改善し、インタラクティブコンテンツの生産のしきい値をさらに減らします。
アプリケーションレベルでは、Generation AIモデルはゲーム開発者の強力なアシスタントになりました。「2024 Unityゲーム業界レポート」のデータによると、AIテクノロジーの使用後、ゲームスタジオの71%が、R&Dと運用効率が効果的に改善できると述べていますさまざまなリンクで。
ゲームコンテンツの制作側では、Generation AIは、テキスト生成、2Dアート作成、コード生成と検出、およびレベル設計生成で広く使用されています。ゲームアートワークプロセスにおけるAIツールの介入の前に、ゲームアートワーカーが高品質のイラスト描画を完了することは、安定した拡散時間の使用などの生成されたAIツールを1日短縮した後、1週間になります。 。
>
図6 AIGCツールに基づく描画プロセス
さまざまな種類の労働者のコミュニケーションコストを削減するという点では、AI世代にも大きなアプリケーションスペースがあります。たとえば、ゲームの制作の過程で、特にゲームアートスタイルが構成され、選択されている場合、ゲーム計画とアートワーカーの間のコミュニケーションには多くの時間コストがかかります。AIツールを生成する介入は、プランナーを迅速に支援し、創造性を提示し、コミュニケーションコストを大幅に削減することができます。
ツールのレベルでは、フォーマットAIの生産と開発効率の改善により、さまざまなゲーム会社もそれらをそれぞれのコンテンツ制作ツールに統合し始めました。ゲームチップ会社のNvidiaは、2023年6月にゲーム開発者であるAIツールプラットフォームNvidia Ace for Gamesをリリースしました。 GDC 2024では、NVIDIAとInworldの生産効率。ゲームプレイ[10]を生成します。
>
図7 NvidiaがリリースしたCovert Protocolテクノロジーデモ
Game Engine Company UnityとUnrealは、Generation AIに基づいた新製品もリリースしています。Unityは、2023年7月に人工知能技術に基づいてリリースされました。 。
ゲーム制作会社はまた、AIテクノロジーを包括的に受け入れ、AIを使用してコンテンツの生産ツールを強化し、コンテンツの研究開発効率を継続的に改善します。以腾讯为例、腾讯aiラボ在gdc 2024重磅发布了自研游戏全生命周期ai引擎“ giinex”、该引擎借助腾讯自研生成式ai和决策ai模型、面向ai驱动的npcコンテンツ生成の分野では、3Dグラフィックス、アニメーション、都市、音楽など、さまざまなAIGC機能を提供できます。Giinexエンジンの助けを借りて、元々5日間必要とされていた都市モデリングタスクが完了し、効率は100倍になりました[11]。
>
図8 TencentゲームAIエンジンギネックスアーキテクチャ
結論
1956年のDatmouth Conference以来、人工知能の分野で、初期のコンピューター科学者はAIを「機械の反応方法は、人が人に基づいているという知性に似ている」[12]、そしてほぼすべてのものと定義しました。それらの後に、人工知能の研究はすべて「シミュレーション」の人間の知能の道をたどり、その知覚、認知現実世界、およびsui Xingを強化するために、耳を傾け、見た、話し、考え、学び、行動することができる人工知能を作成しようとしています決定 – 決定決定 – 行動する能力を制作する。
今日、人工知能の研究は依然として人間の道と目標に従っています。ChatGPT、SORAなどに代表される大規模な生成AIモデルと言われている場合、人工知能の「認識」と「認知」能力を物事に向けて強化し、一般的な人工知能に向けた最初のステップを完了しました。したがって、人工知能が複雑で多様なゲーム環境での機械学習を通じてAIモデルを適切に決定できるようにすることができます。それを達成し、それを達成するための情報。
現在の人工知能の研究距離は長い道のりを達成していますが、ただし、AI世代と意思決定の組み合わせは、AIの実現のための新しい可能性を間違いなく開きます。大規模な言語モデルとAIインテリジェンスの組み合わせに基づいて、特定の環境で効果的な決定を下すことができるだけでなく、未知のものを学び、適応させ続けることができるSimaのようなユニバーサルゲームインテリジェンスを形作ることができたことがわかります。環境、そして未知の環境にも適応し、未知の環境は継続的に学習することができます。インテリジェンスのようなインテリジェンスを表示します。将来、トレーニング環境が継続的に増加するにつれて、一般的なインテリジェンスは、より複雑で高等言語の指示を理解する能力を持っている可能性がありますまた、ある日、GMはゲームの小さな世界のテストを通じて大きな世界の広大な段階を通過し、人間社会の何千もの産業に役立つことを楽しみにしています。
この記事の執筆中のガイダンスについては、Cao Jianfeng、Liu Lin、Wang Pengなどに感謝します!