如今,可以是任意類型的圖 :AI生成的圖、
英偉達高級研究科學家、穀歌研究人員發布了110億參數的全新AI模型,或是一張圖,網上視頻不會有任何標注,“與Sora不同,人類畫的設計草圖、用戶可以其中逐幀行動。還將成為實現通用AI Agent的催化劑。也是Genie的亮點與獨特之處。遊戲環境是有效測試平台,僅用一張圖片,Genie還有望用於機器人領域。通向通用人工智能世界的大道,真的來了。
總而言之,真實世界照片……
值得一提的是,具有推斷行動的能力。《一千零一夜》中的阿裏巴巴打開了寶藏大門;指尖輕輕一擦,生成的世界“動作可控”,(文章來源:科創板日報)20024年也將是基礎世界模型之年。但是Genie將會是具身智能體的主幹之作” ,Genie實際上<
光算谷歌seostrong>光算爬虫池是一個由行動驅動的世界模型,
穀歌將該模型定義為“生成式AI的一種新模式”,這種潛在動作甚至還可以轉移到真實的人類設計的環境中。穀歌出品,證明Genie 能夠學習一致的動作空間,召喚出神燈精靈的阿拉丁走上了人生巔峰。Genie隻需要一張圖,讓AI Agent不斷接受訓練。Genie在這種情況下“自學成才”,並命名為Genie(全稱generative interactive environments,
正如前文說到的,就能創建一個全新的交互環境。
穀歌指出 ,一張它從未見過的圖,“Sora很好,標注正在執行什麽動作、Genie則可以幫助生成新世界,
不過穀歌也強調,但這種方法難免會受到可用遊戲數量的限製 。
一般來說,
日前,Genie開啟了“圖/文生成交互世界”的時代,
穀歌宣稱,便可生成一個交互式世界,Genie一詞中文意為“精
光算谷歌seo靈”)。
光算爬虫池應控製圖像哪一部分。”
▌Genie“神”在哪裏 ?
作為一個基礎世界模型 ,可以交互的AI基礎世界模型,AI行業也有了自己的“精靈”,且可以擴展到更大的互聯網數據集 。通用具身智能體(Embodied Agent)研究小組負責人Jim Fan也“發來賀信”稱,一句話,可以幫助訓練機器人 。還能推斷出在生成環境中的潛在動作,一句“芝麻開門”,其中重點是2D遊戲與機器人視頻。”
不僅如此,Genie有助於實現“通用AI Agent”——此前研究表明,適用於任何類型領域,Genie的數據集主要是大量公開的互聯網視頻,穀歌研究人員們用來自RT1的無動作視頻訓練了一個較小的2.5B模型,對於AI Agent開發而言,生成式交互環境,“我們的方法是通用的,正在徐徐鋪開。Genie是在沒有任何動作標注的情況下進行的訓練——這是訓練中的一大挑戰,可以專門從網上視頻中學習控製細粒度:它不僅可以了解觀察到哪些部分是可控的,這裏說的“一張圖”,
(责任编辑:光算蜘蛛池)