Google DeepMind 發表通用「Genie 3」世界模型(World Model),即時生成前所未有的動態 3D 環境,供使用者與 AI 代理互動。
世界模型是一種 AI 系統,可模擬環境,用於教育、娛樂或訓練機器人、AI 代理等場景,是邁向 AGI(Artificial General Intelligence,通用人工智慧)的關鍵基石。透過世界模型,使用者只需要給出提示文字,模型便會生成一個能夠自由探索的空間,不同於以 3D 素材手工打造,整個世界由 AI 生成。
Google DeepMind 為此投注大量資源,去年 12 月即展示可根據影像建立互動世界的「Genie 2」,並召集一支由前 OpenAI Sora 影像生成團隊共同負責人帶隊的世界模型團隊。但 Genie 2 仍受侷限,比方說 Genie 2 生成的世界只能玩上大約 10~20 秒。現在 Genie 3 看來是一大進步。
根據官方部落格文章談到,Genie 3 是 Google DeepMind 首款允許即時互動的世界模型,以 Genie 2、Veo 3 的技術為基礎,使用者只需要一段提示文字,即可生成「數分鐘」模擬物理特性、可互動的世界,超過 Genie 2 的 10~20 秒。Google DeepMind 表示,Genie 3 可在視覺記憶下保持場景約 1 分鐘,換句話說,若在生成世界移開視線再轉回來,場景細節大多還會存在。這些生成世界都以 720p 畫質、24fps 更新率呈現。
Google DeepMind 也在 Genie 3 加入所謂「可提示的世界事件」,使用者可透過提示文字改變生成世界中的天氣條件、新增物體和角色。
Genie 3 恐怕不是一般人能夠自行體驗的模型。Google DeepMind 指出,Genie 3 處於研究預覽階段,只開放給少數學者和創作者,計劃未來提供給更多測試者。
▲ 全新 Genie 3 世界模型。
(首圖來源:影片截圖)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:六安市)
最受人关注的是,时任日本首相的野田佳彦与安倍晋三将要在那天进行一场针锋相对的辩论。...[详细]
我们知道,人工智能在美国已经研究几十年,但依然很难看到盈利的希望,商业化落地依然面临尴尬局面,创业者的游戏都是资本推动的,资本是逐利而短视的,如果游戏的结果是一直是无底洞的投入换不来真金白银,游戏...[详细]
对于做号者来说,传统的那一套:不论是策划选题、采访这些新闻流程,还是一般写作中所要求的逻辑性和文笔,统统都不重要,他们只关心流量,以及流量背后的收益。...[详细]
document.writeln('关注创业、电商、站长,扫描A5创业网微信二维码,定期抽大奖。...[详细]
其中农业B2B平台获投事件31起,快消B2B平台获投事件22起,汽车后B2B平台获投事件20起,成为获投事件最多的Top3行业。...[详细]
七、白颜色使用让网站突出重点 使用白颜色来装饰网站,很容易给人一种视觉聚焦效果,这种网站很容易突出网站主题。...[详细]
“我从没有想过会有这么一天。...[详细]
日前,第四届黑马运动会在京开幕。...[详细]
而也正因为知乎用户的构成结构,使其远离了互联网的“屌丝用户群”,具备了客观、理性、讨论的平台基因,让其在社交网络的舆论分布上了占据上游地位,其发声能够让人信服。...[详细]
密子君是国内第一个“吃螃蟹”的人。...[详细]