倫敦南方的 DeepMind 實驗室內,兩隻由人工智慧驅動的機器手臂,從 2022 年至今持續展開一場沒有終點的「乒乓球延長賽」。與一般的競技不同,這場對戰不追求勝負,而透過不斷的交鋒與回合對打,讓手臂從每次擊球中學習新策略。研究團隊表示,這種「邊打邊學」的模式,正是推進機器人適應真實世界複雜環境的重要關鍵。
這對機器手臂由 Google DeepMind 開發,被視為未來人形機器人的核心。最初,機器手臂只是簡單的來回擊球,工程師接著逐步提高難度,增加競爭機制,讓機器手臂開始追求得分,發展出各種取分策略,卻也暴露出「邊學邊忘」的困境,經常在適應新策略時遺忘舊戰術,導致回合快速結束。
為了改善這個問題,工程師請來真人陪練,在對抗變化多端的人類時,機器人才顯得更穩定,也制定了多樣策略,最終統計,機器手臂與人類進行了 29 場比賽,勝率為 45%,對中階玩家更達到 55% 的勝率,可說是遇強更強。
為了加速突破瓶頸,DeepMind 團隊進一步引入 Google Gemini 視覺語言模型做為機器手臂的「AI 教練」。Gemini 分析乒乓對戰影片,給出「朝右邊擊球」或「加強網前短球」等自然語言反饋,彷彿教練在場邊指導一般,讓機器手臂能更快速且有效地調整擊球策略。
研究團隊指出,選擇乒乓球做為訓練平台也並非偶然。這項運動具備高速反應、精準動作控制與多樣化策略等特點,且成本低廉,非常適合用來培養通用型機器人的各種能力。
希望透過持續學習與實戰經驗累積,逐步縮短機器人從實驗室走向實際應用的距離,打造出能真正融入家庭、工廠及各種日常環境的智慧型夥伴。
(首圖來源:影片截圖)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:衡阳市)
9月3日上午纪念中国人民抗日战争暨世界反法西斯战争胜利80周年大会在北京天安门广场隆重举行这些瞬间全网刷屏。...[详细]Meta 超級智慧團隊成員背景曝光,四成來自 OpenAI、五成與中國有淵源
导致谣言扩散,严重影响了韩磊先生的公众形象和正常工作生活,对此我深感愧疚和自责。...[详细]
四是管理要求与技术标准一体化考虑。...[详细]
他表示和平万岁,铭记历史,吾辈自强。...[详细]
通常来讲,美元和黄金价格之间呈现着跷跷板效应,美元表现弱,就给黄金价格上涨腾空间。...[详细]
该地块紧邻小区,部分高层住户能从小区窗户看到施工场景,这或许是引发小区内有坟墓传闻的原因。...[详细]
无人潜航器较为普遍的应用是执行侦察任务,例如将潜航器部署到敌舰航线附近,进行情报搜集和侦察监视。...[详细]
公报表示,尼加拉瓜共和国作为革命性、自由、主权独立的国家,始终将国际关系建立在各国人民相互尊重、友好互助、主权对等原则之上...[详细]