K
Knifey1 個月前

下一個科技是什麼?與OpenAI合作的人形機器人問世!


自從ChatGPT推出以後,許多AI泡沫的質疑聲浪也不斷出現;而儘管有報告指出企業在採用生成式人工智慧方面確實還存在成本和準確性的問題,但在人們尚未注意到的時候,機器人的時代才正要啟航。

其中一間價值26億美元的機器人初創公司Figure,才成立不到兩年,由前波士頓動力學、特斯拉、谷歌DeepMind和阿奇航空的員工所創立,展示了與新投資者和合作夥伴OpenAI(ChatGPT的製造商)的首次合作,再度引起各界嘩然。

Figure的聯合創始人兼首席執行官Brett Adcock在社交平台X上發布了一段Figure全尺寸人形機器人Figure 01(發音為“Figure One”)的示範影片,展示了它與附近人類和環境互動的能力,以及機器人如何聽從人類的命令。情境包括找到物品(以蘋果為例)並交給人類,描述自己正在做什麼並與人對話,並獨立識別和執行有用的任務(在影片中撿起垃圾並將盤子和杯子放入烘乾架)。

全新模型的出現:OpenAI VLM

Adcock在X上的一個貼文中說明:Figure的嵌入式攝影機會將畫面傳輸到由OpenAI訓練的大型視覺語言模型(VLM),儘管目前尚不清楚這是否是GPT-4的版本,但OpenAI的旗艦LLM會為此提供動能,例如:GPT-4V。

令人印象深刻的是,Adcock還指出這部影片展示了從端點到端點的神經網絡,在沒有人為遙控操作的情況下,機器人可以獨力完成需要分辨的任務。此外,這是以1.0倍速撥放並連續拍攝的影片,換句話說這個影片並沒有被加速;過往的許多人形機器人發表經常會需要加速影片才能看起來有更流暢的動作,或者需要人類在幕後進行遠端控制,這是具有代表性的一大突破。

Figure未來的方向

Figure 01的主要表現是未來機器人將如何與人類自然地互動及服從他們的命令,直觀地知道他們想要什麼,並比許多其他公司和研究人員以前的開發產品更流暢地完成任務。

但是,這當然還只是一個展示品,而且還是一個機器人原型。要讓這樣的機器人商業化並銷售給企業或消費者還有一大段距離。然而,Adcock公開表示,他們的目標是培訓一個世界模型來操作更多的人形機器人。

在Figure的網站上,Adcock的主要計劃是開發出通用人形機器人,並對人類產生積極影響,為未來幾代人創造更好的生活。這些機器人可以幫助人們消除不安全或不理想的工作,例如經常造成職業傷害或缺乏人力的勞動型產業 —— 讓人類過上更快樂、更有意義的生活。

然而,Adcock也表示目前公司還需要幾十年的時間,耗費一支冠軍團隊、數十億美元的投資和工程創新,才能實現對大眾市場的影響。誠實的說,他們面臨極高的風險和極低的成功率。此外他們也承諾不會將人形機器人用於軍事或國防需求,也不會用於需要對人類造成傷害的角色。

尤其Figure的影片是由OpenAI提供支援,對於人形機器人開發的其他競爭對手將帶來更大壓力,如特斯拉的Optimus和Agility(與亞馬遜合作的人形機器人新創公司)。此外,隨著越來越多的公司進入該領域,包括Hugging Face(最近聘請了一位前特斯拉Optimus科學家來領導其新宣布的開源機器人項目),以及昨天宣布的一家名為Physical Intelligence的新創公司…等。然而,對於人類來說,科技的良性競爭是帶動發展的原動力,因此我們樂見其成,並會持續追蹤最新進展與大眾分享知識的果實。

參考資料


圖片
圖片
圖片
圖片
圖片
圖片
(使用 Facebook 留言外掛程式 留言無法滿足本網站參加活動之資格,僅供非會員討論使用)
互動地圖
interactive taiwan map