量子位 | 公眾號 QbitAI
集結了Transformer作者、前OpenAI工程副總裁的創業團隊,不到半年就亮出首個大模型——
Action Transformer(ACT-1)。
簡單來說,這是一個會使用瀏覽器、Excel等軟件工具的AI。
基于Transformer的自然語言處理能力,它能理解人類給出的命令,并完成相應操作。
比如,想要在Excel表格中加上利潤、利潤率,只需把這段話輸入給AI,它就能自己在對應行列創建公式完成任務了。
想要在網上找房子,也不用自己搜索再設置各種篩選條件了。
只需要告訴AI:幫我在休斯頓找一套四口之家住的房子,預算在60萬。
然后AI就能一氣呵成找到目標范圍內的房源了。
整個過程非常絲滑連貫,看上去比自己手動操作要快上很多。
最大的好處就是不用自己來操作了,“吆喝”一聲即可,屬實是懶癌福音。
團隊表示,他們認為人類在電腦上的各種操作,通用人工智能也能搞定,ACT-1正是他們朝這個方向邁出的第一步。
讓AI來幫助人機交互
從官方目前公布的功能來看,這個AI像是Siri、微軟小娜的究極加強版。
它的優勢在于幫人們省去了很多繁雜的操作,比如在網頁上填信息表格,鼠標不操作個十幾次很難搞定。
但是如果用AI,只需輸入一句話。
而且AI的操作并不局限在一個網頁。
讓它找個一千塊以下的冰箱并聯系賣家,AI先從購物平臺上檢索,然后自己打開郵箱寫郵件。
遇到自己不懂的事情,還知道上維基百科搜索一番。
即便是操作失誤了,也能根據人類給出的教程指導快速學習。
這不,一開始弄成亂碼的Excel表格,在學習了正確的公式后,AI很快給出了正確的操作。
總之就是把日常我們用電腦時的一些繁瑣小事,交給AI來辦。
正如公司創始人兼CEO David Luan所說,他們希望由AI來完成一些瑣碎的基礎電腦操作,讓人類更專注于自己的工作。
研發團隊表示,他們是通過將ACT-1連接在一個Chrome擴展程序上,讓它來觀察瀏覽器的一些操作,比如點擊、輸入、滾動等。
目前來看ACT-1還有很多進步空間。團隊希望它最終的操作速度可以達到人類察覺不到的水平。
值得一提的是,想讓AI來充當人類電腦操作助手的,并非Adept一家。
今年2月,DeepMind發表了一篇論文,表示他們利用數據驅動的方法,讓AI學習到人類操作電腦的方式,從而讓它們完成訂機票等任務。
DeepMind表示,他們訓練的AI可以完成100多項任務,并且都達到了人類水平。
此外,由DeepMind聯合創始人穆斯塔法等人創立的Inflection AI,也是想以AI的方式,重新定義人機交互。
超豪華主創團隊
ACT-1的打造者是Adept,今年4月官宣成立。
天使輪便拿下6500萬美元融資,投資人包括Uber CEO、特斯拉自動駕駛負責人、Airtable創始人等。
創始團隊陣容非常豪華。
首席科學家是Ashish Vaswani。他是《Attention is all you need》的第一作者,平常看論文時經常出現的“(Vaswani et al., 2017)”就是這位大佬。
他博士畢業于南加州大學,在谷歌大腦工作已有5年。
Transformer的另一位作者Niki Parmar也加入了該團隊。
她在印度上完大學后,同樣在南加州大學讀完碩士,在谷歌工作了近7年。
創始人兼CEO David Luan,是前OpenAI加州實驗室工程副總裁,參與過GPT-2、GPT-3、CLIP、DALL-E等模型的開發,后來加入谷歌,曾任谷歌大腦大模型研究的Director。
除了以上幾位,團隊人員還包括:
Kelsey Schroeder,斯坦福大學計算數學(computational mathematics )專業碩士,前谷歌大模型生產infra的產品負責人;
Augustus Odena,在谷歌領導大型語言模型相關的工作,也有不少圖像合成方面的研究;
Erich Elsen,機器學習和高性能計算交叉領域的研究人員,前Deepmind員工,主要研究大模型,在更早之前,還分別在谷歌和百度(硅谷AI Lab)干了兩年;
Fred Bertsch,谷歌數據和協作人工智能系統方面的專家。
最后一位,Maxwell Nye,是剛從MIT畢業的一位博士生,研究重點為自動代碼生成。
總的來說,可謂大佬云集,且各有專攻。
目前,Adept的最新成果ACT-1還沒有對外開放使用,但可以在官網排隊了~
以及團隊正在招聘人才,感興趣的小伙伴可以關注一下子。