最具代表性的玩家有兩位,一個是有著互聯網基因優勢的百度,一個是人工智能領域A股龍頭企業科大訊飛,都率先做出了產品跟進和規劃。
百度方面,正式宣布推出類似產品,“文心一言”一而再地宣布提前上線時間,生態加盟者也如火如荼地推進;科大訊飛那邊,則很快明確了具體發布時間。
大廠都這么做,背后究竟有什么考量?為何非得要搶占這個熱點風口?
最新消息,科大訊飛首次正面給出了回應,核心歸結就兩點:
第一,確實在搞。
第二,確實有大機會,而且有信心實現ChatGPT類似的技術階躍進步。
在新華網訪談中,關于外界爭議和對ChatGPT的疑問,科大訊飛副總裁、研究院執行院長劉聰回答了一切。
【知己知彼:ChatGPT究竟“強”在哪里?】
訪談中,劉聰主要回答了三大問題:
ChatGPT的突出優勢是什么?
ChatGPT對產業具備什么價值?
科大訊飛為什么有信心做出ChatGPT?
首先是ChatGPT的突出優勢。
從技術突破來看,ChatGPT已經進入認知智能發展的下一階段。
ChatGPT認為,認知智能的發展可以分為五個階段,即知覺和感知階段、表示和推理階段、自主學習階段、創造性思維階段、自然交互和社會化階段。
△來源:ChatGPT
對于落地應用而言,發展到第二階段的AI已能較好完成特定領域中的指定任務。但ChatGPT更進一步具備了自主學習新知識的能力,進入認知智能的第三階段。
這一階段,ChatGPT掌握了高價值信息記憶、多輪對話理解、復雜邏輯推理、多角色風格文本生成、新知識學習應用進化、代碼理解生成等能力。
正如劉聰所言,ChatGPT最突出的優勢,是它展現出的交互式學習“類人”能力:
它能在多輪交互中以“類人”的方式交流、學習和進步,可以自主、快速、不間斷地學習各領域專業知識并達到人類專家水平。
概括來說,相比傳統認知智能,ChatGPT不僅在技術上擁有了“類人”自主學習特征,而且進一步展現出快速適應多領域、多場景的能力。
值得一提的是,在斯坦福前不久的一項研究中,ChatGPT背后的AI模型GPT3.5.已經被認為可能具有人類心智能力。
而直到2022年以前,GPT系列的所有大語言模型都還沒有表現出類似能力。
事實上,“ChatGPT是AI技術的一次飛躍”這一觀點,已為學術界所公認,近期不少谷歌大牛紛紛涌向OpenAI追逐最新技術,也是這一觀點的有力證明。
但若只是單純技術上的突破,尚不足以引起產業界的重視。
劉聰直接承認“科大訊飛確實在做類ChatGPT產品,因為有大機會”,足以說明這一技術給產業界帶來的價值:
類ChatGPT模型的持續發展,以NLP為代表的AI算法可能重構互聯網和移動互聯網產品形態,最終推動商業模式的變革與創新。
所以,ChatGPT究竟對產業界具有什么樣的價值?訪談中劉聰提到的“科大訊飛有信心實現技術階躍進步”,又究竟哪里來的信心?
從產業價值來看,無論是在教育、醫療這類能實現社會價值的領域,還是汽車、辦公、機器人和工業這類依托AI實現“智造”的領域,都有ChatGPT的用武之地。
以汽車這一場景為例,智能汽車就對交互系統提出了更高的要求。
尤其是智能座艙中的虛擬數字助手,需要同時具備多角色風格文本生成、自然語言理解和多任務處理等能力,才能進一步提升用戶交互舒適性。
ChatGPT的自主學習能力,讓系統能很好地學習并適應不同車主的風格和說話方式,迅速理解自然語言狀態下提出的需求,并以車主想要的人設風格與其進行交流,相比現在車載AI“任務問答”的模式更加自然。
以科大訊飛為例,劉聰就透露了未來大模型在行業中的應用方式:
大模型在細分行業的實用性,將以“1+N”的架構呈現。
其中,“1”是通用認知智能大模型算法研發及高效訓練底座平臺,也就是類ChatGPT模型;“N”則是應用于教育、醫療、人機交互、辦公、翻譯、汽車、工業等多個行業領域的專用大模型。
又以醫學場景為例,基于大量醫學教材、論文和病例,類ChatGPT通用認知智能結合醫療領域對話式AI系統,就能打造出“每個醫生的專業AI診療助理、或是每個人的個性化AI健康助手”。
在此之前,科大訊飛在上述產業中,已完成了不少認知智能相關技術的落地。
如教育領域的“因材施教”解決方案,已經用在5萬多所學校、1.3億多師生上;至于語音合成、機器翻譯等技術,也已經在汽車、智能家電等領域參與應用。
不止產業。劉聰強調,科大訊飛的信心來源于“技術上的優勢積累”:
多年來,我們在深度學習算法、大模型技術、行業大數據、知識圖譜、多模態感知、系統工程技術方面有不少優勢積累。
通過最近兩個多月的系統分析和快速驗證,我們非常有信心實現ChatGPT類似的技術階躍進步,并在中文認知智能領域達到國際領先水平。
一方面是資金投入和研究團隊的組建??拼笥嶏w與中科大合作,早在2017年就承建了認知智能全國重點實驗室。
另一方面則是核心算法、數據和算力三方面的長期積累。
算法上,科大訊飛提出了知識與大模型融合統一的理解框架X-Reasoner,致力于彌補大模型模糊記憶技術短板;光是去年,就在認知領域取得了常識閱讀理解挑戰賽OpenBookQA等13項世界第一的成績。
數據上,科大訊飛積累了超過50TB的行業語料數據,目前活躍應用每天超10億人次用戶交互。
算力上,除了近幾年穩定營收提供的資金保障外,算力上的國產替代也是一大考量因素。據官方數據,目前研發訓練服務器已經開始進入國產化, 切換之后效率有的是原來平臺的70~80%,有的效率更超過原平臺的100%以上。
最新消息,科大訊飛人工智能研發生產基地一期即將完工。這里面包含國家級人工智能開放創新平臺、認知智能國家重點實驗室等多個建設項目,自然也包括提供算力支撐的數據中心。
話雖如此,劉聰認為,在ChatGPT賽道上,國內外玩家確實存在技術與產業上的差異。
但他表示,中國就是有必要做自己的ChatGPT。
此般言論如何看待,又當如何解讀?
【中國版ChatGPT勢在必行】
首先,必須得承認的是,中美之間存在一定的技術和產業差距。
從技術來看,ChatGPT誕生于OpenAI多年技術積累之中,其背后的GPT系列模型自2018年起就開始反復迭代。
更底層的技術支撐,更是源于谷歌2017年就提出Transformer架構,這一層面上我國仍存在技術代差。
更進一步具體到認知智能技術來看,中國信通院發布的《2021認知智能發展報告》中顯示:
認知智能領域相關論文發表數量排名前10的機構中,有6所位于美國。
相關領域論文數量上,中國雖僅次于美國,但在質量上仍有差距。專利方面,我國相關專利申請數量于2017年超過美日韓。
在產業生態上,OpenAI自GPT-3開始就以開放接口的形式,與產業上的生態伙伴合作,養活了一大波AIGC玩家,其中18個月估值15億美元的獨角獸Jasper,就是典型案例。
據gpt3demo網站統計,目前已有634個調用GPT-3系列模型開發的應用程序。
但在產業方面,我國卻具有先天的場景和數據優勢。
正如前述文章所說,中美之間AI應用落地存在行業路線差異。ChatGPT作為通用人工智能的代表,本身不是一項好生意。OpenAI背后如果沒有穩定的“現金奶牛”支持,往往也難以存續。因此身處于國內市場大環境下的企業,通用路線往往不是一個最佳選擇。
相比之下,垂直AI應用路線更受眾人青睞,并已有深厚產業積累,如科大訊飛的認知智能技術已經在教育、醫療、金融、汽車、服務等多個領域落地,并構筑起了深厚的行業壁壘。
一旦實現類ChatGPT技術躍遷,就有先發優勢快速落地,甚至有望實現ChatGPT應用落地的彎道超車。
但仍然有一個問題尚未解答:為什么中國非得有自己的ChatGPT?又或是必須跟上ChatGPT熱度不可?
這就關系到ChatGPT給企業乃至產業帶來的變革性價值。
對企業而言,ChatGPT提供了一種可行的技術路徑。它所展現的初步的“智慧”,對于尤其是場景優勢玩家來說,是一種全新的技術路徑選擇。
以前,基于場景探索的玩家,對于AI的探索可能處于“看山是山、看山不是山”的懵懂狀態,現在出現了一座“更小,而且明知會有路的山”。
他們有場景有數據,可以率先吃掉ChatGPT紅利。
而從更為宏觀的角度來看,ChatGPT帶來的是一整個產業模式的變革和創新。
劉聰在訪談中,就談到了ChatGPT給人機交互、信息分發、內容生產、AI for Science這四大模式帶來的革新。
比如人機交互方面,未來通過自然語言與智能產品交互,ChatGPT可以精準了解用戶意圖,調用系統各種軟件和服務來滿足需求,提高交互效率和成功率。
劉聰認為,有可能改變當前APP的使用方式,比如多個功能軟件被整合,甚至出現“大一統”能力的超級通用APP。
還有像已處于變革之中的AI for Science,ChatGPT會進一步加速其發展腳步,比如輔助生成論文摘要和文獻綜述,甚至還可能提出專業的研究建議、提供新的研究思路。
也正因為蘊含的這種變革與價值,ChatGPT也被認作是AlphaGo之后又一場關于AI的啟蒙運動——
通過參與的方式,讓全世界感知到超大語言模型的前景。
事實上,從我國的技術和產業儲備來看,我國不缺ChatGPT相關技術,而且有的是場景和數據。
至少在上一次大浪淘沙留存下來的AI玩家,都有各自垂直場景的商業落地。
所以對于國內ChatGPT未來的發展進程,劉聰在訪談中再三強調:應該理性看待,畢竟存在一定差距,但也要對技術驅動的玩家有信心。
“成長的路上更應踏實前行,遠離捧殺。”