從現場展示來看,文心一言某種程度上具有了對人類意圖的理解能力。但李彥宏也多次提及,這類大語言模型還遠未到發展完善的階段,進步空間很大。
百度同時公布了文心一言的邀請測試方案。3 月 16 日起,首批用戶即可通過邀請測試碼,在文心一言官網體驗產品,后續將陸續開放給更多用戶。此外,百度智能云即將面向企業客戶開放文心一言 API 接口調用服務。3 月 16 日起正式開放預約,搜索“百度智能云”進入官網,可申請加入文心一言云服務測試。
發布會現場,百度創始人、董事長兼首席執行官李彥宏展示了文心一言在五個使用場景的表現,包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。
在文學創作場景中,文心一言根據對話問題將知名科幻小說《三體》的核心內容進行了總結,并提出了五個續寫《三體》的建議角度,體現出對話問答、總結分析、內容創作生成的綜合能力。此外,文心一言準確回答了《三體》作者、電視劇角色扮演者等事實性問題。面對“于和偉和張魯一有哪些共同點”、“于和偉和張魯一誰更高”這類問題,文心一言也基于推理能力得出了答案。
在商業文案創作場景中,文心一言順利完成了給公司起名、寫 Slogan、寫新聞稿的創作任務。文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及 5500 億事實的知識圖譜等。
據百度介紹,文心一言還具備了一定的思維能力,能夠學會數學推演及邏輯推理等相對復雜任務。面對“雞兔同籠”這類鍛煉人類邏輯思維的經典題,文心一言能理解題意,并有正確的解題思路,進而像學生做題一樣,按正確的步驟,一步步算出正確答案。
在此基礎上,文心一言還表現出中文理解及多模態生成能力?,F場展示中,文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論,還用“洛陽紙貴”四個字創作了一首藏頭詩。
多模態生成方面,李彥宏現場展示了文心一言生成文本、圖片、音頻和視頻的能力。值得一提的是,文心一言甚至能夠生成四川話等方言語音;文心一言的視頻生成能力則因成本較高,現階段還未對所有用戶開放,未來會逐步接入。
數據顯示,自 2 月份百度官宣“文心一言”以來,已有超過 650 家企業宣布接入文心一言生態。百度首席技術官王海峰表示,文心一言,是新一代知識增強大語言模型,是在 ERNIE 及 PLATO 系列模型的基礎上研發的。它的關鍵技術包括有監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。前三項是這類大語言模型都會采用的技術,ERNIE 和 PLATO 中也已經有應用和積累,在文心一言中又有了進一步強化和打磨;后三項則是百度已有技術優勢的再創新。