本次活動得到了上海市浦東新區科技和經濟委員會、中國(上海)自由貿易試驗區管理委員會張江管理局和張江集團的指導。自十九大報告中提出加快人工智能與實體經濟的深度融合,上海便著力發展人工智能產業,張江作為具有全球影響力的科創中心的核心承載區,也將人工智能產業列為十三五期間重點培育的新型產業。浦東新區政協副主席、科經委主任唐石青,上海浦東軟件園股份有限公司黨委書記、總經理張素龍等蒞臨活動現場并發表致辭。
本次峰會設立9場主題演講和圓桌論壇,包括SAP、真格基金、云知聲、復旦大學、七牛云、安永、滬江、喜馬拉雅、森億智能、浦軟孵化器、平安等近20家達觀數據的合作伙伴和客戶。
人工智能落地開花,文本智能處理應用潛力無限
從1956年美國達特茅斯學院舉行了第一次人工智能研討會開始,人工智能的發展在運算智能和感知智能上已經取得了很大突破,并表現出優于人類的態勢,接下來以理解人類語言為入口的認知智能將成為人工智能發展的突破點。達觀數據創始人陳運文在峰會上的演講《人工智能與文字閱讀理解》中介紹“語言的運用有超過5000年的歷史,不同民族進化出了各不相同的語言體系,當今的工作場景中,平均每個人每天有超過1/3的時間用在文字的閱讀、寫作和處理中。人腦通過博覽群書歸納出內容的規律進行預測分析,計算機則可以通過輸入海量的文本數據,通過大量算法模型的訓練來進行學習和預測。“
真格基金的董事總經理顧旻曼在主題演講《AI創業投資觀察》中分享了互聯網從云端落向地面的過程,如何像“病毒”一樣滲透進所有行業。顧旻曼認為:數據是下一代的石油,AI就是下一代的電。未來,人工智能將遍及人們生活的方方面。“
此外,陳運文也詳細講到了文本智能處理的常見應用場景。達觀數據的文本智能處理平臺涵蓋了垂直搜索引擎、智能推薦引擎和文本挖掘引擎。其中文本挖掘引擎在財務報表賬目信息抽取、商業票據關鍵信息識別、應標書信息自動導出、基金合同差異核對、投資報告項目信息自動提取、法律文書風控要素審核、新聞稿文字校對、政府補貼項目申請表內容核準等方面已經可以成功協助工作人員處理抽取、審閱的工作,企業員工只需做結果的確認即可。陳運文預測:“10年后計算機將代替人類完成50%的基礎、機械、重復的文字處理工作,大型政企客戶也將會配備有相應的計算機軟件系統完成智能化轉型。”
聚焦全球,人工智能賦能企業發展
本次大會的主題聚焦人工智能落地發展,AI在不同行業的破竹之勢,得益于大數據與機器學習的相互成就。語言識別、語音合成、自然語言處理、機器視覺與圖形識別,這些領域機器學習已經有了深入廣泛的應用。SAP高級副總裁黎文憲在現場的演講《機器學習賦能智慧型企業》中講述了機器學習的發展歷程和SAP在企業智能實踐的經驗。他介紹,數字化時代正向智能化時代開始轉變,智慧企業將提升員工專注于更高價值的任務。想搭建智慧企業框架,要有3個關鍵的“組件”:智慧企業套件、智能系統和數字化平臺。企業變得智能可從自動化知識性工作開始著手,例如:轉型人力資源服務、自動化財務運營、自助客戶服務、對話式的銷售機器人和流失客戶挽留洞察等,這些也都是SAP的企業智能愿景。
此外,四大會計師事務所安永的合伙人陳熾現場分享了安永在人工智能戰略和發展中的實踐經驗。安永一直專注于利用最新的開源框架開發基于大數據的平臺,以將先進的分析概念支持實際技術轉換,使客戶真正成為數據驅動型企業。安永重視在自然語言處理、關系圖譜、大數據算法應用、智能自動化這幾個領域的發展,并且在人力資源、財務、稅務合規、供應鏈和信息技術方面已經有了成熟的RPA解決方案與服務。
深度學習應用前景廣闊,自然語言處理助力方案落地
人工智能的熱潮很大程度是由深度學習發展引發,人工智能深度學習領域大力推動了先進的計算機視覺應用的實現,同時也讓自然語言處理領域受益匪淺。復旦大學計算機系教授、2017年國際自然語言處理與中文計算程序委員會主席黃萱菁博士在活動現場的演講《自然語言理解中的表示學習》中,從學術的角度分享了自然語言處理中的新進展和發現。
黃萱菁教授介紹,自然語言處理中的深度學習,其中的一些算法模型幾乎涵蓋大部分人物,如常見的機器翻譯、自動問答、序列標注和文章摘要等都可借由其完成。深度學習也不斷帶來新的變化,例如:語義理解變得更為重要,不斷出現像看圖說話、機器作詩、作詞、繪畫、寫代碼的新玩兒法。
黃萱菁教授從學術的角度介紹,當今自然語言處理領域的深度學習主要受益于“分布式”表示,而NLP領域所謂的深度學習多數還是淺層學習,和計算機視覺相比,也缺少標志性的數據以及系統,同時,多任務學習、對抗學習和非監督學習等也是該領域的新的學習方法??偟膩碚f,深度學習給自然語言處理帶來新的生命力,雖然已經取得成果,但仍然任重道遠。
隨后,達觀數據副總裁桂洪冠從行業具體實施落地方面分享了達觀基于NLP技術的文本智能處理領域的應用實踐經驗。想讓計算機像人一樣準確高效理解文字,對文字的語義理解處理是一大難點。中文語言靈活,句法結構變化多樣,桂洪冠總結了達觀在文本智能處理方面的四大經驗:第一,從詞匯級、句法級和篇章級以此理解文字含義;第二,為特定應用場景制定相關的語言模型,比如為專業領域文本進行語言建模,對行業語料進行不斷的積累和處理;第三,必須利用機器學習確保泛化的能力,也就是使算法具有舉一反三的能力來確保計算模型自動優化,效果可持續提升;第四:通過構造知識圖譜利用行業專家的經驗,用結構化的背景知識更好理解文本內容。
風云再起,人工智能開辟企業創新之路
越來越多的“傳統行業”已經開始和人工智能的緊密結合,AI+已經成未來可見的生活方式,智能出行、智能家居、智能存儲、智慧醫療……現場云知聲創新事業部總裁陳吉勝分享了云知聲在人機交互方面的實踐心得?;ヂ摼W經歷了從 PC 時代到移動時代的轉變,萬物智聯的時代正在到來。在他看來,IOT真正使用落地的關鍵是需要滿足市場的五個要求:用戶體驗的需要、場景的適配、產品的運營、方案成本和開發周期的協調。
七牛云人工實驗室創始人彭垚在其主題演講中也講述了AI如何引領視頻行業的變遷與創新。對國土安全的視頻內容審核,構建智慧美好城市中進行檢測識別和行為分析以及在即將到來的大視頻時代中智能媒資的廣泛應用,都將成為視頻云時代的主旋律。
此外,平安金服創新部產品總監趙靜芝也分享了平安金服基于人工智能創新的實踐。在圓桌論壇環節,滬江首席科學家夏海榮、喜馬拉雅副總裁李海波、森億智能CEO張少典、浦軟孵化器總經理鄒家瑾和達觀數據聯合創始人高翔也圍繞其在人工智能各垂直行業的經驗分享了各自對人工智能應用落地發展的獨到見解。
人工智能的發展已經從高大上的概念變得觸手可及,計算機視覺、語音識別、文本智能處理逐漸成為各大行業的創新生產力,驅動著不同產業整體的智能化轉型。
張江作為全球技術創新的熱土,已經有諸多優秀的人工智能領跑企業,達觀數據作為一直扎根于張江的人工智能企業代表,將繼續推動文本智能處理在中國企業的落地應用,以技術推動產業變革,為中國智能化轉型建設賦能。