1 月 14日消息:“當前,英特爾已經向全球客戶交付了超8500萬顆至強可擴展處理器,從運行IT服務的本地服務器,到管理互聯網流量的網絡設備,再到進行邊緣計算的無線基站和云服務等領域,全力支持算力的快速發展。”1月11日,英特爾正式推出第四代英特爾至強可擴展處理器(代號“Sapphire Rapids”)、英特爾至強CPU Max系列(代號“Sapphire Rapids HBM”)以及英特爾數據中心GPU Max系列(代號“Ponte Vecchio”),在實現數據中心性能、能效和安全性大幅躍升的同時,為AI、云、網絡、邊緣和全球領先的超級計算機帶來全新功能。
英特爾執行副總裁兼數據中心與人工智能事業部總經理SandraRivera表示:“第四代英特爾至強可擴展處理器和Max系列產品的發布,對于推動英特爾在數據中心領域闊步前行,增強數據中心領域的領導地位,以及進一步探索新領域的發展機會極具意義。”
當前,英特爾正總結經驗教訓,加速執行力,提振創新力,建立了正確的領導團隊與產品策略,重塑其在數據中心的領先地位。
開啟新紀元!英特爾祭出七大算力神器
隨著企業對計算的需求不斷增加,盡可能提高能效變得至關重要。據介紹,第四代英特爾至強可擴展處理器由Intel 7工藝制造,采用Chiplet設計,包含52款CPU,最多支持60核,支持業內領先的PCIe 5.0、DDR5內存和CXL 1.1接口。
但相比于增加CPU內核,內置加速器可更高效地提高工作負載性能。英特爾市場營銷集團副總裁、中國區數據中心銷售總經理兼中國區運營商銷售總經理莊秉翰談道,除了看重主頻、核數增長外,英特爾意識到提供內置加速器能夠更有效地提升工作負載的性能,更極致地處理數據中心客戶日益增長的算力需求。
在會上,莊秉翰總結了第四代至強可擴展處理器內置的七大算力神器,解決客戶在人工智能、5G、存儲、科學計算、數據分析、安全領域面臨的重大計算挑戰,與前一代處理器相比,企業可以通過內置加速器把工作負載的平均每瓦性能提升2.9倍。
1、英特爾高級矩陣擴展(英特爾AMX):大幅提升矩陣乘法運算,為人工智能加速提供了全新方式。結合通用CPU計算單元,第四代英特爾至強可擴展處理器可以端到端運行任何AI工作負載。與上一代相比,內置英特爾AMX的PyTorch實時AI推理和訓練性能提高了10倍。
2、英特爾動態負載均衡器(英特爾DLB):顯著提升網絡工作負載的系統性處理性能。英特爾DLB根據系統負載的變化而動態地在多個CPU內核上分配網絡數據,提供高效的硬件負載均衡;調整CPU內核上同時處理的網絡數據包的順序,實現動態網絡處理重排序,實現更高的整體系統性能,相同吞吐量下可降低96%的延遲,與前一代處理器相比,在相同功率范圍下,vRAN工作負載的容量提升2倍。
3、英特爾數據流加速器(英特爾DSA):有助于加快CPU、內存、緩存以及存儲和網絡設備之間的數據移動。應用將數據活動從CPU內核遷移到DSA專屬加速器,可大幅釋放CPU性能并降低時延,讓用戶更高效地管理CPU內核,提高利用率。數據顯示,內置DSA加速器可使SPDK-NVMe的IOPS提高1.7倍。與上一代相比,大數據包順序讀取IOPS提升了60%,時延降低了37%。
4、英特爾存內分析加速器(英特爾IAA):提高分析性能,同時把任務從CPU內核卸載,以加速數據庫查詢吞吐量和其它工作負載。與上一代相比,英特爾IAA可使RocksDB性能提高3倍。
5、英特爾數據保護與壓縮加速技術(英特爾QAT):通過卸載加密、解密和數據壓縮,將任務從處理器內核卸載,實現系統降耗。與前一代相比,集成QAT能夠實現多達2倍的數據壓縮,且核心數更少。
6、英特爾安全引擎(英特爾Security):相應的技術包括英特爾SGX、TME、算法硬件加速、英特爾內存故障管理技術、英特爾平臺固件彈性技術等,為客戶提供切實、有效、可以落地的平臺安全能力。
7、英特爾至強CPU Max系列:首款集成高帶寬內存(HBM)的英特爾至強處理器,極大地提升系統級現代工作負載性能。與上一代相比,英特爾至強CPU Max可使科學計算工作負載性能提高3.7倍。
依托英特爾至強的架構、平臺和加速器創新,英特爾為在其環境中運行一系列工作負載的客戶提供了一套性能領先的產品解決方案,無論是在云端、邊緣還是在本地,通過更多CPU核心和內置加速器組合,提供強大的性能提升。
在會上,英特爾還發布了首個旗艦級數據中心GPU—英特爾數據中心GPU Max系列。該產品采用3D封裝的Chiplet技術,在單個產品上整合了47個小芯片,綜合實現了計算、存儲、網絡多項功能。而這47個裸片來自于不同的代工企業,且采用5種以上的差異化工藝節點,集成了超過了1000億個晶體管,將異構集成的技術提升至了全新水平。
英特爾表示,相較上一代產品,Max CPU和Max GPU的組合,可以使生命與材料科學領域經常使用的LAMMPS處理性能提升12.9倍。同時,基于英特爾的開源軟件工具oneAPI,開發者可以輕松地開展面向Max系列CPU和GPU的設計工作,更大限度地利用多種英特爾異構產品組合,打破跨架構計算平臺的開發和使用壁壘。當前,有超過15款包括中國客戶在內的Max系列GPU系統已經開始設計,將在2023年推出上市。
實用效果如何?八大合作伙伴現身說法
基于第四代英特爾至強可擴展平臺,英特爾攜手客戶及產業伙伴密切合作,大規模提供差異化解決方案和系統以助力其解決算力挑戰。會上,來自騰訊云、天翼云、京東云、阿里云、火山引擎、吉利汽車、浪潮信息與亞信科技的合作伙伴亦分享了其如何基于全新英特爾數據中心產品推動產品、技術創新,以及在諸多領域落地的成功實踐。
騰訊云星星海實驗室研發總監曾欽杵表示,基于英特爾第四代至強處理器,騰訊云全新升級了第七代云服務器實例S7/M7.通過處理器支持PCIe Gen5. DDR5. CXL 1.1以及內置加速器,全方位真實負載加速。同時,第四代至強可擴展處理器AMX特性助力騰訊搜索暨視頻業務提升效率。此外,騰訊云與英特爾長期保持深度的技術交流和合作,致力于目前新技術的創新和突破,在SaaS、視頻AI、數據服務以及云原生方面開展了一系列的全棧式軟硬件協同,推動算力成本進一步降低,幫助終端客戶實現降本增效。
天翼云科技有限公司云網產品事業部總經理楊鑫表示,基于第四代英特爾至強可擴展處理器,天翼云發布了第八代云主機,基于英特爾的芯片架構,天翼云第八代彈性云主機可以支持128vCPU的大規格實例,支持8通道的DDR5內存,包括單條的內存帶寬高達4800MT/S,性能較上一代有大幅度提升。相比上一代機型,第八代彈性云主機在整數計算、浮點計算、并行計算場景實現了50%、60%和30%的性能提升。
京東科技京東云事業部硬件架構總監董可新表示,京東新一代天樞服務器平臺基于英特爾新一代至強可擴展處理器實現了更高的內存與PCIE性能;更靈活的SST規格選項;更可靠的安全技術方案,并基于五大加速器實現極致性能提升。
阿里云智能服務器首席架構師劉禮寅表示,搭載第四代英特爾至強可擴展處理器的第八代ECS實例在通用互聯網、在線音視頻、AI等實際應用中性能提升顯著,整體算力提升60%,數據庫讀寫提升15%,解加密/壓縮解壓縮提升達4倍,AI推理能力提升達4倍。
火山引擎云基礎產品負責人羅浩表示,通過采用最新第四代英特爾至強可擴展處理器,火山引擎第三代彈性計算實例在單核能力、網絡轉發能力、加解密、視頻和AI推理訓練能力上獲得了大幅提升。在此基礎上,計算密集型、內存密集型、I/O密集型以及HPC等火山引擎實例將會全面切換到基于第四代英特爾至強可擴展處理器的引擎上來,助力游戲、汽車、醫藥、金融等行業發展,全面加速釋放算力紅利,提升客戶上云性價比。
吉利汽車研究院工程中心部長廖慧紅表示,吉利為其正在建設10萬核規模的超算中心選擇了第四代英特爾至強可擴展處理器。同時,吉利新一代HPC平臺應用借助第四代英特爾至強可擴展處理器的算力底座,賦能數字研發,助力吉利汽車仿真,實現超低風阻、全域安全。
浪潮信息服務器產品部總經理趙帥表示,通過第四代英特爾至強可擴展處理器的QAT技術,浪潮新一代G7產品平臺把虛擬機的遷移性能提升8.19倍,通過整合英特爾高級矩陣擴展技術,大數據平臺Insight在BF16和Int8的運算中實現5.2倍和9.26倍的性能提升。
亞信科技首席科學家葉曉舟博士表示,亞信科技基于第四代英特爾至強可擴展處理器及其內置的加速器,與英特爾持續開展聯合創新,在算網性能方面,其基礎算網軟件AntDB數據庫吞吐量可以繼續提升43%,AI的應用性能繼續提升3.38倍。
最后,莊秉翰表示,經過多年的技術積累和探索,英特爾構建了完備的綠色數據中心解決方案矩陣,在數據中心電源效率與密度、先進制冷技術和基礎設施智能化三個垂直領域,以及芯片、服務器、機架、數據中心基礎架構四個水平方向,積累了豐富的解決方案和實踐案例。展望未來數據中心發展建設,英特爾將提供算力、安全、網絡、存儲、管理、綠色可持續發展等七大支柱性技術優勢和產品方案,支持從云到邊緣的架構升級,助力產業發展 “芯加速,行至遠”。