• 软件定义算力 第四范式携手英特尔开启企业AI转型的算力时代

    2019.04.11

    近日,Intel在京召開了人工智能技術研討會,ACM世界冠軍、第四范式副總裁&基礎技術研發負責人鄭曌應邀出席,并發表了題為“第四范式在算力時代賦能企業AI轉型”的主題演講。早在去年9月,第四范式就已經與英特爾成立了"英特爾與第四范式人工智能聯合實驗室",通過軟硬一體化技術加速推動AI產業化進程。

    鄭曌在演講中公布了聯合實驗室的技術突破,第四范式基于Intel最新發布的第二代至強可擴展處理器(Cascade?Lake),在金融、醫療等行業中的AI算力研究和場景應用實踐上已經取得卓有成效的成果。與傳統系統相比,第四范式通過將自主研發的企業級AI?PaaS平臺“先知”,與Intel?Cascade?Lake、Intel傲騰固態等先進的處理器和內存架構相結合,打造出更加低門檻、低TCO和高可用的軟硬一體AI基礎設施,使企業開發、部署和應用AI更便捷,在AI轉型的過程中獲得競爭優勢。

    實踐出真知 軟件定義算力時代來臨

    隨著AI應用在各個行業不斷驗證和深入,數據規模、算法復雜度、企業業務場景數量都呈幾何倍數增加,導致基于大數據的數據治理基礎架構、AI算法拼接+CPU/GPU等野蠻硬件堆砌方式難以支撐企業多場景、集中管理AI應用的需求,從而引發由服務器規模激增帶來的投入產出比低、運維成本高等一系列問題;另一方面,面向AI的數據治理,更深、更寬、更復雜,“用算力換智能”的AutoML自動機器學習算法正在快速、規模化應用。對此,鄭曌認為,機器學習算法的突飛猛進和算力的捉襟見肘,成為目前企業在AI轉型過程中共同面臨的艱難抉擇。在服務企業的過程中,第四范式發現先進的機器學習算法、完整的AI治理能力,也在倒逼和推動硬件技術的迭代與演進,特別是針對企業業務、算法、數據、平臺、治理的體系化建設和統籌優化。“軟件正在重新定義AI時代的計算。”鄭曌表示。

    通過高性能AI軟硬一體優化打造AI系統閉環、搭建更適合AI的體系結構,貫通從算力到業務的價值鏈條,可以彌補現有IT架構導致的算力不足、軟硬件不匹配等問題,幫助企業充分激發機器的算力構建AI能力,完成業務場景中的智能決策。第四范式先知是領先的AI?PaaS平臺,內置AI數據治理平臺—Data?Platform、AI應用開發與運行中間件—Hyper-Engine、模型調研與開發工具—Studio、應用上線與運維管理工具—Console和應用市場Solution?Shop等5大核心產品組件,以及自研AutoML算法、高性能實時特征數據庫?RtiDB和高維機器學習框架GDBT等核心技術,并提供靈活、高效、能力全面的開發環境,賦能企業全棧式AI能力,覆蓋更廣泛的開發者。同時,第四范式也在探索如何將AI平臺層與硬件服務器基礎層一體化優化。在系統方面,AI軟硬一體化集成系統做到端到端優化適配,最大限度發揮軟硬件效能,大幅提升性能表現;而軟硬一體的交付模式,可以大幅提升企業部署效率,為企業解決軟硬件兼容問題,同時提升系統穩定性。

    ?

    軟硬一體化 提供企業AI轉型捷徑

    第四范式通過軟硬一體化技術,幫助多個客戶實現了AI應用的快速轉化與部署。以金融行業最普遍的智能風控場景為例,第四范式領先的AutoML算法通過對算法的自動調參探索、自動的特征組合,帶來了顯著的業務效果提升,但普通的中低配CPU和低速大容量存儲介質,受制于訪存帶寬限制,無法支撐高維稀疏機器學習模型在AI訓練過程中的數據高效訪問,從而降低了AI流程的運行速度。而Intel推出的Optane?SSD?則解決了AI訓練和計算過程中的頻繁特征數據計算的難題,結合第四范式自研的Memory/SSD自動緩存切換技術,能夠為企業AI應用提供了領先的硬件存儲特性,特別是革命性的3D?XPoint??技術,打破了內存和固態硬盤之間的邊界,融合了高吞吐量、低延遲、高服務質量、高耐用性和非易性特性等特點,成為第四范式構建高效分布式多級存儲系統的磐石,讓“第四范式先知”平臺獲得了更高效的存儲和查詢能力,極大提升了客戶AI場景下的計算能力。

    除了智能風控場景,在金融監管合規越來越嚴苛的趨勢下,反洗錢領域也成為AI技術應用的熱點,得益于在機器學習領域的有深入研究和創新理念,第四范式已經在該領域取得了全球同業矚目的案例應用。在某行的反洗錢項目中,第四范式通過兩年交易數據訓練了案宗識別精準模型,模型每日預估5000萬-8000萬案宗交易量,十個月完成225億個案宗交易流水。該模型基于第四范式推出的深度稀疏網絡(Deep?SparseNetwork,DSN)算法,支持的模型維度達到千億級,確保模型效果有了更大的提升空間。深度稀疏網絡與傳統模型或向“深”(模型優化)發展,或向“寬”(特征優化)發展不同,它對數據的高維處理,使之有能力將兩種發展方向進行融合,從而兼顧兩方面的優勢。另外一點,它與其他反饋型算法模型所要求的強大并行計算能力也不同,構建的是一個巨型的金字塔型數據矩陣,整體的模型維度可以達到萬億級,因此其對于通用計算能力,以及海量內存支撐能力有著更迫切的需求。Intel新一代“Cascade?Lake”可擴展Xeon至強服務器處理器,除了支持Optane?SSD高速存儲技術外,也展現出AI算力的“天賦”,集成最高56核的全新微架構物理核心和革新的核內互聯架構,并支持12通道原生DDR4內存,這對于加速包括建模、仿真、機器學習和高性能計算在內的一系列數據密集型工作起到了重要的加速作用,整體性能相比上一代產品有了大幅提升。這種性能提升讓第四范式AI平臺有了足夠的算力來應對萬億級高維數據處理提出的挑戰,以其強大的并行計算處理能力,滿足了具體業務場景中的算力需求。

    這些成功案例正是同為AI領域領先企業的第四范式和Intel共同努力的成果,未來,第四范式將繼續與Intel展開深度合作研究,充分發揮自身在算法、數據等方面的優勢,融合Intel領先硬件技術,為客戶和合作伙伴帶來更多的創新技術和產品,為AI在更多行業的落地貢獻力量。

    日韩 欧美~中文字幕