“隨著AI從1.0進入2.0大模型技術階段,我們迎來了有史以來最重要的科技革命和平臺革命。”零一萬物CEO、創新工場董事長李開復日前在接受記者采訪時表示,算力作為AI 2.0發展的關鍵環節,需要采用更務實、更統籌優化的方法來應對當前的挑戰。未來,期待著人工智能尖端企業能夠更廣泛、深入參與到國家AI算力建設中來,各方優勢資源充分融合,更好賦能AI大模型產業發展。
“多地正在積極建設超算中心,打造國家級的算力底座,促進超算算力一體化運營,是非常好的探索和嘗試。”李開復認為,超算中心匯聚云計算、大數據和人工智能研發等多重功能及要素,聚集了豐富的AI發展資源和動能,未來可期。如何更好發揮各方優勢構建超強AI算力,或可從以下四個方面入手:
首先,遵循規模定律(Scaling Law),提升計算效率。大模型規模定律的重要性在這個時代得以凸顯——人類能夠用更多計算和數據不斷增加大模型的智慧,這條被多方驗證的路徑還在推進中,還遠沒有觸達天花板。
同時,大模型的智慧來自于接近無損的壓縮,這點也非常重要。因為規模定律過程中不能盲目堆更多的GPU,所以需要有一個方法評估大模型企業有沒有越做越好或者哪個方法做得更好。遵循規模定律也成為當前諸多大模型企業規模化應用大模型時嘗試突破算力限制,將計算效率最優化的有效途徑之一。
零一萬物內部有嚴謹的相關方法論,且用壓縮的理念去評估,讓以往漫無目的訓模過程變得更系統、更科學并有數學根據,較大提升了自身大模型的計算效率。
第二,加強“模基共建”,尋找算力最優解。目前,發達國家AI領域GPU的數量和規模是我國的數倍左右,面對這樣的差距,我們需要采取更務實有效的舉措——自研AI Infra(AI Infrastructure人工智能基礎架構技術)。AI Infra主要涵蓋大模型訓練和部署提供各種底層技術設施。在國外一線大廠,最高效訓練模型的方式是算法與Infra共建,不僅關注模型架構,而是從優化底層訓練方法出發。零一萬物自成立起便將自研AI Infra設立為重要方向,選擇跟國際一線梯隊齊平的“模基共建”戰略,模型團隊和AI Infra團隊高度共建,人數比為1:1。零一萬物在此基礎上自研了人工智能基礎架構技術,從底層優化訓練方法,較大節省成本,找到了當前條件下算力運用的優質路徑。從零一萬物國際領先的千億參數大模型“Yi-Large”訓練過程來看,經優化后,Yi-Large千億參數模型的訓練成本同比大幅下降。
第三,打造“模應一體”,探尋TC-PMF(Product-Market-Technology-Cost Fit,技術成本×產品市場契合度)。在大模型時代,模型訓練和推理成本構成了幾乎每個創業公司都必須要面對的增長陷阱。用戶增長需要優質的應用,而優質應用離不開強大的基座模型,強大基座模型的背后往往是高昂的訓練成本,接著還需要考慮隨用戶規模增長的推理成本。能夠率先察覺、并達到 TC-PMF這一普惠點的企業無疑會占盡先機。要做到這一點,模型、AI Infra、應用這“三位一體”的優異能力缺一不可。基于此,零一萬物將“模應一體”與“模基共建”一同列為公司的頂層核心戰略,在人才密度和協作方式上,也快速打磨出一整套能夠融合不同專業的優秀人才跨界共創的組織體系。基座模型、AI Infra、API、C端應用AI助手“萬知”,這些全棧式業務部署,使得零一萬物能夠以更全面的視野來看待大模型時代的增長陷阱,也為其在應用層的商業落地帶來了更大發揮空間。
第四,充分發揮尖端AI企業示范優勢。李開復認為,我國在發展AI算力等領域具有一定優勢。除了豐富的大數據資源外,我國的社會資源動員力、融合度較高,在科研、應用領域的研發效率、落地效果較好。同時,我國有非常多卓越的互聯網企業和現象級App應用,比如抖音、美團等等,這些企業在AI算力、算法領域的探索有用戶支持作為基礎,企業更易研發出更具有前瞻性、應用性的應用,是AI大模型產業發展的重要推力。“未來,希望國家級超算中心、國內可靠尖端AI企業、多領域企業間能夠增強資源的整合利用,充分發揮各方優勢,更好融合發展,為AI更好賦能千行百業發展再添新動能。”