·據(jù)劉慶峰介紹,在單卡算力上,“星火一體機(jī)”對標(biāo)英偉達(dá)A100,同時(shí)還正在和華為一道打造面向超大規(guī)模大模型訓(xùn)練的國產(chǎn)算力集群,形成集群化優(yōu)勢。
“科大訊飛和華為已在聯(lián)合攻關(guān)算力卡脖子的問題。”8月15日,科大訊飛董事長劉慶峰在合肥舉辦的訊飛星火認(rèn)知大模型V2.0升級發(fā)布會上表示。會上,科大訊飛與華為共同發(fā)布用于構(gòu)建專屬大模型的軟硬件一體化設(shè)備“星火一體機(jī)”。
(資料圖片僅供參考)
據(jù)劉慶峰介紹,在單卡算力上,這個(gè)平臺對標(biāo)英偉達(dá)A100,同時(shí)還正在和華為一道打造面向超大規(guī)模大模型訓(xùn)練的國產(chǎn)算力集群,形成集群化優(yōu)勢。
大模型的研發(fā)過程,需要可以支撐千億參數(shù)規(guī)模大模型并行訓(xùn)練的算力和框架,還需要幾千張芯片同時(shí)連續(xù)運(yùn)行。基于此,系統(tǒng)架構(gòu)以及并行訓(xùn)練的集群能力成為大模型研發(fā)的關(guān)鍵。
星火一體機(jī)的訓(xùn)練和推理一體化部署,可用于問答系統(tǒng)、對話生成、知識圖譜構(gòu)建、智能推薦等領(lǐng)域的應(yīng)用,具備大模型預(yù)訓(xùn)練、多模態(tài)理解與生成、多任務(wù)學(xué)習(xí)和遷移等能力。
星火一體機(jī)基于華為鯤鵬CPU+昇騰GPU,另外聯(lián)合華為存儲和網(wǎng)絡(luò)提供整機(jī)柜方案。圖片來源:科大訊飛
據(jù)悉,星火一體機(jī)基于華為鯤鵬CPU(中央處理器)+昇騰GPU(圖形處理器),另外聯(lián)合華為存儲和網(wǎng)絡(luò)提供整機(jī)柜方案,F(xiàn)P16(半精度浮點(diǎn)數(shù)格式)算力2.5 petaFLOPS(1 petaFLOPS為每秒運(yùn)行一千萬億次浮點(diǎn)運(yùn)算)。在大模型訓(xùn)練中最為流行的英偉達(dá)DGX A100,其單節(jié)點(diǎn)包含8塊GPU,可以輸出5 PetaFLOPS的FP16算力。
上月,科大訊飛公布訊飛星火將與昇騰AI聯(lián)合,打造基于中國自主創(chuàng)新的通用智能新底座。一方面,訊飛星火認(rèn)知大模型基于訓(xùn)練推理一體化設(shè)計(jì),實(shí)現(xiàn)大模型稀疏化、低精度量化的技術(shù)突破,能高效適配昇騰AI,加速大模型的行業(yè)落地應(yīng)用和迭代;另一方面,以昇騰AI為核心,軟硬件協(xié)同優(yōu)化,構(gòu)建算力集中、性能優(yōu)越、供給穩(wěn)定、數(shù)據(jù)安全的大模型訓(xùn)練集群。
在當(dāng)天的演講中,劉慶峰更為細(xì)致地講解道,“華為跟科大訊飛共同在昇騰AI的軟硬件平臺和軟件的支撐工具上,把高算力AI芯片、高性能的算子庫、多卡高速互聯(lián)以及分布式存儲結(jié)合起來,尤其是我們聯(lián)合針對人工智能所需要的最重要的算子庫進(jìn)行甄別和打磨。然后在此基礎(chǔ)上,架構(gòu)科大訊飛的訓(xùn)練和數(shù)據(jù)閉環(huán)全流程設(shè)計(jì),以及訓(xùn)練和推理一體化設(shè)計(jì)的自研大模型訓(xùn)練平臺,中間是支持大規(guī)模的異構(gòu)算力兼容,也支持混合云架構(gòu)易拓展,使得我們今天所看到的訊飛星火V2.0的演示以及所有產(chǎn)品,架構(gòu)在安全可控的平臺上。”
據(jù)悉,“訊飛星火認(rèn)知大模型V2.0”除了持續(xù)提升通用能力基礎(chǔ)外,重點(diǎn)突破代碼能力和多模態(tài)交互能力。據(jù)劉慶峰介紹,在OpenAI構(gòu)建的代碼能力的公開測試集HumanEval上,訊飛星火大模型V2.0基于Python和C++進(jìn)行代碼寫作的能力接近ChatGPT水平,差距僅為1%和2%,預(yù)計(jì)將于今年10月24日全面超越ChatGPT,明年上半年將正式對標(biāo)GPT-4。
目前,訊飛星火大模型擁有130億、650億和1750億3個(gè)版本的模型參數(shù)可選。圍繞星火大模型,科大訊飛正在構(gòu)建開發(fā)者生態(tài),目前有4000多個(gè)助手開發(fā)者團(tuán)隊(duì)加入星火平臺。
責(zé)任編輯:Rex_16