中國信息通信研究院(簡稱“中國信通院”)正式啟動(dòng)DeepSeek國產(chǎn)化適配測評工作,旨在為DeepSeek系列模型在多硬件多場景下的適配部署提供參考。一是評價(jià)模型在包括硬件芯片、計(jì)算設(shè)備、智算集群等軟硬件系統(tǒng)中的適配效果;二是反映模型在軟硬件系統(tǒng)適配過程中軟件棧及工具的適配易用性及開發(fā)部署成本。
據(jù)介紹,本次測評將面向包括芯片、服務(wù)器、集群、開發(fā)框架及工具鏈、智算設(shè)施及平臺等在內(nèi)的人工智能軟硬件產(chǎn)品及系統(tǒng)開展。測試將主要圍繞表1所示的DeepSeek不同模態(tài)、不同尺寸的系列模型,面向推理、微調(diào)、訓(xùn)練過程,低成本使用測試工具AISHPerf,從適配成本、功能完備性、優(yōu)化效果、性能指標(biāo)等多方面開展測試評估。
