2025年5月21日,國內(nèi)首個(gè)基于國產(chǎn)算力預(yù)訓(xùn)練的視覺基座大模型——“橘洲”V1端側(cè)版在長沙上線,它在智能手機(jī)上實(shí)現(xiàn)1024×1024分辨率圖像的秒級生成,具有成本低、質(zhì)量高、速度快、輕量級、可離線的特點(diǎn)。

據(jù)悉,“橘洲”視覺基座大模型由湖南匯視威智能科技有限公司(簡稱“匯視威”)自主研發(fā),依托中科曙光算力,在較短時(shí)間內(nèi)完成了近4000萬張圖片訓(xùn)練,成為全國首個(gè)在國產(chǎn)算力上完成整體訓(xùn)練和推理過程,并實(shí)現(xiàn)移動端部署的視覺基座大模型。
視覺大模型是視覺人工智能的基礎(chǔ)設(shè)施,有著推理成本高、數(shù)據(jù)隱私缺少保障、帶寬和時(shí)延要求嚴(yán)苛等弊端?!伴僦蕖币曈X基座大模型創(chuàng)新性地解決了這些痛點(diǎn)——其采取跨模型結(jié)構(gòu)極限蒸餾技術(shù),圖片解碼模型參數(shù)量是云端解碼模型參數(shù)量的1/50;設(shè)計(jì)了高效的文生圖預(yù)訓(xùn)練方法,將訓(xùn)練時(shí)間壓縮到20小時(shí);使用加速推理訓(xùn)練方法,出圖從28步壓縮至4步,能做到秒級生成高分辨率圖片。