北京2023年2月24日 /美通社/ -- 日前,網(wǎng)易伏羲中文預(yù)訓(xùn)練大模型"玉言"登頂中文語(yǔ)言理解權(quán)威測(cè)評(píng)基準(zhǔn)CLUE分類任務(wù)榜單,在多項(xiàng)任務(wù)上超過人類水平。其具備的自然語(yǔ)言處理能力,可應(yīng)用于語(yǔ)言助手文本創(chuàng)作、新聞傳媒、智能客服等領(lǐng)域。在"玉言"大模型研發(fā)過程中,浪潮信息以高性能、高品質(zhì)的AI算力服務(wù)高效助力網(wǎng)易伏羲團(tuán)隊(duì)相關(guān)工作開展。
網(wǎng)易伏羲大模型參數(shù)規(guī)模達(dá)到百億,開發(fā)過程中對(duì)訓(xùn)練算力的需求非常大,并且需要高效管理模型和算力資源,并按需彈性地使用算力。為了應(yīng)對(duì)這些挑戰(zhàn),網(wǎng)易伏羲與浪潮信息緊密合作,通過采用AI算力服務(wù)模式,解決了超大規(guī)模參數(shù)大模型所需訓(xùn)練算力需求,同時(shí)還獲得了高質(zhì)量中文語(yǔ)言數(shù)據(jù)集的有力支持,開發(fā)效率顯著提升。
本次登頂CLUE分類任務(wù)榜單的"玉言"大模型參數(shù)達(dá)到110億,結(jié)構(gòu)由深層Encoder和淺層Decoder組成。這種結(jié)構(gòu)使得大模型具有優(yōu)秀的理解能力和生成能力,同時(shí)方便訓(xùn)練任務(wù)的設(shè)計(jì),不需要復(fù)雜的掩碼策略。同時(shí),"玉言"具有良好的泛化性,在各類任務(wù)上都有著出色的性能。目前,大模型相關(guān)技術(shù)和成果已應(yīng)用在網(wǎng)易集團(tuán)內(nèi)的文字游戲、智能NPC、文本輔助創(chuàng)作、音樂輔助創(chuàng)作、美術(shù)設(shè)計(jì)、互聯(lián)網(wǎng)搜索推薦等業(yè)務(wù)場(chǎng)景,取得了顯著的業(yè)務(wù)效果。
浪潮信息推出的AI算力服務(wù)產(chǎn)品,涵蓋國(guó)際和國(guó)內(nèi)領(lǐng)先的4種AI算力產(chǎn)品、經(jīng)"源"清洗驗(yàn)證過的語(yǔ)言或多模態(tài)的大模型數(shù)據(jù)集的2種數(shù)據(jù)產(chǎn)品、由浪潮"源"專家團(tuán)隊(duì)提供的語(yǔ)言或多模態(tài)的大模型訓(xùn)練支持的2種算法產(chǎn)品以及AI訓(xùn)練推理資源管理調(diào)度的1種平臺(tái)產(chǎn)品。目前,AI算力服務(wù)相關(guān)信息已在元腦生態(tài)AIStore平臺(tái)上線,并提供進(jìn)一步購(gòu)買和試用咨詢。