欧美两性人xxxx高清免费_国产婷婷综合在线视频中文_国产免费久久精品99reswag_在厨房乱子伦在线观看_一边写作业一边c她

取消
搜索歷史
熱搜詞
原創(chuàng)
活動
產(chǎn)業(yè)創(chuàng)新
轉(zhuǎn)型理念
ENI專訪
當前位置:首頁 >文章發(fā)布 > 正文
中國電信AI研究院完成首個全國產(chǎn)化萬卡萬參大模型訓(xùn)練
來源:IT之家  作者: 佚名 2024-09-29 09:23:20
9月28日消息,“中國電信人工智能研究院”官方公眾號今天宣布,中國電信人工智能研究院成功完成國內(nèi)首個基于全國產(chǎn)化萬卡集群訓(xùn)練的萬億參數(shù)大模型,并正式對外開源首個基于全國產(chǎn)化萬卡集群和國產(chǎn)深度學(xué)習(xí)框架訓(xùn)練的千億參數(shù)大模型——星辰語義大模型TeleChat2-115B。

9月28日消息,“中國電信人工智能研究院”官方公眾號今天宣布,中國電信人工智能研究院成功完成國內(nèi)首個基于全國產(chǎn)化萬卡集群訓(xùn)練的萬億參數(shù)大模型,并正式對外開源首個基于全國產(chǎn)化萬卡集群和國產(chǎn)深度學(xué)習(xí)框架訓(xùn)練的千億參數(shù)大模型——星辰語義大模型TeleChat2-115B。

官方表示,這項科研成果標志著國產(chǎn)大模型訓(xùn)練真正實現(xiàn)全國產(chǎn)化替代,正式進入全國產(chǎn)自主創(chuàng)新、安全可控的新階段。

TeleChat2-115B基于中國電信自研的天翼云“息壤一體化智算服務(wù)平臺”和人工智能公司“星海AI平臺”訓(xùn)練完成。據(jù)介紹,其在保證訓(xùn)練精度的前提下利用多種優(yōu)化手段提升模型訓(xùn)練效率和穩(wěn)定性,實現(xiàn)了GPU同等算力計算效率超93%,模型有效訓(xùn)練時長占比超98%。

針對超大參數(shù)模型訓(xùn)練,TeleAI采用了大量小模型進行Scaling,進而驗證不同模型結(jié)構(gòu)的有效性。同時,在數(shù)據(jù)配比方面,基于小模型實驗結(jié)果反饋,采用回歸預(yù)測模型,得到較優(yōu)數(shù)據(jù)配比。

在Post-Training(后訓(xùn)練)方面,TeleAI首先針對數(shù)學(xué)、代碼和邏輯推理等內(nèi)容合成了大量問答數(shù)據(jù),用于SFT(監(jiān)督式微調(diào))第一階段模型訓(xùn)練。

其次,其采用迭代式更新策略,使用模型對提示詞數(shù)據(jù)進行指令復(fù)雜性提升與多樣性擴充,通過模型合成和人工標注提升答案質(zhì)量,并利用拒絕采樣獲取優(yōu)質(zhì)SFT數(shù)據(jù)及RM(獎勵模型)代表性數(shù)據(jù),用于SFT訓(xùn)練和DPO(偏好對齊)訓(xùn)練,以及模型效果迭代。

免責聲明:本文系網(wǎng)絡(luò)轉(zhuǎn)載,版權(quán)歸原作者所有。本文所用圖片、文字如涉及作品版權(quán)問題,請聯(lián)系刪除!本文內(nèi)容為原作者觀點,并不代表本網(wǎng)站觀點。
編輯:喬帥臣
關(guān)鍵詞:   AI  大模型  中國電信 
活動 直播間  | CIO智行社

分享到微信 ×

打開微信,點擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁分享至朋友圈。

来安县| 富蕴县| 千阳县| 新干县| 武陟县| 宜宾市| 天峨县| 汉川市| 米易县| 屏边| 香港| 淮滨县| 句容市| 定兴县| 安仁县| 双辽市| 新疆| 宣汉县| 高碑店市| 皋兰县| 黑山县| 博乐市| 弥渡县| 兰西县| 石棉县| 辽阳市| 惠安县| 威信县| 上蔡县| 怀集县| 公安县| 礼泉县| 格尔木市| 寻乌县| 长阳| 都江堰市| 监利县| 禄丰县| 云和县| 平武县| 邳州市|