21世纪经济报道记者白杨 北京报道
随着大模子时期到来,腾讯吐露模子参数呈指数级削减 ,最新已经抵达万亿级别 。大模与此同时 ,磨炼大模子也逐渐从反对于繁多模态、措施繁多使命睁开为反对于多种模态下的可节多种使命 。
在这种趋向下 ,约算大模子磨炼所需算力重大,力老远超单个芯片的腾讯吐露处置速率 ,而多卡扩散式磨炼通讯斲丧重大。最新若何后退硬件资源运用率,大模成为影响国产大模子技术睁开以及适用性的磨炼紧张条件。
在此布景下,措施腾讯于11月23日宣告,可节腾讯混元大模子眼前的约算自研机械学习框架Angel再次降级 ,可将大模子磨炼功能提升至主流开源框架的2.6倍 ,千亿级大模子磨炼可节约50%算力老本 。
Angel能耐提升眼前,是基于磨炼框架以及推理框架的迭代 。据悉,面向大模子磨炼,腾讯自研了机械学习磨炼框架AngelPTM,可针对于预磨炼