36氪获悉,中国大模型创业公司阶跃星辰继开源Step 3.5 Flash模型后,又开源了这款Agent基座模型的预训练权重(Base)、中训练权重(Midtrain)以及配套的Steptron训练框架。据了解,Step 3.5 Flash采用稀疏MoE架构,总参数1960亿,但推理时仅激活约110亿参数,单请求代码任务下推理速度最高可达350TPS。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App
。业内人士推荐币安_币安注册_币安下载作为进阶阅读
外界分析認為,目標下調同時也顯示出官方希望打破「速度崇拜」,將政策重心向高質量發展傾斜。
國安審查下,飛到台灣看電影的香港人