首页
热点
百科
娱乐
科技
资讯
药品
美容
登录
标签
训练方法
TeleAI复杂推理大模型达竞赛级数学表现,评分超o1-preview
TeleAI-t1-preview使用了强化学习训练方法,通过引入探索、反思等思考范式,大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。 针对TeleAI-t1-preview训练的不同阶段,TeleAI…
推理
数据
竞赛
评分
训练方法
fjmyhfvclm
1天前
8
0