阶跃星辰 Step-2 语言模型上新:推出“高性价比版”及“文学大师版”

fjmyhfvclm2025-01-28  7

1 月 20 日,阶跃星辰上线了 Step-2 系列语言模型的两款新品 —— 参数量小、性价比更高的 Step-2 mini,以及专门针对内容创作领域推出的模型 Step 文学大师版。

据了解,这两款模型都脱胎于阶跃星辰在语言领域的核心基座模型 —— 万亿参数模型 Step-2,但在应用场景上更加垂直,并降低了开发者的使用成本。

相比 Step-2 mini,Step-2 mini 拥有更快的生成速度和极高的性价比,以 3% 左右的参数量保有了 Step-2 80% 以上的模型性能。在输入 4000 tokens 的情况下,Step-2 mini 的平均首字时延仅 0.17 秒。定价层面,输入 1 元 / 百万 token;输出 2 元 / 百万 token。目前,Step-2 mini 的 API 接口已经可以在阶跃星辰开放平台调用。

Step-2 mini 采用了阶跃星辰自主研发的新型注意力机制架构 ——MFA(Multi-matrix Factorization Attention,多矩阵分解注意力)及其变体 MFA-Key-Reuse,相比于常用的 MHA(Multi-Head Attention,多头注意力)架构,节省了近 94% 的 KV 缓存开销,拥有更快的推理速度并大幅降低了推理成本。

而 Step-2 文学大师版,据官方介绍,是一款专为文字内容创作研发的模型,沿袭了 Step-2 广袤的知识储备、对文字强大的细节把控能力,特色在于具有更加强大的内容创作能力。Step-2 文学大师版力求解决市面上语言模型过度对齐导致的内容“假大空”,缺乏新意和真情实感的问题。

公开资料显示,Step-2 曾多次在 LiveBench 等国际权威榜单上位列国产大模型第一。包括林间疗愈室、歌词爆改机、陌生人闹钟在内,越来越多的开发者,通过 Step-2 系列打造剧情创作、角色扮演、文案撰写等创作相关的 AI 应用能力。

转载请注明原文地址:https://www.gamev918.cn/tech/1391986.html