不惧算力封锁,全国产算力训练的讯飞星火 X1 来了

fjmyhfvclm2025-01-28  5

1 月 15 日,科大讯飞对外发布深度推理模型讯飞星火 X1。这是我国首个基于全国产算力平台训练的具备深度思考和推理能力的大模型,用更少的算力实现了业界一流效果,多项指标国内第一,中文数学能力国内第一,并已率先应用于教育、医疗等刚需场景。

微信图片_20250117123053.png

深度推理模型是当下大模型最新发展方向之一。和过去人们熟知的大语言模型相比,深度推理模型着重强化了模型在逻辑推理、因果推断以及结构化知识应用的能力,尤其在数学问题、代码生成以及科学推理等方面更具优势。

简单来说,深度推理模型更切近人类的思考过程,在生成回答时更强调逻辑和推理,能够给出明确的思考路径,大大减少过去大语言模型“已读乱回”的现象,更能应用于教育、医疗乃至科研等刚需场景。

此前,市面上已经涌现出不少推理模型,但一直没有出现基于国产算力平台训练的模型。实际上,这也正是我国人工智能产业面临的核心问题之一,我国人工智能发展在应用技术上更为成熟,算法并不落后,但在算力、芯片上等底层工具链上尚存在不足。

实现人工智能技术自主可控是产业生态健康发展的基石。此前,已有不少产业端人士积极呼吁国产算力底座的重要性,政策端也不断引导鼓励。2023 年,科大讯飞与华为携手自研算力底座,对外联合发布了国内首个全国产算力平台“飞星一号”,可常态化支持万亿参数的大模型训练,实现算力层面真正的自主可控。

“中国大模型只有在国产技术底座上发展,才能有自主可控的大未来。”科大讯飞董事长刘庆峰说。自科大讯飞立项大模型以来,就一直坚定走国产化自主技术路线。讯飞星火至今仍然是国内唯一基于全国产算力的大模型,堪称大模型竞赛中的“国家队”代表。

即便有了讯飞星火的成功经验,在全国产上训练推理模型仍然面临诸多挑战。这是一条几乎没有可参照范例、也从未有厂商走通的路径。推理模型的训练方法也和大语言模型有着显著不同,比如架构上更注重逻辑和可解释性,而大语言模型则基于 Transformer,更关注上下文建模和大规模参数优化。

科大讯飞携手华为,攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出完全基于全国产算力平台的深度推理模型讯飞星火 X1。

微信图片_20250117123100.png

值得一提的是,讯飞星火 X1 近期还参加了小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500 等多项考试,交出了一份非常亮眼的“考试成绩单”:用更少的算力,实现了业界一流的效果,多项指标国内第一。

微信图片_20250117123233.png

更难能可贵的是,这些升级都建立在对行业的深度理解与应用上。在业内的推理模型们仍苦于技术比拼时,讯飞星火 X1 已经率先在教育、医疗等诸多场景实现落地应用。

比如搭载了讯飞星火 X1 数学高中数学智能教师助手,已被一线教研员和教师用来解答高中数学创新题和考试题,大获好评。在医疗场景下,X1 的相关技术和策略也取得了初步验证成效,可使得专科辅助诊断和复杂病历内涵质控的准确率均达 90%。

同样基于全国产算力平台的讯飞星火 4.0 Turbo 也再度升级,七大核心能力全面提升,全面对标 OpenAI 最新版的 GPT-4o。这次讯飞星火的底座升级,同样来自于行业的真实反馈和痛点需求,着重升级的图文、长文本以及混域知识搜索技术都可显著提升大模型在日常使用中的效率,让讯飞星火成为更懂行业的大模型。

微信图片_20250117123311.png

这离不开此前讯飞星火在各行各业的广泛应用。当前,讯飞星火已经成为央国企大模型的第一选择 2024 年,无论是大模型招投标的全年总盘还是在央国企领域,科大讯飞的中标数量(91 个中标项目)和中标金额(84780.8 万元)均居第一,成为 2024 年度大模型中标项目的“标王”。

微信图片_20250117123315.jpg

中国人工智能产业发展起步快、应用广,已经成为全球人工智能竞赛中不可忽视的重要力量。但国内产业多年来在芯片、算力上的不足,仍然需要一段时间的追赶和攻坚。讯飞星火 X1 成功基于全国产算力平台训练,为我国实现人工智能技术自主可控提供了不少宝贵经验和教训积累。

去年 10 月 24 日,科大讯飞与华为、合肥大数据资产运营有限公司联合打造的国产超大规模智算平台“飞星二号”已正式启动,将实现新模型新算法的持续适配和智算集群规模的再次跃迁。

转载请注明原文地址:https://www.gamev918.cn/tech/1376534.html