近日,超讯通信联手开源中国、沐曦、米塔碳等合作伙伴完成DeepSeek-R1 70B部署,并支持1.5B、7B、14B、32B蒸馏模型的部署,兼容openai api格式输出。
上证报中国证券网讯(记者 黎灵希)近日,超讯通信联手开源中国、沐曦、米塔碳等合作伙伴完成DeepSeek-R1 70B部署,并支持1.5B、7B、14B、32B蒸馏模型的部署,兼容openai api格式输出。
据悉,与全尺寸DeepSeek模型相比,较小尺寸的DeepSeek蒸馏版本模型更适合企业内部实施部署,可以极大地降低落地成本。
超讯通信表示,DeepSeek-R1模型运行期间,沐曦GPU卡展现出强大的兼容性和适配能力,不仅实现了模型的快速部署,还确保了模型在运行过程中的稳定性和高效性,让DeepSeek-R1模型的性能得到了充分发挥。
资料显示,超讯通信从2019年起布局智算业务,现已构建包括“算力+数据+AI”在内的三大智算业务布局,算力业务范畴涵盖算力基建、算力设备供应、算力租赁运营等。
作为国产GPU知名设备厂商“沐曦”的特定行业总代理商,2024年超讯通信成功将“沐曦GPU服务器”部署于广州白云区算力中心,并正式面向客户开放测试使用。近期还与沐曦等三家股东合资设立讯曦智能,积极布局算力业务的产业链上游。
展望未来,超讯通信表示,公司将继续优化硬件支持,特别是针对最新的DeepSeek R1模型进行深度优化,致力于提供更加稳定高效的解决方案。此外,公司计划推出模型微调服务,以满足不同客户的个性化需求,进一步推动AI应用的发展。