首页
热点
百科
娱乐
科技
资讯
药品
美容
登录
标签
微软模型
微软开源 1.58bit 推理框架:千亿参数模型量化后单 CPU 可跑,速度每秒 5-7 个 token
就是今年爆火论文 The Era of 1-bit LLMs 的官方代码实现,开源不到一周 GitHub 已揽获 7.9k Star。
微软AI
微软推理
微软模型
fjmyhfvclm
3天前
5
0