腾讯玄武实验室推出低成本DeepSeek...

2025-3-18 15:11| 来自: 优何整理| 发布者: 门户小编

腾讯玄武实验室推出低成本DeepSeek-R1-671B-Q8大模型部署方案，仅需4万元即可实现，具体优势如下硬件成本低采用4块消费级RTX 4090显卡（单卡约1.2万元），总显存达192GB，相比专业AI卡节省90%成本。推理速度快支持每秒处理20个token，16K上下文对话响应流畅，满足实时交互需求。技术创新点• 8bit量化技术：在精度损失<1%前提下，将显存需求降低至1/3• 自研DeepSpeed-Inference框架：优化计算图与算子融合，提升推理效率部署简易性提供完整Docker部署方案，支持Ubuntu/CentOS系统，30分钟完成环境搭建。适用场景：中小型企业可搭建本地智能客服、数据分析系统；研究者可进行AI模型微调实验。项目资源：模型下载：网页链接在线体验：网页链接