DeepSeek大模型上新 关联下代中国芯

华夏经纬网 > 新闻 > 大陆新闻 > 社会综合      2025-08-23 11:21:04

华夏经纬网8月23日讯:据香港“中通社”报道:中国人工智能(AI)公司深度求索(DeepSeek)21日宣布,其最新大语言模型DeepSeek-V3.1正式发布。

据DeepSeek介绍,新升级版本变化体现在三方面:混合推理架构、更高的思考效率、更强的Agent(智能体)能力。通过“深度思考”按钮切换,DeepSeek-V3.1实现一个模型同时支持两种模式:面对简单问题时,能以“非思考模式”快速回答。处理复杂问题时,可切换到“思考模式”,给出更具深度和逻辑的解答。此外,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。DeepSeek官方公众号在其文章置顶留言里说,UE8M0 FP8是针对即将发布的下一代中国产芯片设计。

官方数据显示,与今年5月发布的旗舰推理模型DeepSeek R1升级版本“R1-0528”相比,DeepSeek-V3.1在思考模式下效率大幅提升,能在更短时间给出答案,token(大模型文本处理的最小单位)消耗量可减少20%至50%,各项任务平均表现与R1-0528持平。


责任编辑:邱梦颖
热门评论
互联网新闻信息服务许可证10120170072
京公网安备 11010502045281号
违法和不良信息举报电话:010-65669841
举报邮箱:xxjb@huaxia.com

网站简介 / 广告服务 / 联系我们

主办:华夏经纬信息科技有限公司   版权所有 华夏经纬网

Copyright 2001-2024 By www.huaxia.com