2026年4月24日,DeepSeekV4预览版正式发布,同步开源权重与技术报告并公布API价格。该系列含Pro、Flash两款MoE模型,分别为1.6T总参/49B激活、284B总参/13B激活,均支持100万token上下文,最大输出384Ktoken。模型采用混合注意力、流形约束超连接、Muon优化器等创新,推理算力与缓存占用显著降低,实测吞吐量突出,且已启动昇腾CANN适配直播。
我院认为,此次发布是国产大模型从参数堆砌走向高效普惠的关键里程碑。双版本策略兼顾顶尖性能与低成本推理,百万上下文能力开源开放,大幅降低长文本处理门槛,推动大模型从实验室走向规模化应用,为全球开源AI生态注入中国技术动能。
对广东而言,该突破将强力支撑人工智能全域全时全行业应用行动方案落地。依托完备算力与制造场景,可加速大模型在制造、电子、医疗等领域适配,降低企业智能化成本,壮大核心产业规模。同时推动自主算力生态协同,助力广东打造全国领先、具全球竞争力的AI创新与应用中心。