< 文章详情

腾讯混元Hy3 Preview发布:295B MoE模型开源,AI Agent能力大跃升

2026/04/28
腾讯混元Hy3 Preview MoE架构神经网络

2026年4月23日,腾讯混元团队正式发布并开源Hy3 Preview语言模型,这是自今年2月混元团队在首席AI科学家姚顺雨带领下全面重建预训练和强化学习基础设施以来的首个里程碑成果。作为一款295B参数的混合专家(MoE)模型,Hy3 Preview在复杂推理、AI Agent、超长上下文处理等维度实现了质的飞跃。

  📊 核心参数一览
  总参数量  295B(2950亿)MoE稀疏激活
  激活参数量  21B(210亿)每次推理仅激活~7%
  最大上下文  256K tokens 超长文档处理
  推理效率  +40% 模型与推理框架深度协同
  开源状态  已开源 GitHub / Hugging Face / ModelScope

  一、MoE架构解析:为什么只激活7%就够了?

Hy3 Preview采用了快慢思考融合的混合专家(MoE)架构设计。与传统稠密模型不同,MoE通过门控路由网络(Router)动态选择激活哪些"专家"子网络来处理每个Token。


MoE混合专家架构示意图 - 295B参数稀疏激活

💡 混元团队的三大设计原则
1
能力体系化
拒绝偏科,多维度协同
2
评测真实性
反刷榜,真实考试验证
3
极致性价比
推理效率提升40%

  二、三大核心技术能力

  1. 复杂推理:真实考试验证
  • 清华大学求真书院数学博士资格考(2026春季) — 取得国内模型最高分
  • 全国中学生生物学联赛(CHSBO 2025) — 领跑国内模型
  • 强调泛化推理能力,而非针对特定榜单的"特化训练"

  2. AI Agent与代码:生产级验证

Hy3 Preview已验证可稳定支撑长达495步的复杂Agent工作流,并兼容OpenClaw、OpenCode、KiloCode等主流Agent框架。在SWE-Bench Verified、Terminal-Bench 2.0等基准测试中均表现强劲。


  3. 超长上下文:256K极限测试

混元团队自建了CL-bench与CL-bench-Life评测集,在256K上下文下仍保持极高指令服从度,适用于超长合同审查、大规模代码库分析等企业场景。


  三、企业应用价值:腾讯内部真实数据

Hy3 Preview已在腾讯多条核心产品线完成灰度验证:


Hy3 Preview企业应用场景数据

54%
首Token延迟降低
CodeBuddy & WorkBuddy
+20%
生成成功率提升
腾讯文档 AI PPT
99.99%
服务成功率
开发工具生产环境

  四、API定价与竞品对比

Hy3 Preview与竞品API定价对比

TokenHub API 定价
输入1.2 元 / 百万Tokens
缓存命中输入0.4 元 / 百万Tokens
输出4.0 元 / 百万Tokens
个人套餐28元/月

  五、开发者如何快速接入?

开源部署

GitHub / Hugging Face / ModelScope 下载权重,使用 vLLM 或 SGLang 推理框架私有化部署。适合数据安全要求高的企业。
云端调用

通过腾讯云TokenHub平台或OpenRouter(限时两周免费API)调用,无需自行部署算力。
企业级定制

作为腾讯云官方代理商,概泽科技提供从选型到部署的全流程AI融合服务。

  六、行业影响与展望

重新定义"好用"的标准。混元团队提出的三大原则——能力体系化、评测真实性、极致性价比——正在引导行业从"参数竞赛"转向"实用主义"。

开源加速行业创新。295B参数的MoE模型直接开源,极大降低了国内AI开发者进入大模型领域的技术门槛。

企业AI落地进入快车道。Hy3 Preview在多条腾讯产品线的灰度验证,为企业的AI应用选型提供了真实可靠的参考数据。


📖 总结

腾讯混元Hy3 Preview以295B MoE架构、256K超长上下文、40%推理效率提升的核心指标,展示了国产大模型在"实用主义"路线上的突破。企业用户可通过开源部署或腾讯云TokenHub快速接入。对于正在规划AI融合平台的企业来说,Hy3 Preview无疑是2026年Q2最值得关注的选项之一。