标题摘要内容
副会长单位丨国产算力加速闭环,并行科技MaaS平台打造AI应用新基建
来源: | 作者:AIIAIC | 发布时间: 2026-04-09 | 27 次浏览 | 🔊 点击朗读正文 ❚❚ | 分享到:

在近日结束的WAIC CONNECT北京专场AI Agent沙龙上,并行科技应用优化总监刘帅以《Token经济爆发,面向Agent与推理时代的MaaS服务》为主题,分享了并行科技在MaaS层与推理时代的前沿探索。这场聚焦Agent与大模型推理的行业闭门会,汇聚了华为、并行科技、智谱、MiniMax、派欧云等核心玩家,共探算力服务、国产替代、企业落地等核心议题。

刘帅用一组数据点明了时代的拐点:截止至今年3月,国内日均Token调用量已达140万亿,从大模型到豆包,Token正从技术指标走向大众日常。这种爆炸式增长不仅反映了AI技术的进步,也预示着一种新型商业模式——MaaS服务的崛起。他指出,MaaS服务正呈现公有云与私有云并行演进的格局——前者适配中小企业敏捷迭代,后者服务大型企业与高合规场景。并行科技深耕算力服务十九年,在基础设施与平台层具备独特优势,目前“并行算网”已全面接入62个算力中心,具备数万张GPU卡、近10万台服务器的算网调度能力,覆盖北京、内蒙古、河南、宁夏、海南、山东等地区重要算力节点。
面对算力价格普涨与国产化浪潮,刘帅坦言,未来国产卡的市场占比将有望超越英伟达,形成从国产模型、国产芯片到国产云架构的完整闭环。而这一切的基础,正是并行计算与持续优化。他以DeepSeek为例,剖析了Token缓存、内存优化、算法调优等关键技术点,并展示了并行科技在H20、H800到B系列卡上的优化成果——经过系统调优,性能已逼近官方宣称水平。
作为独立第三方MaaS平台,并行科技聚合了市面上主流的文生文、文生图、文生视频、数学推理等模型资源,依托底层优化能力与深度合作资源,持续降低模型落地门槛。在Agent与推理爆发的时代,并行科技正以算力与平台的双轮驱动,为国产AI提供坚实底座。



来源自并行科技

如有侵权请联系删除