新闻中心

字节跳动发布UltraMem稀疏模型 极大提高人工智能推理效率

2025-02-24 09:53:37

来源:

字节跳动发布UltraMem稀。疏模型 极大"提高人工智"能推理效率

近日,字节跳动的豆包大模型Foundation团队宣布了一项重要的创新成果——UltraMem稀疏模型架构。这一新架构在保证模型效果的前提下,成功解决了推理过程中的访存问题,为人工智能领域带来了全新的突破。

据了解,UltraMem架构巧妙地将计算与参数分离,不仅确保了卓越的性能,更针对推理过程中的访存瓶颈提供了革命性的解决方案。这项设计直指核心问题,并有效应对了混合专家(MoE)模型长期以来面临的高访存成本挑战,从而极大地推动了MoE模型广泛应用的可能性。

UltraMem架构显著提升了推理速度,在传统MoE架构上达到了2至6倍的提升幅度。更为重要的是,该架构还成功降低了推理成本,最高降幅可达83%。

实验数据显示出UltraMem架构的强大实力:在训练规模达到2000万value的条件下,UltraMem模型展现了业界顶尖的推理速度和性能表现。这一突破为构建规模达到数十亿value或expert级别的模型奠定了基础,预示着人工智能领域即将迎来更加高效、经济的发展模式。

国企拟录用3名本科生名单被删首例低功耗二维环栅晶体管问世泽连斯基:不签10代人付代价的协议50岁丘索维金娜摘世界杯跳马铜牌台名嘴质问:台军能否抵挡解放军小伙30多万买机器人对外租8000一天恒生科技指数剔除东方甄选肖战或将主演什锦微信接入DeepSeek的两大隐秘商机雷军反问YU7如何

(内容来源:看看新闻)

作者: 编辑:胡慧敏

  • 越牛新闻客户端

  • 越牛新闻微信

  • 绍兴发布微信

  • 越牛新闻微博

  • 绍兴发布微博

爆料

新闻热线

0575-88880000

投稿信箱

zjsxnet@163.com