Qwen3-Next-80B降本90%！ | LLaDA-MoE扩散模型开源 | HuMo多模态框架发布

作者 left

发布于 13 9 月, 2025

共计 0 个讨论

AI开源大爆发：中国科技巨头集体亮剑，MoE架构成新宠儿！

这期内容可太炸了！中国科技圈最近简直是百花齐放，各种开源模型扎堆发布，MoE架构更是火到没朋友。一起来看看都有哪些狠活吧：

🚀 阿里直接甩出800亿参数的MoE模型，推理成本暴跌90%，这省钱能力绝了！
🎨 蚂蚁和人大联手搞出首个原生MoE扩散语言模型，扩散模型也要起飞了？
🎬 字节和清华开源HuMo多模态框架，视频生成玩出新高度。
🎵 MiniMax的音乐生成模型能搞出4分钟长的曲子，控制力超强。
📊 腾讯优图开源图检索增强技术，知识检索变得更聪明。
📱 谷歌端侧AI应用正式上线，离线运行保护隐私，实用主义来了！

阿里巴巴Qwen3-Next-80B-A3B：MoE架构的降本增效典范

阿里这次可是放了个大招！新开源的Qwen3-Next-80B-A3B模型，简直是把大模型的成本游戏规则给改了。这家伙总参数量高达800亿，但推理时只激活30亿参数，训练成本比前代Qwen3-32B直接降了90%，推理效率还提升了10倍——这性价比，谁看了不喊一声“牛”！

Qwen3-Next架构图
图为Qwen3-Next-80B-A3B架构图 | 图片来源：新浪科技

这种设计妙在哪？MoE架构就像一支精英团队，每个专家模块专攻一摊事，分工协作效率超高。混合注意力机制则保证了模型即使稀疏激活，表达能力也不打折。这下中小企业和开发者也能轻松用上顶级AI了，门槛降得不是一星半点。阿里这波操作，真是把“术业有专攻”的智慧玩明白了。

蚂蚁集团与人民大学LLaDA-MoE：扩散模型的架构革新

扩散模型也迎来MoE时代了！蚂蚁集团和人民大学联手推出的LLaDA-MoE，可是从零开始在约20T数据上训出来的原生MoE扩散语言模型。效果上不仅干翻了稠密扩散模型LLaDA1.0/1.5和Dream-7B，还能和自回归模型掰手腕，推理速度还快了好几倍——这波革新，扩散模型粉丝们狂喜！

图为LLaDA-MoE发布现场 | 图片来源：驱动之家

马上要完全开源的LLaDA-MoE，给dLLM技术注入了新活力。它的原生MoE设计让扩散模型在处理复杂语言任务时资源分配更高效，文本到图像、文本到视频这些跨模态生成任务也有了新思路。生成质量不减，速度还飚上去了，这谁不爱啊？

字节跳动与清华大学HuMo：多模态统一框架的实践

字节和清华这次合作的HuMo框架，真是多模态AI的一大步！它能处理文本、图像和音频输入，专注人体视频生成，通过协同生成技术产出高质量视频——虚拟人、数字孪生、影视特效等领域的小伙伴们有福了！

HuMo多模态框架
图为HuMo研究论文 | 图片来源：开源中国

HuMo推动HCVG技术向前跑，避免了传统方案里不同模态得单独建模的麻烦，实现了真正的端到端生成。从工程角度看，这统一架构减少了系统复杂度和维护成本，实用又高效。以后做视频内容，可能就像搭积木一样简单了。

音乐生成与检索技术的并行突破

MiniMax的Music1.5音乐生成模型太给力了！生成音乐时长拉到4分钟，强控制力、人声自然饱满、编曲层次丰富、歌曲结构清晰——四大突破齐活。你可以自定义歌曲风格、情绪和场景，音乐创作和娱乐产业这下可玩性爆棚。

Music1.5宣传图
图为Music1.5模型宣传图 | 图片来源：MiniMax

腾讯优图开源的Youtu-GraphRAG图检索增强技术也很亮眼。基于图结构的检索方式，处理复杂关系查询和推理任务更拿手，让RAG系统能挖掘更深层的语义关联。开发者们，检索增强生成解决方案又升级了，赶紧试试！

端侧AI的实用化进程

谷歌的Google AI Edge Gallery应用正式上架，集成Gemma系列端侧模型，支持图像识别、音频对话和文字交互的全离线运行——隐私保护是核心亮点。这标志着AI技术从云端走向边缘设备，不再是概念，而是实实在在的工具。开发者和用户都能享受到即开即用的AI体验，实用主义时代真的来了！

这一连串突破说明啥？AI正在从拼参数规模的“军备竞赛”，转向讲究实际效率和成本的“实用主义”阶段。MoE架构、多模态统一框架、端侧部署这些技术，都在为AI的普及铺路。未来，AI可能会更像水电煤一样，随手可用还便宜。

朋友们，这期话题来了：在效率与性能的权衡中，你觉得MoE架构能成下一代AI模型的主流吗？实际应用中，你更看重推理速度还是生成质量？欢迎在评论区唠唠！

作者：程序员Left（全网同名）
职位：后端工程师
创作方向：AI前沿科技内容
关注我，带你用工程师视角看懂AI技术变革！

Categories:

AI科技日报

Tags:

No Tag

Qwen3-Next-80B降本90%！ | LLaDA-MoE扩散模型开源 | HuMo多模态框架发布

AI开源大爆发：中国科技巨头集体亮剑，MoE架构成新宠儿！

阿里巴巴Qwen3-Next-80B-A3B：MoE架构的降本增效典范

蚂蚁集团与人民大学LLaDA-MoE：扩散模型的架构革新

字节跳动与清华大学HuMo：多模态统一框架的实践

音乐生成与检索技术的并行突破

端侧AI的实用化进程

还没发表评论，快来发表第一个评论吧~

发表回复取消回复

近期文章

Qwen3-Next-80B降本90%！ | LLaDA-MoE扩散模型开源 | HuMo多模态框架发布

AI开源大爆发：中国科技巨头集体亮剑，MoE架构成新宠儿！

阿里巴巴Qwen3-Next-80B-A3B：MoE架构的降本增效典范

蚂蚁集团与人民大学LLaDA-MoE：扩散模型的架构革新

字节跳动与清华大学HuMo：多模态统一框架的实践

音乐生成与检索技术的并行突破

端侧AI的实用化进程

还没发表评论，快来发表第一个评论吧~

发表回复 取消回复

近期文章

发表回复取消回复