Grok V7多模态突破！ | GLM-4.5推理提速20% | 通义视频加速12倍

作者 left

发布于 12 8 月, 2025

共计 0 个讨论

本期看点，带你一窥AI界的火爆头条！🚀 马斯克宣布Grok V7基础模型完成预训练，原生支持多模态能力
📊 智谱AI发布GLM-4.5技术报告，推理速度提升20%
🎥 阿里通义Wan2.2-I2V-Flash图生视频模型，12倍推理加速
🧠 清华&美团揭秘MoE LLM中的“超级专家”机制
🗣️ 昆仑万维SkyReels-A3模型实现照片“开口说话”
🤖 智元机器人远征A2-W创国内具身机器人商用记录
🔧 阿里达摩院开源机器人上下文协议，填补国内空白
⚡ 英伟达「物理AI」技术亮相，宇树、银河通用率先应用

马斯克宣布Grok V7基础模型完成预训练，原生支持多模态能力

图为马斯克宣布Grok V7基础模型完成预训练 | 图源：财经头条

马斯克这回又玩大了！他的xAI团队刚把Grok V7基础模型预训练搞定，这玩意儿天生就能处理视频和音频，不用费劲转换格式，活像个多才多艺的AI杂技演员。效率嗖嗖提升，还能识别情绪和深层语义——这下聊天时它更懂你的小心思了，是不是感觉离科幻电影又近了一步？

更妙的是，Grok 4模型免费开放了，马斯克这是要搞普惠大招啊。分析师们直呼：AI圈的竞争这下更热闹了，OpenAI可得打起精神啦！

智谱AI发布GLM-4.5技术报告，推理速度提升20%

GLM-4.5技术报告中的性能对比图
图为GLM-4.5与其他大语言模型的性能对比 | 图源：Nature

智谱AI这回放大招了，GLM-4.5的技术报告一公开，推理速度直接蹦跶了20%，千亿参数的大块头瞬间变身轻量级选手！秘诀在哪？全靠异步强化学习管道设计，资源分配优化得那叫一个溜。代码生成和逻辑推理任务上，它都快追上OpenAI的GPT-OSS-120B了，智谱AI还偷偷透露：未来要让它在多模态领域也秀一把肌肉哦！

阿里通义Wan2.2-I2V-Flash图生视频模型，12倍推理加速

图为阿里通义Wan2.2-I2V-Flash 图生视频模型演示场景 | 图源：ZNDS

阿里通义的新玩具Wan2.2-I2V-Flash简直开挂了——推理加速12倍，4K分辨率实时渲染不在话下！想象一下，电影特效师们再也不用熬夜了，广告设计师也能秒出大片。指令遵循能力飙升300%，阿里通义还放话：等着吧，更多定制化玩法马上来！

清华&美团揭秘MoE LLM中的“超级专家”机制

图为MoE LLM中的超级专家机制示意图 | 图源：Sina

清华和美团联手挖到宝了！他们首次揭秘混合专家模型里的“超级专家”，这货能让稀疏模型稳定性和推理效率各提升30%和15%，活像个AI界的隐形守护者。动态权重分配一上阵，模型性能立马起飞。美团已经摩拳擦掌，准备把这项黑科技塞进实时翻译和智能客服里，你猜用户会不会乐开花？

昆仑万维SkyReels-A3模型实现照片“开口说话”

昆仑万维SkyReels-A3模型演示
图为SkyReels-A3模型演示效果 | 图源：昆仑万维

昆仑万维的SkyReels-A3模型太魔幻了——照片都能根据语音自动对口型，92.3%的准确率，简直像给老照片施了魔法！40亿参数的DiT架构撑腰，影视制作、虚拟主播和教育领域全包了。好莱坞制片公司都眼馋了，说不定下回你看的电影就是它做的特效呢！

智元机器人远征A2-W创国内具身机器人商用记录

图为智元机器人远征A2-W在工业场景中的应用 | 图源：CLS

智元机器人的远征A2-W这回真出息了——富临精工砸下数千万元订单，近百台机器人已在料箱拆垛场景上岗，99.2%的任务完成率，国产具身机器人首次大规模商用！多模态感知架构加百万级工业数据训练，效率蹭蹭涨，成本哗哗降，工厂老板们怕是要笑醒啦！

阿里达摩院开源机器人上下文协议，填补国内空白

图为阿里达摩院开源具身智能“三大件”技术栈 | 图源：新浪科技

阿里达摩院放大招开源了机器人上下文协议（RCP），配上具身智能“三大件”技术栈，国内机器人中间件空白终于填上了！0.1mm精度的6DoF机械臂控制，稳如老狗。开源生态一建，国产机器人从“单点突破”迈向“全栈自主”，这波操作你打几分？

英伟达「物理AI」技术亮相，宇树、银河通用率先应用

图为英伟达「物理AI」技术展示现场 | 图源：TechCrunch

英伟达的「物理AI」技术闪亮登场——刚体动力学模拟提速8倍，延迟压到5毫秒级，宇树和银河通用已经抢先用上了！机器狗运动稳如泰山，工业机器人效率飞起。这技术妥妥是AI的下一个风口，你准备好上车了吗？

这里是程序员Left，一名爱折腾的后端工程师，专盯AI前沿技术和产业动态。全网同名，持续为你送上硬核行业洞察！

本期讨论：
多模态模型会不会彻底改写人机交互的剧本？快在评论区聊聊你的脑洞吧！

Categories:

AI科技日报

Tags:

No Tag

Grok V7多模态突破！ | GLM-4.5推理提速20% | 通义视频加速12倍

马斯克宣布Grok V7基础模型完成预训练，原生支持多模态能力

智谱AI发布GLM-4.5技术报告，推理速度提升20%

阿里通义Wan2.2-I2V-Flash图生视频模型，12倍推理加速

清华&美团揭秘MoE LLM中的“超级专家”机制

昆仑万维SkyReels-A3模型实现照片“开口说话”

智元机器人远征A2-W创国内具身机器人商用记录

阿里达摩院开源机器人上下文协议，填补国内空白

英伟达「物理AI」技术亮相，宇树、银河通用率先应用

还没发表评论，快来发表第一个评论吧~

发表回复取消回复

近期文章

Grok V7多模态突破！ | GLM-4.5推理提速20% | 通义视频加速12倍

马斯克宣布Grok V7基础模型完成预训练，原生支持多模态能力

智谱AI发布GLM-4.5技术报告，推理速度提升20%

阿里通义Wan2.2-I2V-Flash图生视频模型，12倍推理加速

清华&美团揭秘MoE LLM中的“超级专家”机制

昆仑万维SkyReels-A3模型实现照片“开口说话”

智元机器人远征A2-W创国内具身机器人商用记录

阿里达摩院开源机器人上下文协议，填补国内空白

英伟达「物理AI」技术亮相，宇树、银河通用率先应用

还没发表评论，快来发表第一个评论吧~

发表回复 取消回复

近期文章

发表回复取消回复