本期看点,带你一窥AI界的火爆头条!🚀 马斯克宣布Grok V7基础模型完成预训练,原生支持多模态能力
📊 智谱AI发布GLM-4.5技术报告,推理速度提升20%
🎥 阿里通义Wan2.2-I2V-Flash图生视频模型,12倍推理加速
🧠 清华&美团揭秘MoE LLM中的“超级专家”机制
🗣️ 昆仑万维SkyReels-A3模型实现照片“开口说话”
🤖 智元机器人远征A2-W创国内具身机器人商用记录
🔧 阿里达摩院开源机器人上下文协议,填补国内空白
英伟达「物理AI」技术亮相,宇树、银河通用率先应用


马斯克宣布Grok V7基础模型完成预训练,原生支持多模态能力

马斯克宣布Grok V7基础模型完成预训练
图为马斯克宣布Grok V7基础模型完成预训练 | 图源:财经头条

马斯克这回又玩大了!他的xAI团队刚把Grok V7基础模型预训练搞定,这玩意儿天生就能处理视频和音频,不用费劲转换格式,活像个多才多艺的AI杂技演员。效率嗖嗖提升,还能识别情绪和深层语义——这下聊天时它更懂你的小心思了,是不是感觉离科幻电影又近了一步?

更妙的是,Grok 4模型免费开放了,马斯克这是要搞普惠大招啊。分析师们直呼:AI圈的竞争这下更热闹了,OpenAI可得打起精神啦!


智谱AI发布GLM-4.5技术报告,推理速度提升20%

GLM-4.5技术报告中的性能对比图
图为GLM-4.5与其他大语言模型的性能对比 | 图源:Nature

智谱AI这回放大招了,GLM-4.5的技术报告一公开,推理速度直接蹦跶了20%,千亿参数的大块头瞬间变身轻量级选手!秘诀在哪?全靠异步强化学习管道设计,资源分配优化得那叫一个溜。代码生成和逻辑推理任务上,它都快追上OpenAI的GPT-OSS-120B了,智谱AI还偷偷透露:未来要让它在多模态领域也秀一把肌肉哦!


阿里通义Wan2.2-I2V-Flash图生视频模型,12倍推理加速

阿里通义Wan2.2-I2V-Flash 图生视频模型
图为阿里通义Wan2.2-I2V-Flash 图生视频模型演示场景 | 图源:ZNDS

阿里通义的新玩具Wan2.2-I2V-Flash简直开挂了——推理加速12倍,4K分辨率实时渲染不在话下!想象一下,电影特效师们再也不用熬夜了,广告设计师也能秒出大片。指令遵循能力飙升300%,阿里通义还放话:等着吧,更多定制化玩法马上来!


清华&美团揭秘MoE LLM中的“超级专家”机制

MoE LLM中的超级专家机制
图为MoE LLM中的超级专家机制示意图 | 图源:Sina

清华和美团联手挖到宝了!他们首次揭秘混合专家模型里的“超级专家”,这货能让稀疏模型稳定性和推理效率各提升30%和15%,活像个AI界的隐形守护者。动态权重分配一上阵,模型性能立马起飞。美团已经摩拳擦掌,准备把这项黑科技塞进实时翻译和智能客服里,你猜用户会不会乐开花?


昆仑万维SkyReels-A3模型实现照片“开口说话”

昆仑万维SkyReels-A3模型演示
图为SkyReels-A3模型演示效果 | 图源:昆仑万维

昆仑万维的SkyReels-A3模型太魔幻了——照片都能根据语音自动对口型,92.3%的准确率,简直像给老照片施了魔法!40亿参数的DiT架构撑腰,影视制作、虚拟主播和教育领域全包了。好莱坞制片公司都眼馋了,说不定下回你看的电影就是它做的特效呢!


智元机器人远征A2-W创国内具身机器人商用记录

智元机器人远征A2-W
图为智元机器人远征A2-W在工业场景中的应用 | 图源:CLS

智元机器人的远征A2-W这回真出息了——富临精工砸下数千万元订单,近百台机器人已在料箱拆垛场景上岗,99.2%的任务完成率,国产具身机器人首次大规模商用!多模态感知架构加百万级工业数据训练,效率蹭蹭涨,成本哗哗降,工厂老板们怕是要笑醒啦!


阿里达摩院开源机器人上下文协议,填补国内空白

阿里达摩院开源具身智能“三大件”
图为阿里达摩院开源具身智能“三大件”技术栈 | 图源:新浪科技

阿里达摩院放大招开源了机器人上下文协议(RCP),配上具身智能“三大件”技术栈,国内机器人中间件空白终于填上了!0.1mm精度的6DoF机械臂控制,稳如老狗。开源生态一建,国产机器人从“单点突破”迈向“全栈自主”,这波操作你打几分?


英伟达「物理AI」技术亮相,宇树、银河通用率先应用

英伟达「物理AI」技术展示
图为英伟达「物理AI」技术展示现场 | 图源:TechCrunch

英伟达的「物理AI」技术闪亮登场——刚体动力学模拟提速8倍,延迟压到5毫秒级,宇树和银河通用已经抢先用上了!机器狗运动稳如泰山,工业机器人效率飞起。这技术妥妥是AI的下一个风口,你准备好上车了吗?


这里是程序员Left,一名爱折腾的后端工程师,专盯AI前沿技术和产业动态。全网同名,持续为你送上硬核行业洞察!

本期讨论:
多模态模型会不会彻底改写人机交互的剧本?快在评论区聊聊你的脑洞吧!

Categories:

Tags:

还没发表评论,快来发表第一个评论吧~

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注