作者 left

发布于 11 9 月, 2025

共计 0 个讨论

嘿，朋友们！搜罗了全网最新消息，我给大家带来这篇超有料的AI新闻深度总结：

AI基建狂飙：OpenAI豪掷3000亿，Rubin GPU颠覆格局，端侧智能体崛起！

本期看点：
🚀 OpenAI和Oracle联手，砸下3000亿美金搞云计算，史上最大单！
💻 英伟达新芯片Rubin CPX，专治百万token长文，性能炸裂！
⚡ 阿里通义千问玩出新花样，推理速度飙升10倍！
🎨 腾讯开源2K文生图模型，画质超清，速度不减！
📱 上海交大端侧智能体，实战表现碾压GPT-5！

云计算史上最壕单：OpenAI锁定3000亿美元算力基建

OpenAI和Oracle刚刚官宣了一笔惊天动地的合作——价值3000亿美元的云计算大单！这绝对是云计算史上最壕的交易了。据《华尔街日报》爆料，这笔deal长达五年，从2027年起，OpenAI就会疯狂采购算力资源，为下一代AI大模型备足弹药。（来源：华尔街日报）

图为Oracle数据中心外景 | 图片来源：Getty Images

这次合作可不是小事儿，它标志着OpenAI在云供应商策略上的大转弯。今年初，OpenAI就开始减少对Microsoft Azure的独家依赖，转而拥抱多元云布局。更劲爆的是，这次合作还直接插足了价值500亿美元的\"星际之门\"数据中心项目，可见AI算力需求有多火爆！

Oracle预计自家云收入会从2026财年的180亿美元猛增到2030财年的1440亿美元，年均增长率高达68%。这增长势头，简直像坐火箭，反映出AI行业对计算资源的饥渴，也把整个云计算市场推向了新高度。

英伟达Rubin CPX：为海量上下文而生的GPU怪兽

英伟达在AI基础设施峰会上亮出了Vera Rubin微架构和Rubin CPX GPU变体，这款芯片专为处理超长上下文窗口AI任务优化，计划2026年底上市。它支持超过100万token的上下文窗口，采用\"分离式推理\"方法，在处理视频生成、软件开发等长任务时表现超群。

英伟达Rubin CPX芯片
图为英伟达Rubin CPX GPU架构芯片 | 图片来源：中央社

英伟达打算提供两种形式的Rubin CPX：针对新安装，Vera Rubin NVL144 CPX会把CPX芯片加到计算托盘，性能比明年的Vera Rubin提升三倍！这芯片的发布简直是AI计算的新飞跃，硬件级优化让处理复杂长序列任务变得小菜一碟。Rubin平台用台积电制造的六颗芯片，提供50 PFLOPS的FP4性能，目标直指超越AMD的MI450等对手。

阿里巴巴通义千问：推理速度飙升10倍的黑科技

阿里巴巴通义千问团队推出了Qwen3-Next-80B-A3B-Instruct模型，玩了个超聪明的参数激活策略——总参数量80亿，但每个推理只激活3亿参数，推理速度直接提升10倍！这技术太牛了，在保持强大能力的同时，大幅省了计算资源，为资源有限的环境铺平了道路。

这种选择性参数激活代表了大模型效率优化的新方向，通过动态路由机制，只在需要时才激活相关参数，既保能力又提效率，简直是AI界的节能冠军！

腾讯混元图像2.1：开源原生2K文生图模型

腾讯混元团队开源了HunyuanImage 2.1文本到图像生成模型，支持原生2K（2048×2048）分辨率输出，通过多专家模型架构，文本-图像对齐能力大幅提升。

HunyuanImage 2.1架构图
图为HunyuanImage 2.1多专家模型架构 | 图片来源：SD114

这模型17B参数的架构，在生成高质量图像的同时，速度跟1K分辨率差不多，平衡得恰到好处。开源策略肯定会推动文生图技术的普及，让更多人玩转AI绘画。

多专家模型架构通过并行处理视觉特征，实现了更精确的文本-图像对齐，特别在复杂提示和多主体控制上表现亮眼，为高分辨率生成设立了新标杆。

上海交大MobiAgent：端侧智能体工具链的逆袭

上海交通大学IPADS实验室推出了MobiAgent移动端智能体全栈工具链，支持从数据收集到模型部署的完整流程。最炸的是，它在真实场景中的表现居然超越了GPT-5等顶级闭源模型！

MobiAgent性能对比
图为MobiFlow基准测试对比结果 | 图片来源：51CTO

MobiAgent在MobiFlow基准测试中平均得分100分，全面碾压MobiMind、UI-TARS和Gemini-2.5-pro等对手。这一突破显示，精心优化的端侧智能体在特定场景下能吊打云端大模型。

该工具链针对移动端深度优化，包括内存效率、计算调度和功耗控制，提供了从数据到部署的一站式解决方案。

蚂蚁集团与清华团队的开源盛宴

蚂蚁集团百灵团队开源了Ling-mini-2.0模型，采用MoE架构，总参16B但每个Token只激活1.4B参数，在硅基流动平台上线后，生成速度飞快，性能超前。

清华深研院与国际数字经济研究院团队开源了GUAVA技术，只需单张照片，0.1秒内就能生成高质量3D高斯化身，实时驱动流畅度超50帧每秒，彻底颠覆传统数字人制作。这项技术把3D数字人生成的门槛从专业级拉到平民级，为元宇宙和虚拟交互注入强心剂。

这一系列突破告诉我们，AI基建正在狂飙突进：云算力规模爆炸、硬件专精优化、端侧智能体逆袭。从3000亿投资到端侧模型超车，AI正从集中走向分布，从通用变专用。

全球云支出2025年预计达7234亿美元，全是AI对GPU的饥渴驱动的。科技巨头们都在拼命布局，从芯片到云服务，整个产业链天翻地覆。

那么问题来了：端侧智能体开始吊打云端大模型，未来AI应用会咋重构？边缘计算会重新定义AI服务吗？来聊聊你的看法！

作者：程序员Left（全网同名）
职位：后端工程师
创作方向：AI前沿科技内容
关注我，带你解锁更多硬核技术内幕！

Categories:

AI科技日报

Tags:

No Tag

OpenAI豪掷3000亿！ | 英伟达Rubin GPU发布 | 端侧智能体超GPT-5

AI基建狂飙：OpenAI豪掷3000亿，Rubin GPU颠覆格局，端侧智能体崛起！

云计算史上最壕单：OpenAI锁定3000亿美元算力基建

英伟达Rubin CPX：为海量上下文而生的GPU怪兽

阿里巴巴通义千问：推理速度飙升10倍的黑科技

腾讯混元图像2.1：开源原生2K文生图模型

上海交大MobiAgent：端侧智能体工具链的逆袭

蚂蚁集团与清华团队的开源盛宴

还没发表评论，快来发表第一个评论吧~

发表回复取消回复

近期文章

OpenAI豪掷3000亿！ | 英伟达Rubin GPU发布 | 端侧智能体超GPT-5

AI基建狂飙：OpenAI豪掷3000亿，Rubin GPU颠覆格局，端侧智能体崛起！

云计算史上最壕单：OpenAI锁定3000亿美元算力基建

英伟达Rubin CPX：为海量上下文而生的GPU怪兽

阿里巴巴通义千问：推理速度飙升10倍的黑科技

腾讯混元图像2.1：开源原生2K文生图模型

上海交大MobiAgent：端侧智能体工具链的逆袭

蚂蚁集团与清华团队的开源盛宴

还没发表评论，快来发表第一个评论吧~

发表回复 取消回复

近期文章

发表回复取消回复