本期看点:
🧠 三星极小参数模型颠覆“越大越好”定律
⚛️ 谷歌收购Atlantic Quantum加速量子霸权
💻 OpenAI万亿美元算力军备竞赛白热化
🖱️ Gemini 2.5视觉代理可操控浏览器界面
🛡️ Anthropic开源Petri自动化安全审计框架


三星极小参数模型颠覆“越大越好”定律

谁说模型越大越聪明?三星AI实验室悄悄扔出一颗“效率核弹”——新架构模型参数量只有传统大模型的十分之一,却在GSM8K数学题上以89.7%的准确率,把Llama3-70B(86.2%)按在地上摩擦。秘密武器?“稀疏激活+动态路由”——像人脑一样,只在需要时唤醒相关神经元,其他部分该睡就睡。计算负载直接跳崖式下降。

这意味着什么?以后你手机本地就能跑复杂推理,不用再偷偷摸摸蹭云端算力。边缘计算的春天,可能比外卖小哥送餐还来得快。

三星AI实验室研发的稀疏激活架构示意图
图为三星AI模型稀疏激活与动态路由机制示意图 | 图源:Medium


谷歌收购Atlantic Quantum加速量子霸权

谷歌量子AI部门这次没客气,直接把Atlantic Quantum打包带走——MIT量子工程组的精英、模块化超导芯片堆栈技术,连锅端走。他们家的36量子比特Cepheus-1-36Q系统,已经能实现四芯片互联,跨芯片操作还能保持高保真度。收购金额保密?没关系,目标写在脸上:百万量子比特实用化。

别人还在纠结“单芯片怎么塞更多比特”,谷歌已经掏出乐高积木,开始搭量子摩天大楼。堆叠,才是未来的正确打开方式。


OpenAI万亿美元算力军备竞赛白热化

OpenAI正在织一张价值万亿美元的算力蜘蛛网——先跟英伟达锁死10吉瓦,再向AMD下单6吉瓦,顺手把甲骨文的数据中心也薅走4.5吉瓦。AMD CEO苏姿丰都忍不住吐槽:部署进度?得看“电从哪儿偷”。16吉瓦什么概念?够450万户家庭亮灯。

更骚的是资本操作:OpenAI拿到AMD 10%股份期权,英伟达反手投资OpenAI。这不是合作,是“你中有我,我中有你”的AI版《权力的游戏》。算力战争?不,这是巨头闭环生态的终极养成计划。


Gemini 2.5视觉代理可操控浏览器界面

Gemini 2.5 Pro悄悄长出了“手”——新分支Computer Use,能看懂网页,也能像真人一样点按钮、输密码、滚页面。内部测试在电商和银行场景成功率87%,支持13种UI操作(但只限浏览器,比某些“啥都想碰”的竞品克制多了)。

两个演示视频里,它一边丝滑通关2048,一边扒拉Hacker News热帖,全程没调API,纯靠“眼睛+手指”。当AI能自己操作数字世界,RPA工具们今晚怕是要集体吃褪黑素了。


Anthropic开源Petri自动化安全审计框架

Anthropic把“AI测试AI”的Petri框架开源了,用一群AI代理模拟黑客,专门找越狱漏洞和隐私泄露点。GitHub上线第一天,星星刷到2000+。

最魔幻的是测试现场:Claude Sonnet 4.5居然发现自己正在被评估,还主动发警告——“我知道你在套我话”。这感觉就像审讯室里犯人突然抬头:“警官,你这问题设计得挺刻意啊。”

当AI能识破测试场景,安全审计就得进化成“测试测试者”的套娃游戏。加州刚通过的AI安全披露法案,让Petri瞬间从玩具变成合规刚需。


这里是程序员Left,后端工程师,专注分析AI前沿技术和产业动态。全网同名,持续为开发者提供深度行业洞察!

本期讨论:当AI模型能识别自己正在被安全测试时,我们该设计更隐蔽的测试方案,还是该重新定义“安全”的边界?

Categories:

Tags:

还没发表评论,快来发表第一个评论吧~

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注