本期看点:
🎓 网易有道给教育AI划了道线,定出清晰分级标准
🎬 LongVie搞定超长视频生成,画面不跳戏、风格能统一
🧮 快手数学推理模型真不赖,准确率飙到90%以上
🤖 OpenAI拉上一帮兄弟,要给编程助手立规矩
💊 AI研发新药有点猛,63%能精准命中靶点
网易有道这回在教育AI领域搞了件大事——不仅发布了「子曰」教育大模型系列新品,还头一回提出了教育AI应用的L1-L5五级标准。这套分级可不是随便定的,它从场景丰富度、能力支撑度到应用成熟度,每个维度都安排得明明白白,等于是给教育AI的发展画出了一张清晰地图。从最基础的智能问答,到能独立闭环完成教学任务,每一级该有什么能力、做到什么程度,都写得清清楚楚。这下好了,教育AI总算告别“野蛮生长”,开始走向规范化了。
网易有道教育大模型L1-L5分级标准框架 | 图片来源:中国日报网
视频生成这边也没闲着。上海人工智能实验室联手南京大学、复旦大学、南洋理工大学S-Lab和英伟达,一起推出了LongVie框架,终于系统性地解决了超长视频生成中的老大难问题——时间一长画面就跳戏、风格变来变去。这个突破可不小,意味着AI生成视频正从“秒级”迈进“分钟级”,以后影视、游戏、VR制作可就省事儿多了。
LongVie多模态引导超长视频生成示意图 | 图片来源:站长之家
快手也挺能打,基于Qwen3-8B-Base自研的Klear-Reasoner模型,在数学推理上表现惊人,多个权威测试中准确率都突破了90%。它用的那个GPPO优化算法确实有两下子,逻辑推理能力明显上了一个台阶——不管是AIME 2024、2025,还是LiveCodeBench V5,成绩都相当亮眼,尤其擅长处理烧脑的复杂推理题。
OpenAI这次没单干,拉上了Amp、Google Jules、Cursor、RooCode和Factory一共六家技术公司,联手推出了AGENTS.md标准,专门统一AI编程助手怎么“读懂”项目。有了这套公认规范,不同编程助手之间协作就更顺了,整个开发生态也会更健康。
生物医药圈最近也有好消息。宾夕法尼亚大学和杜克大学联手搞出了PepMLM大模型平台,光靠蛋白质序列就能生成靶向肽分子,命中率高达63%。这招简直颠覆传统——以前得靠复杂的结构解析,现在序列喂进去就行,新药研发效率和成功率眼看着就往上涨。
硬件方面,NVIDIA基于Blackwell架构专为中国市场打造的新一代AI芯片,性能要全面超越现在的H20。用了先进制程,明显就是冲着特定市场的算力需求去的。另一边,深度求索开源了DeepSeek V3.1-Base基础模型,不仅模型规模控制得不错,基础能力还进一步强化了,给开源社区又多了一个靠谱的选择。
还有俩进展值得一说:中科院、清华大学与阶跃星辰一起做的SE-Agent自进化编程框架,编程任务成功率干到了61.2%,靠自我迭代优化突破了传统AI编程的天花板;浙江大学跟蚂蚁集团合作的dLLM则搞定了“中间结果复用”,扩散过程中的状态反复利用,推理效率肉眼可见地提上来了。
作者:程序员Left(全网同名)
职位:后端工程师
创作方向:AI前沿科技内容
关注我,带你持续紧盯AI技术的最新突破与落地实战!
这期想请大家聊聊:在多模态AI你追我赶的竞赛中,你觉得教育标准化、视频生成长度、还是数学推理精度,哪个更能代表AI的真正成熟?评论区见!
还没发表评论,快来发表第一个评论吧~