网易有道推教育AI分级标准 | LongVie突破超长视频生成 | 快手数学推理模型准确率超90%

作者 left

发布于 21 8 月, 2025

共计 0 个讨论

本期看点：

🎓 网易有道给教育AI划了道线，定出清晰分级标准
🎬 LongVie搞定超长视频生成，画面不跳戏、风格能统一
🧮 快手数学推理模型真不赖，准确率飙到90%以上
🤖 OpenAI拉上一帮兄弟，要给编程助手立规矩
💊 AI研发新药有点猛，63%能精准命中靶点

网易有道这回在教育AI领域搞了件大事——不仅发布了「子曰」教育大模型系列新品，还头一回提出了教育AI应用的L1-L5五级标准。这套分级可不是随便定的，它从场景丰富度、能力支撑度到应用成熟度，每个维度都安排得明明白白，等于是给教育AI的发展画出了一张清晰地图。从最基础的智能问答，到能独立闭环完成教学任务，每一级该有什么能力、做到什么程度，都写得清清楚楚。这下好了，教育AI总算告别“野蛮生长”，开始走向规范化了。

教育大模型分级标准
网易有道教育大模型L1-L5分级标准框架 | 图片来源：中国日报网

视频生成这边也没闲着。上海人工智能实验室联手南京大学、复旦大学、南洋理工大学S-Lab和英伟达，一起推出了LongVie框架，终于系统性地解决了超长视频生成中的老大难问题——时间一长画面就跳戏、风格变来变去。这个突破可不小，意味着AI生成视频正从“秒级”迈进“分钟级”，以后影视、游戏、VR制作可就省事儿多了。

LongVie框架示意图
LongVie多模态引导超长视频生成示意图 | 图片来源：站长之家

快手也挺能打，基于Qwen3-8B-Base自研的Klear-Reasoner模型，在数学推理上表现惊人，多个权威测试中准确率都突破了90%。它用的那个GPPO优化算法确实有两下子，逻辑推理能力明显上了一个台阶——不管是AIME 2024、2025，还是LiveCodeBench V5，成绩都相当亮眼，尤其擅长处理烧脑的复杂推理题。

OpenAI这次没单干，拉上了Amp、Google Jules、Cursor、RooCode和Factory一共六家技术公司，联手推出了AGENTS.md标准，专门统一AI编程助手怎么“读懂”项目。有了这套公认规范，不同编程助手之间协作就更顺了，整个开发生态也会更健康。

生物医药圈最近也有好消息。宾夕法尼亚大学和杜克大学联手搞出了PepMLM大模型平台，光靠蛋白质序列就能生成靶向肽分子，命中率高达63%。这招简直颠覆传统——以前得靠复杂的结构解析，现在序列喂进去就行，新药研发效率和成功率眼看着就往上涨。

硬件方面，NVIDIA基于Blackwell架构专为中国市场打造的新一代AI芯片，性能要全面超越现在的H20。用了先进制程，明显就是冲着特定市场的算力需求去的。另一边，深度求索开源了DeepSeek V3.1-Base基础模型，不仅模型规模控制得不错，基础能力还进一步强化了，给开源社区又多了一个靠谱的选择。

还有俩进展值得一说：中科院、清华大学与阶跃星辰一起做的SE-Agent自进化编程框架，编程任务成功率干到了61.2%，靠自我迭代优化突破了传统AI编程的天花板；浙江大学跟蚂蚁集团合作的dLLM则搞定了“中间结果复用”，扩散过程中的状态反复利用，推理效率肉眼可见地提上来了。

作者：程序员Left（全网同名）
职位：后端工程师
创作方向：AI前沿科技内容

关注我，带你持续紧盯AI技术的最新突破与落地实战！

这期想请大家聊聊：在多模态AI你追我赶的竞赛中，你觉得教育标准化、视频生成长度、还是数学推理精度，哪个更能代表AI的真正成熟？评论区见！

Categories:

AI科技日报

Tags:

No Tag

网易有道推教育AI分级标准 | LongVie突破超长视频生成 | 快手数学推理模型准确率超90%

本期看点：

还没发表评论，快来发表第一个评论吧~

发表回复取消回复

近期文章

网易有道推教育AI分级标准 | LongVie突破超长视频生成 | 快手数学推理模型准确率超90%

本期看点：

还没发表评论，快来发表第一个评论吧~

发表回复 取消回复

近期文章

发表回复取消回复