实时无限扩散模型问世！ | GThinker碾压O4-mini | 多模态交互突破

作者 left

共计 0 个讨论

本期看点：
🚀 世界首个「实时、无限」扩散视频生成模型问世
🧠 中科院自动化所GThinker模型：多模态交互新突破

最近，AI圈子里炸开了锅！一个叫「实时、无限」的视频生成模型横空出世，让大伙儿直呼“脑洞大开”。这支国际团队搞出来的新玩意儿，直接把视频生成技术推上了新高度——不再是预设好长度的死板片段，而是像开了挂一样，能实时生成永无止境的视频流。

以前那些视频模型，总得先定好时长，搞得像被绑了手脚。但这个新模型呢？靠着一套聪明的扩散算法，彻底甩掉了限制。想象一下：以后拍电影、做特效，再也不用卡在时间框里打转了，创意可以天马行空！

虽然具体数据还没公布，但这事儿连AI大牛Andrej Karpathy都忍不住砸钱支持了。他在社交媒体上放话：“这玩意儿要重新定义视频生成的边界！”

图为扩散视频生成模型示意图 | 图片来源：新浪科技

中科院自动化所的GThinker模型也来抢风头了！它在多模态交互上玩出了新花样，性能直接碾压了O4-mini基准，搞得自动驾驶和智能问答系统都眼巴巴等着用。

这模型的灵感贼有趣，直接从人脑里“偷师”，学会了动态调整注意力权重。简单说，它能像咱们人一样，根据任务轻重缓急灵活分配“脑力”——开车时盯紧路况，聊天时秒懂你的潜台词，效率杠杠的！

图为GThinker模型架构图 | 图片来源：新浪科技

论文刚在预印本平台露脸，学术界和工业界就坐不住了。一堆科技公司已经在摩拳擦掌，盘算着怎么把它塞进智能助手和自动驾驶里捞金。

作者：程序员Left（全网同名）
职位：后端工程师
创作方向：AI前沿科技内容

本期讨论： 各位看官，视频生成技术和多模态模型，你们赌哪个会先火遍大街小巷？评论区等你来掰扯！

Categories:

Tags:

No Tag