本期看点:
🌍 李飞飞团队扔出“轻量级核弹”:一块H100就能实时搓3D世界
🎮 游戏和VR要变天?世界模型赛道突然卷到飞起
🔓 开源+平民化,独立开发者的好日子真要来了?


一块显卡搓出《头号玩家》?李飞飞团队的RTFM真有点东西

这回斯坦福AI实验室没整虚的——李飞飞带队搞出来的RTFM(Read The Field Model),名字听着像在开玩笑,效果却让人想拍大腿。你只需要一块NVIDIA H100,不用堆服务器、不搞分布式,就能跑出24fps以上的720p实时3D场景,延迟压进50毫秒。说人话就是:以前得搭个机房才能干的事儿,现在一台高性能笔记本就能搞定,连《头号玩家》里那个绿洲世界的雏形,都能在家自己“搓”出来。

李飞飞在技术活动上介绍RTFM模型
李飞飞在Bloomberg Tech活动上聊实时3D生成 | 图源:Business Outstanders

技术上,RTFM其实是把NeRF架构给“魔改”了。核心思路贼聪明:别每次都从头算整个场景,只更新动了的部分——跟写代码时用Git提交diff一样,哪儿变了改哪儿。这么一来,计算量断崖式下降,显存也不再吃紧。对中小团队或单打独斗的独立开发者来说,简直是久旱逢甘霖:以前得租云GPU集群烧钱跑的东西,现在插块卡就能本地调试。

产业层面,这玩意儿直接捅破了游戏和VR行业的那层窗户纸。The Verge已经点名说World Labs这是要跟Google DeepMind的Genie 3正面掰手腕,后者背后还站着Demis Hassabis这种AGI布道狂魔。但RTFM赢在“能玩”——不是给你放个炫酷视频完事,而是真能让你抄起手柄,在它生成的世界里跑跳蹲爬。LinkedIn上流出的那个光影流动的虚拟街道demo,已经有点“元宇宙入口”的味道了。

更狠的是开源策略。代码往GitHub一甩,Demo链接一挂,摆明了想复刻Stable Diffusion当年引爆社区的路径。TechCrunch提到,像Vinod Khosla这样的风投早就把“世界模型”当成下一个千亿美金公司的摇篮。而RTFM走的是“平民路线”,第一批吃螃蟹的很可能不是科技巨头,而是车库里的极客、卧室里的MOD作者。想象一下,以后Steam创意工坊会不会冒出一堆“一句话生成关卡”的MOD?比如输入“中世纪城堡带护城河+哥特尖顶+雨夜氛围”,然后看着它自动生成、还能进去溜达?

当然,坑还没填完。光照偶尔穿帮、物理交互还比较“塑料感”,这些硬骨头都还在路上。但能把3D生成从学术界的PPT拉进产品迭代的泥潭里打滚,本身就是一大步。下一步?我猜是接Unreal Engine插件,或者被Roblox打包收编——毕竟,谁不想对着麦克风说一句“给我造个海底神殿,要有发光水母和沉船宝藏”,然后看着它在引擎里活过来呢?


这里是程序员Left,后端工程师,专注扒AI前沿技术和产业动态。全网同名,持续为开发者提供有温度、有脑洞的行业观察!

本期讨论:如果给你RTFM的API权限,你第一个想生成的3D场景是什么?我在评论区蹲你的神回复!

Categories:

Tags:

还没发表评论,快来发表第一个评论吧~

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注