本期看点:
🎨 字节跳动开源VINCIE-3B模型,AI图像编辑炸场新玩法
🎬 Bilibili祭出AniSora V3,动漫视频生成玩出新花样
🔮 字节跳动EX-4D黑科技,手机视频秒变4D大片
🎵 Stability AI联手Arm,手机端就能跑的音乐魔法

字节跳动VINCIE-3B:修图不用PS了?

字节跳动最新开源的VINCIE-3B模型彻底玩嗨了!这个搭载3亿参数的大家伙,居然能直接从视频里偷师学艺,把传统修图软件需要的分割、修复这些繁琐步骤统统砍掉。以后给连续画面做特效,就像拼乐高一样简单顺手。

VINCIE-3B模型架构图
图为VINCIE-3B模型架构图 | 图片来源:AI在线

影视后期小哥们要笑醒了——以前通宵抠图的苦日子终于到头。就连做教学视频的老师傅们,现在动动手指就能把黑板字变成印刷体。最香的是,GitHub上已经能免费抱走这个宝藏工具!

GitHub链接:https://github.com/VINCIE-3B


B站AniSora V3:动漫师的造梦工厂

B站最新开源的AniSora V3简直是动漫创作者的作弊器!不管你要热血战斗还是萌系日常,各种动漫风格的视频镜头信手拈来。虚拟主播Kou Mariya试用后直呼:\"我的直播角色现在活得像吃了跳跳糖!\"

AniSora V3模型效果展示
图为AniSora V3生成的动漫视频片段 | 图片来源:OSCHINA

新版本把动作流畅度调教得行云流水,角色转身时头发飘动的弧度都透着经费在燃烧的味道。现在GitHub和HuggingFace双平台开放,动漫爱好者们还等什么?

GitHub链接:https://github.com/AniSora-V3
HuggingFace链接:https://huggingface.co/AniSora-V3


字节跳动EX-4D:手机拍的视频能摸到了!

字节跳动PICO团队放了大招!他们开源的EX-4D框架能让普通手机拍的视频,魔术般变成能360度把玩的4D模型。三维空间加时间维度全拿下,直接把同行甩开三条街。

EX-4D框架效果展示
图为EX-4D生成的4D序列效果 | 图片来源:AITOP100

转换效率暴涨30%什么概念?VR游戏开发者现在做场景就像拼积木,影视特效师熬夜渲染的日子也该到头了。GitHub上新鲜出炉的代码包,建议游戏党们速速收藏!

GitHub链接:https://github.com/EX-4D


Stability AI+Arm:手机生成交响乐!

Stability AI和Arm这对神仙组合,居然把音频模型塞进了手机!开源的Stable Audio Open Small只有3.41亿参数,却在Arm芯片上跑得飞起,立体声音效堪比录音棚。

Stable Audio Open Small模型架构图
图为Stable Audio Open Small的架构图 | 图片来源:Stability AI

以后地铁上灵感来了,掏出手机就能生成BGM。做自媒体的朋友更赚——配音、音效全包圆,连买素材库的钱都省了。GitHub和HuggingFace双通道已开放,音乐创作者的春天来了!

GitHub链接:https://github.com/Stable-Audio
HuggingFace链接:https://huggingface.co/Stable-Audio


作者:程序员Left(全网到处浪)
职业:后台魔法师
技能树:专挖AI黑科技

灵魂拷问:这波开源核弹里,你觉得哪个最可能改变行业游戏规则?评论区等你来Battle!🔥

Categories:

Tags:

还没发表评论,快来发表第一个评论吧~

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注