本期看点:

🚀 阿里开源模型Qwen3又破纪录!推理能力刷出新高度
🤖 OpenAI亲口官宣:GPT-5八月驾到,听说能看图识音了?
🔬 商汤憋大招:新模型要让人工智能\"手脚并用\"搞生产
💡 快手放出黑科技:会自己动脑子的AI模型开源了
💰 OpenAI筹钱搞大事!软银豪掷百亿建\"星际之门\"
🎬 阿里云视频神器升级:Wan2.2要当全球AI导演?
🧠 给AI造物注入灵魂!新突破让虚拟物件懂物理了
讯飞星火战力飙升:多领域能力直追OpenAI王牌
👁️ 全球首个视觉记忆模型诞生:AI能记住千万小时画面
💻 码农福音:AI测试神器30分钟造出零缺陷网站


阿里开源模型再创巅峰

阿里Qwen团队刚放出的Qwen3-235B-A22B-Thinking-2507在开源圈炸了锅!经过三个月打磨,这个推理怪兽在多项测试中把开源模型的记录刷出新高度。

Qwen3性能测试图
Qwen3性能测试图 | 图片来源:阿里巴巴

不仅推理又快又准,多任务处理更是亮眼。听说科技公司们都在抢着用,GitHub下载量瞬间冲破5000次,代码仓库快被挤爆了。


GPT-5八月正式登场

OpenAI终于松口:万众期待的GPT-5定档八月初!经过几轮加测,这家伙在语言理解、内容创作和多模态任务上全面进化。

GPT-5概念图
GPT-5概念图 | 图片来源:OpenAI

融合了自家o3技术的真·多面手,文字图片声音全能消化。微软已经摩拳擦掌准备接入云服务,医疗金融领域怕是要变天。


商汤新模型瞄准智能体革命

商汤科技憋了个大招——要在明年WAIC大会上亮出日日新v6.5。这次不只要当大脑,还要给AI装上\"手脚\",用多模态和具身智能推动生产力变革。

日日新v6.5演示图
日日新v6.5演示图 | 图片来源:商汤科技

工业机器人、智能家居厂商早已排队合作,未来你家扫地机器人可能就有商汤造的\"灵魂\"。


快手开源会思考的AI

快手刚刚开源了自家宝贝KAT-V1,这200亿参数的大家伙在自动思考任务里把Qwen、DeepSeek等老将都甩在身后。

KAT-V1架构图
KAT-V1架构图 | 图片来源:快手

处理复杂推理像玩儿似的,短视频推荐、社交互动领域怕是要迎来地震级革新。


OpenAI千亿造\"星际之门\"

OpenAI启动史诗级融资:400亿美元!软银率先砸下100亿支票,要建覆盖全美的超级数据中心网络。

星际之门项目示意图
星际之门项目示意图 | 图片来源:OpenAI

虽然钱景诱人,但面对激烈竞争和烧钱速度,这场豪赌依然步步惊心。


阿里云视频神器再进化

阿里云即将放出视频生成王牌Wan2.2。靠着时空变分自编码器黑科技,这次要争夺全球AI视频生成的王座。

Wan2.2生成示例
Wan2.2视频生成示例 | 图片来源:阿里巴巴

画质更逼真,出片快如闪电,影视公司和广告人已经盯上这块肥肉。


给虚拟世界注入物理灵魂

南洋理工联手上海AI Lab搞出PhysX-3D黑科技,终于让AI生成的3D模型懂物理了!再也不是轻飘飘的纸片物件。

PhysX-3D技术演示
PhysX-3D技术演示 | 图片来源:南洋理工大学

游戏里的武器有了真实重量,工业设计的零件知道怎么受力,这技术正在成为行业新标尺。


讯飞星火战力飙升

科大讯飞悄悄升级了星火X1,综合实力直追OpenAI的o3模型。最绝的是治好了AI胡说八道的毛病,多语言能力也突飞猛进。

星火X1演示图
星火X1升级版演示 | 图片来源:科大讯飞

教育、医疗、金融领域的智能助手们马上就要换上这个更靠谱的\"大脑\"。


AI获得人类级视觉记忆

Memories AI祭出全球首个视觉记忆模型LVMM,让AI真正记住了千万小时的画面细节,安防镜头再也不会\"脸盲\"。

LVMM模型演示
LVMM视觉记忆演示 | 图片来源:Memories AI

商场安防系统能自动识别可疑人物,广告屏懂得对老顾客微笑,轻量版推出后小公司也能玩转。


30分钟造出完美网站

浙大团队开发的TestSprite2.0简直是程序员救星!把AI写代码的准确率从不及格拉到93分,半小时自动生成零缺陷网站。

TestSprite2.0界面
TestSprite2.0操作界面 | 图片来源:浙江大学

程序员们终于能告别熬夜改bug的日子,这神器怕是要成开发标配。


作者:程序员Left(全网同名)
本职:后端工程师
专注:AI前沿科技深度解读
如果这些黑科技让你心跳加速,欢迎关注我,带你拆解更多技术谜题!

本期话题: 这些炫酷技术里,你觉得哪个会最先飞入寻常百姓家?来评论区唠唠!

Categories:

Tags:

还没发表评论,快来发表第一个评论吧~

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注