本期看点:

🚀 OpenAI发布GPT-5,多模态能力再升级
💻 北大与字节跳动联手推出代码修复工具SWE-Swiss
微软Agent Lightning强化学习框架掀起训练革命
📸 小红书开源多模态大模型dots.vlm1,性能直追行业顶尖
📄 腾讯开源WeKnora,文档理解与检索迎来新标杆
🎨 微软Bing Image Creator免费上线GPT-4o图像生成模型
🤖 谷歌AI编程助手Jules正式上线,异步编程体验颠覆传统
🔧 摩尔线程MUSA架构适配llama.cpp,加速AI推理落地


OpenAI发布GPT-5:AI界的\"十项全能选手\"来啦!

OpenAI发布的GPT-5模型
瞧,这就是GPT-5本尊 | 图源:CNET

OpenAI最近甩出王炸GPT-5,直接把AI竞赛推向新高度!这次可不是小打小闹,一口气推出四个版本:标准版、轻量Mini版、闪电Nano版和顶配Pro版。在Swe Bench测试里表现亮眼,尤其擅长\"不说瞎话\"——事实准确性大幅提升,靠谱指数直线飙升。

三大杀手锏

  • 万能大脑上线:以前各干各的文本、图像、推理模块,现在全塞进一个大脑里,活脱脱的AI界六边形战士
  • 图文双修更溜了:你随口说\"做个记账APP,要粉色界面带猫咪图标\",它真能吐出完整代码!问个复杂医疗问题,还能结合CT影像给你分析
  • 微软火速抱大腿:GitHub Copilot和Office全家桶已吃上GPT-5红利,打工人又要迎来效率革命

虽然有人吐槽升级不够惊艳,但OpenAI掌门人Sam Altman放话:\"这可是通往AGI的里程碑!\"


北大&字节造出\"代码创可贴\"SWE-Swiss

SWE-Swiss代码修复工具
程序员救星长这样 | 图源:The Verge

熬夜修bug的日子可能要终结了!北大和字节联手打造的SWE-Swiss,专治代码各种不服。这工具在开源社区修bug准确率冲到95%,遇到报错点个\"一键修复\",堪称程序员摸鱼神器。

用户怎么说

GitHub上老铁们集体点赞:\"终于不用在屎山里刨bug了!\" 字节还透露正憋大招:即将支持更多编程语言,准备和主流开发工具深度捆绑。


微软放了个\"AI训练加速器\"

微软发布的Agent Lightning强化学习框架
训练AI就像搭乐高 | 图源:Microsoft Research

微软新推出的Agent Lightning框架彻底改写强化学习玩法。把AI训练拆成标准模块,不同架构的智能体都能扔进去练级。实测玩《星际争霸II》,胜率暴增23%,训练速度提升40%!开源之后,强化学习终于要从手工作坊迈进工业化时代了。


小红书开源多模态模型:闭源终结者?

小红书开源多模态大模型dots.vlm1
种草AI的技术实力 | 图源:AI工具集

小红书这次玩真的!开源的多模态模型dots.vlm1,靠着12亿参数的视觉引擎和DeepSeek V3语言大脑,在图文理解任务上直逼谷歌Gemini2.5Pro。听说年内要推开发者工具包,技术小白也能玩转多模态了。


腾讯WeKnora:文档地狱终结者

WeKnora文档理解与检索工具
给文档做CT扫描 | 图源:腾讯开源

还在PDF里手动扒数据?腾讯开源的WeKnora简直是打工人福音!它能从Word、PDF里精准抽骨扒髓,特别擅长处理金融合同、法律条文这种硬骨头。开源这步棋,怕是要掀起文档处理技术普及潮。


微软白送AI画家GPT-4o

Bing Image Creator生成的图像示例
AI画的比你想的还溜 | 图源:cnBeta

微软突然大方起来,把GPT-4o图像生成模型免费塞进Bing Image Creator!这玩意儿做海报、改照片样样精通,重点是——不要钱!Adobe看了怕是要失眠。


谷歌Jules:让代码自己跑腿

Jules的异步任务管理界面
程序员的新跑腿小哥 | 图源:TechCrunch

谷歌的AI编程助手Jules正式上岗!基于Gemini 2.5 Pro打造,最擅长处理异步任务。上线就帮程序员优化了14万处代码,论坛里全是\"真香\"现场。


国产芯片跑通大模型

摩尔线程MUSA架构适配llama.cpp
国产硬件的突围 | 图源:OSCHINA

摩尔线程的MUSA架构成功驯服llama.cpp,推理速度暴涨30%。以后在手机、工控机上跑大模型,可能就靠这颗\"中国芯\"了!


作者:程序员Left(全网同名)
人设:爱琢磨黑科技的后端码农

🔥 本期灵魂拷问:多模态模型看似风光,但商业化路上有哪些暗礁?是技术瓶颈还是场景落地难?评论区等你高见!

Categories:

Tags:

还没发表评论,快来发表第一个评论吧~

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注