本期看点:
🚀 OpenAI发布GPT-5,多模态能力再升级
💻 北大与字节跳动联手推出代码修复工具SWE-Swiss
⚡ 微软Agent Lightning强化学习框架掀起训练革命
📸 小红书开源多模态大模型dots.vlm1,性能直追行业顶尖
📄 腾讯开源WeKnora,文档理解与检索迎来新标杆
🎨 微软Bing Image Creator免费上线GPT-4o图像生成模型
🤖 谷歌AI编程助手Jules正式上线,异步编程体验颠覆传统
🔧 摩尔线程MUSA架构适配llama.cpp,加速AI推理落地
OpenAI发布GPT-5:AI界的\"十项全能选手\"来啦!
瞧,这就是GPT-5本尊 | 图源:CNET
OpenAI最近甩出王炸GPT-5,直接把AI竞赛推向新高度!这次可不是小打小闹,一口气推出四个版本:标准版、轻量Mini版、闪电Nano版和顶配Pro版。在Swe Bench测试里表现亮眼,尤其擅长\"不说瞎话\"——事实准确性大幅提升,靠谱指数直线飙升。
三大杀手锏
- 万能大脑上线:以前各干各的文本、图像、推理模块,现在全塞进一个大脑里,活脱脱的AI界六边形战士
- 图文双修更溜了:你随口说\"做个记账APP,要粉色界面带猫咪图标\",它真能吐出完整代码!问个复杂医疗问题,还能结合CT影像给你分析
- 微软火速抱大腿:GitHub Copilot和Office全家桶已吃上GPT-5红利,打工人又要迎来效率革命
虽然有人吐槽升级不够惊艳,但OpenAI掌门人Sam Altman放话:\"这可是通往AGI的里程碑!\"
北大&字节造出\"代码创可贴\"SWE-Swiss
程序员救星长这样 | 图源:The Verge
熬夜修bug的日子可能要终结了!北大和字节联手打造的SWE-Swiss,专治代码各种不服。这工具在开源社区修bug准确率冲到95%,遇到报错点个\"一键修复\",堪称程序员摸鱼神器。
用户怎么说
GitHub上老铁们集体点赞:\"终于不用在屎山里刨bug了!\" 字节还透露正憋大招:即将支持更多编程语言,准备和主流开发工具深度捆绑。
微软放了个\"AI训练加速器\"
训练AI就像搭乐高 | 图源:Microsoft Research
微软新推出的Agent Lightning框架彻底改写强化学习玩法。把AI训练拆成标准模块,不同架构的智能体都能扔进去练级。实测玩《星际争霸II》,胜率暴增23%,训练速度提升40%!开源之后,强化学习终于要从手工作坊迈进工业化时代了。
小红书开源多模态模型:闭源终结者?
种草AI的技术实力 | 图源:AI工具集
小红书这次玩真的!开源的多模态模型dots.vlm1,靠着12亿参数的视觉引擎和DeepSeek V3语言大脑,在图文理解任务上直逼谷歌Gemini2.5Pro。听说年内要推开发者工具包,技术小白也能玩转多模态了。
腾讯WeKnora:文档地狱终结者
给文档做CT扫描 | 图源:腾讯开源
还在PDF里手动扒数据?腾讯开源的WeKnora简直是打工人福音!它能从Word、PDF里精准抽骨扒髓,特别擅长处理金融合同、法律条文这种硬骨头。开源这步棋,怕是要掀起文档处理技术普及潮。
微软白送AI画家GPT-4o
AI画的比你想的还溜 | 图源:cnBeta
微软突然大方起来,把GPT-4o图像生成模型免费塞进Bing Image Creator!这玩意儿做海报、改照片样样精通,重点是——不要钱!Adobe看了怕是要失眠。
谷歌Jules:让代码自己跑腿
程序员的新跑腿小哥 | 图源:TechCrunch
谷歌的AI编程助手Jules正式上岗!基于Gemini 2.5 Pro打造,最擅长处理异步任务。上线就帮程序员优化了14万处代码,论坛里全是\"真香\"现场。
国产芯片跑通大模型
国产硬件的突围 | 图源:OSCHINA
摩尔线程的MUSA架构成功驯服llama.cpp,推理速度暴涨30%。以后在手机、工控机上跑大模型,可能就靠这颗\"中国芯\"了!
作者:程序员Left(全网同名)
人设:爱琢磨黑科技的后端码农
🔥 本期灵魂拷问:多模态模型看似风光,但商业化路上有哪些暗礁?是技术瓶颈还是场景落地难?评论区等你高见!
还没发表评论,快来发表第一个评论吧~