文心4.5开源震撼业界！ | Hunyuan-A13B推理高效 | Ovis-U1多模态三合一

作者 left

发布于 1 7 月, 2025

共计 0 个讨论

本期看点：

🚀 百度放大招啦！开源文心大模型4.5系列：47B MoE架构和多模态解决方案，AI界又添新玩具
💡 腾讯不甘示弱，开源Hunyuan-A13B MoE模型：细粒度架构让推理更高效，多轮对话流畅得像老友聊天
🌐 阿里也来凑热闹，发布多模态大模型Ovis-U1：理解、生成、编辑三合一，玩转多模态不费劲
🎮 英伟达秀黑科技，DLSS 4显存优化：Transformer模型显存占用降20%，游戏玩家福音来了
🏆 欧洲首台Exascale超算JUPITER上线：浮点运算超猛，全球TOP500排第四，德国人这次真拼了
📈 百度飞桨开源ERNIE-4.5模型：中国AI新里程碑，DeepSeek之后最大动静，开发者们偷着乐吧
🔬 Meta组建超级智能实验室：前Scale AI CEO带队，10万块H100 GPU加持，下一代大模型要起飞
🤖 GPT-5灰度测试启动：OpenAI搞多模态革命，语音图像视频通吃，推理效率飙3倍，未来已来？

百度开源文心大模型4.5系列：47B MoE架构与多模态解决方案

图为百度文心大模型4.5系列架构示意图 | 图源：Developing Telecoms

百度这次可真没闲着，直接把文心大模型4.5系列开源了！一口气推出47B/3B MoE架构和0.3B稠密模型，足足十款，用飞桨框架训练得飞起，FLOPs利用率冲到47%，还打包了一站式多模态方案。AI圈子里，这波操作够硬核吧？

技术架构与性能突破
文心大模型4.5系列玩起了混合专家（MoE）架构，47B模型更是超大号MoE设计，知识推理和数学能力直接开挂。飞桨框架的优化功不可没，FLOPs利用率47%可不是盖的，比行业平均高出15%呢。0.3B稠密模型也没闲着，专治长上下文和幻觉问题，妥妥的“细节控”。

多模态与行业应用
这模型不光懂自然语言，还能玩转计算机视觉、多模态交互和科学计算。百度说了，它已经在医疗、金融、政府、工业等领域大显身手，帮企业智能化转型快人一步。想象一下，AI在诊室里当助手，或者在工厂里优化流程，是不是挺酷？

开源生态与开发者支持
百度这回够意思，不光开源模型代码，还配了详细文档和示例。开发者上手？分分钟的事儿！飞桨框架的一站式方案，门槛低到几乎没门槛，小白也能玩转AI。

腾讯开源Hunyuan-A13B MoE模型：细粒度架构实现高效推理与多轮对话

腾讯Hunyuan-Large模型宣传图
图为腾讯开源的Hunyuan-Large模型 | 图源：腾讯云

腾讯也来刷存在感，开源了130亿活跃参数的Hunyuan-A13B模型！总参数量高达800亿，细粒度混合专家（MoE）架构玩得溜，资源紧张时照样高效推理。多轮对话流畅得跟真人唠嗑似的，代码生成也手到擒来。AI聊天从此不尬聊？

技术架构与性能优势
Hunyuan-A13B的绝活儿在细粒度MoE架构——动态激活专家模块，计算资源省到家，性能却一点不打折。多轮对话任务里，它表现得像个人精，代码生成功能更是加分项。开发者们，准备好接招吧！

开源生态与行业影响
腾讯这波开源，绝对是给全球AI社区送大礼。模型权重和训练代码全开放，AI技术民主化？走着瞧！

阿里发布多模态大模型Ovis-U1：整合理解、生成与编辑功能

图为阿里发布的Ovis-U1多模态大模型 | 图源：Leiphone

阿里不甘落后，推出多模态大模型Ovis-U1，理解、生成、编辑三合一！开源版本带4.2B视觉编码器和1.8B文本解码器，跨模态对齐玩得转。AI界的“瑞士军刀”，来了！

技术架构与功能
Ovis-U1靠视觉编码器和文本解码器打通多模态任务，比如图像描述生成、文生图转换，还有多模态内容编辑。功能全得让人眼花缭乱，创意工作者的新宠没跑了。

市场反响与竞争
Ovis-U1赶在全球AI竞赛白热化时登场，阿里显然想抢生成式AI的高地。竞争对手们，小心背后哟！

英伟达DLSS 4显存优化技术：Transformer模型显存占用降低20%

图为英伟达DLSS 4技术演示 | 图源：VideoCardz

英伟达又秀肌肉了，DLSS 4 SDK里的Transformer模型，显存占用直接砍掉20%！新版Tensor Core优化算法加持，游戏玩家和开发者乐开花。VRAM省着用，性能照样飙。

技术细节与优化效果
DLSS 4转向Transformer模型，新版SDK在1080p分辨率下，显存占用从106.90 MB降到85.77 MB，降幅19.76%。数字说话，够实在吧？

欧洲首台Exascale超算JUPITER正式启用，位列全球TOP500第四

图为JUPITER超算系统 | 图源：HPCwire

德国于利希研究中心放大招，欧洲首台Exascale超算JUPITER上线啦！模块化液冷架构设计，FP64性能飙到1.1 ExaFLOPS，全球TOP500榜单排第四。超算界的新晋“顶流”，够拉风吧？

性能与架构
JUPITER浮点运算能力1.1 ExaFLOPS，快得飞起。模块化液冷不光提能效，还降温减噪，运行起来安静又高效。环保又强大，德国制造真不赖！

百度飞桨开源ERNIE-4.5模型：中国AI领域的新里程碑

图为百度飞桨开源ERNIE-4.5模型 | 图源：CNBC

百度飞桨再放大招，开源ERNIE-4.5系列模型！424B视觉语言版和300B纯文本版齐上阵，支持PaddlePaddle原生推理，预训练权重全开放。中国AI界自DeepSeek以来的最大动作，开发者们，福利来咯！

Meta组建超级智能实验室，前Scale AI CEO领衔下一代大模型研发

Meta Superintelligence Labs
图为Meta新成立的超级智能实验室 | 图源：TechCrunch

Meta搞大事，成立“超级智能实验室”，前Scale AI CEO Alexandr Wang挂帅，专攻下一代大模型。10万块NVIDIA H100 GPU集群加持，这阵容，AI界要卷上天了！

GPT-5进入灰度测试阶段：OpenAI启动多模态模型革命

GPT-5标志
图为GPT-5的标志性设计 | 图源：TechCrunch

OpenAI不声不响，GPT-5进入灰度测试了！多模态模型支持语音、图像、视频交互，新型混合专家架构（MoE）让推理效率比GPT-4快3倍。AI革命？这次真来了！

作者：程序员Left（全网同名）
职位：后端工程师
创作方向：AI前沿科技内容
本期讨论：多模态模型的未来究竟属于谁？别光看热闹，快来评论区聊聊你的高见！

Categories:

AI科技日报

Tags:

No Tag

文心4.5开源震撼业界！ | Hunyuan-A13B推理高效 | Ovis-U1多模态三合一

本期看点：

百度开源文心大模型4.5系列：47B MoE架构与多模态解决方案

腾讯开源Hunyuan-A13B MoE模型：细粒度架构实现高效推理与多轮对话

阿里发布多模态大模型Ovis-U1：整合理解、生成与编辑功能

英伟达DLSS 4显存优化技术：Transformer模型显存占用降低20%

欧洲首台Exascale超算JUPITER正式启用，位列全球TOP500第四

百度飞桨开源ERNIE-4.5模型：中国AI领域的新里程碑

Meta组建超级智能实验室，前Scale AI CEO领衔下一代大模型研发

GPT-5进入灰度测试阶段：OpenAI启动多模态模型革命

还没发表评论，快来发表第一个评论吧~

发表回复取消回复

近期文章

文心4.5开源震撼业界！ | Hunyuan-A13B推理高效 | Ovis-U1多模态三合一

本期看点：

百度开源文心大模型4.5系列：47B MoE架构与多模态解决方案

腾讯开源Hunyuan-A13B MoE模型：细粒度架构实现高效推理与多轮对话

阿里发布多模态大模型Ovis-U1：整合理解、生成与编辑功能

英伟达DLSS 4显存优化技术：Transformer模型显存占用降低20%

欧洲首台Exascale超算JUPITER正式启用，位列全球TOP500第四

百度飞桨开源ERNIE-4.5模型：中国AI领域的新里程碑

Meta组建超级智能实验室，前Scale AI CEO领衔下一代大模型研发

GPT-5进入灰度测试阶段：OpenAI启动多模态模型革命

还没发表评论，快来发表第一个评论吧~

发表回复 取消回复

近期文章

发表回复取消回复