本期看点:
🚀 谢赛宁团队新评估基准让主流LLM集体零分,行业评估体系或重构
💡 清华SageAttention3实现FP4量化5倍加速,首次支持8比特训练
🎥 DCM技术团队优化视频扩散模型,推理效率提升12.5倍
⚡ 射频光子深度学习处理器MAFT-ONN突破香农极限,计算速度提升数百倍
🌐 谷歌Gemini 2.5全面推出,向OpenAI发起挑战
🎬 稀宇科技MiniMax发布Hailuo 02,树立视频生成新标杆
📱 苹果新Speech API转录速度超OpenAI Whisper 55%
📹 字节跳动Seedance 1.0超越谷歌Veo 3,视频生成技术再突破
谢赛宁团队新评估基准让主流LLM集体零分,行业评估体系或重构
图为DeepSeek R1与Gemini 2.5 Pro在谢赛宁团队新基准测试中的表现对比 | 图源:VentureBeat
谢赛宁团队近日发布了一项颠覆性的大语言模型(LLM)评估基准,结果显示主流模型如DeepSeek R1和谷歌Gemini 2.5 Pro的得分均为零分。新基准聚焦复杂推理和多模态理解,远超传统测试范围。业内分析认为,这一结果可能暴露了当前模型依赖数据标注漏洞和缺乏动态适应能力的缺陷,或将推动评估标准的全面革新。(来源:谢赛宁团队)
清华SageAttention3实现FP4量化5倍加速,首次支持8比特训练
图为SageAttention3架构示意图 | 图源:清华大学
清华大学研究团队开发的SageAttention3通过FP4量化技术实现了5倍训练加速,并首次支持8比特训练。这一突破为低精度训练领域带来新可能,尤其适合边缘设备和资源受限环境。团队表示,未来将进一步优化算法,推动AI模型的高效运行。(来源:清华大学)
DCM技术团队优化视频扩散模型,推理效率提升12.5倍
图为DCM技术团队研发的新型视频扩散模型推理优化架构 | 图源:Stability AI
DCM技术团队的新型优化架构将HunyuanVideo13B的推理时间从1500秒缩短至120秒,效率提升12.5倍。这一突破为视频生成的实时性提供了解决方案,未来或广泛应用于影视制作和虚拟现实等领域。(来源:DCM技术团队)
射频光子深度学习处理器MAFT-ONN突破香农极限,计算速度提升数百倍
图为射频光子深度学习处理器MAFT-ONN的示意图 | 图源:Nature
MAFT-ONN研究团队开发的射频光子处理器比传统方法快数百倍,能耗降低50%。这一技术有望应用于医疗影像、金融交易等高计算需求领域,推动AI计算范式的革新。(来源:MAFT-ONN研究团队)
谷歌Gemini 2.5全面推出,向OpenAI发起挑战
图为谷歌Gemini 2.5系列模型发布现场 | 图源:Calvyn
谷歌DeepMind推出Gemini 2.5系列,包括高性能Pro版和轻量化Flash版。Flash-Lite甚至能实时编写操作系统,展示了大模型轻量化技术的突破。定价策略灵活,旨在与OpenAI展开直接竞争。(来源:Google DeepMind)
稀宇科技MiniMax发布Hailuo 02,树立视频生成新标杆
图为Hailuo 02视频生成模型界面 | 图源:Hailuo AI
基于Noise-架构的Hailuo 02已生成3.7亿条视频,复杂场景表现接近专业制作水平。MiniMax计划开放商用API,进一步推动AI视频生成技术的普及。(来源:MiniMax)
苹果新Speech API转录速度超OpenAI Whisper 55%
图为OpenAI Whisper模型示意图 | 图源:OpenAI
苹果的Speech API能在45秒内转录34分钟4K视频,比Whisper快55%。技术基于SpeechAnalyzer和SpeechTranscriber模块,优化了本地处理能力。(来源:Apple)
字节跳动Seedance 1.0超越谷歌Veo 3,视频生成技术再突破
图为Seedance 1.0的界面展示 | 图源:QbitAI
Seedance 1.0凭借时空层解耦架构在独立评测中超越Veo 3,生成速度快20%,细节表现更优。这一技术或重新定义行业标准。(来源:字节跳动)
作者:程序员Left(全网同名)
职位:后端工程师
创作方向:AI前沿科技内容
欢迎关注,获取更多深度分析!
本期互动话题:你认为AI视频生成技术将在哪些领域最先实现大规模应用?欢迎分享你的见解!
还没发表评论,快来发表第一个评论吧~