1. 清华联手生数开源视频生成加速框架 TurboDiffusion
清华大学TSAIL实验室联合生数科技开源视频生成加速框架 TurboDiffusion,集成SageAttention、稀疏线性注意力等技术,在不显著损失画质的情况下,将端到端推理速度提升100至200倍,例如将单卡生成5秒视频的时间从184秒缩短至1.9秒。原文链接
2. 腾讯优图实验室开源智能体开发框架 Youtu-agent
腾讯优图实验室开源Youtu-agent框架,可根据自然语言描述自动创建任务工具并配置智能体,无需额外训练即可引入练习经验以提升智能体表现。在多项评测中,该框架基于开源模型刷新了SOTA效果。原文链接
3. 火山引擎数据库发布 AI-Ready 数据产品体系
字节跳动火山引擎发布新一代数据库产品体系,推出企业级AI搜索工具 ContextSearch、专为AI应用打造的持久化记忆基础设施 Mem0,以及数据库AI助手DBCopilot,旨在降低AI开发门槛并提升数据处理效率。原文链接
4. 原力灵机推出具备3D几何感知的机器人 VLA 框架 GeoVLA
原力灵机发布创新的 VLA(视觉-语言-行动)框架 GeoVLA,通过双流架构引入专用的点云嵌入网络和空间感知动作专家,赋予机器人真正的三维几何感知能力,在仿真与真实世界测试中均表现出色。原文链接
5. 飞猪发布《2025旅行AI指数》展示规模化落地成果
飞猪旅行平台发布行业报告,其消费级AI产品“问一问”已累计接入214个大模型,Token消耗量同比增长20倍,平台与商家侧AI工具调用次数大幅提升,显示AI在旅行场景已实现从信息生成到服务交付的闭环落地。原文链接
6. 深度智联推出覆盖房地产全场景的“数字员工战队”
专注于不动产垂直领域的深度智联推出“地产AI-Ready”战略,发布覆盖决策、营销、服务三大场景的数字员工战队,通过系统化重构业务流程,将传统团队月均超15万元的人力成本降低90%以上。原文链接
7. 南京大学联合美团、上交发布图生视频越狱攻击框架 RunawayEvil
研究团队提出首个面向图生视频模型的多模态自进化越狱攻击框架 RunawayEvil,创新性地采用“策略-战术-行动”范式,在主流I2V模型上实现了87.6%的平均攻击成功率,为模型安全评估提供新工具。原文链接
8. 京东物流在英国投用近200台“智狼机器人”自动化仓库
京东物流宣布其在英国的首个“智狼仓”正式投入使用,内部配置近200台自研的**“智狼机器人”,实现高度自动化的仓储管理,使拣货及出库效率相比传统模式提升约4倍**。原文链接
9. 字节跳动 Seed AI 发布IMO金牌级数学推理模型
字节跳动Seed AI团队发布数学推理模型 Seed Prover 1.5,该模型在国际数学奥林匹克竞赛中以金牌成绩解决了多道题目,并引入Agentic Prover和Sketch Model等创新架构,大幅提升了形式化数学证明的效率。原文链接
10. 光帆科技发布全球首款具备视觉感知能力的主动式AI耳机
光帆科技推出全球首款搭载双目视觉感知模组的主动式AI耳机,配合自研原生AI操作系统,旨在实现“全感知、全天候”的交互,让AI能根据环境主动提供服务,定义新型人机交互体验。原文链接