1. Google 开源 A2UI 标准,让 AI 实时生成安全的图形化界面
Google 推出了开源项目 A2UI,旨在让 AI 智能体通过生成安全的 JSON 数据结构来实时创建跨平台 UI,解决了传统 AI 输出可执行代码的安全风险与跨框架兼容性问题。原文链接
2. 通义千问开源 Qwen-Image-Layered 模型,实现 PS 级图层精准编辑
阿里 开源了图像生成模型 Qwen-Image-Layered,该模型可将图片自动分解为独立的 RGBA 图层,支持对任意图层进行重新着色、物体替换等原生编辑,实现 PS 级别的精准控制。原文链接
3. MiniMax 开源视觉分词器预训练框架 VTP,首次展示 Tokenizer 的 Scaling Law
MiniMax海螺视频团队 开源了视觉分词器预训练框架 VTP,通过联合优化理解、重建与生成任务,首次证明了 Tokenizer 也具备明确的 Scaling Law,能显著提升下游生成模型的性能与效率。原文链接
4. 英伟达开源通用游戏基础模型 NitroGen,具备跨游戏泛化能力
英伟达 开源了能玩 1000+ 款游戏 的通用基础模型 NitroGen,该模型基于 GR00T 架构,仅需微调即可上手新游戏,具备跨游戏的泛化能力,为通用具身智能铺路。原文链接
5. 盛大 AI 东京研究院开源 Mio 框架,系统性解决数字人“灵魂缺失”问题
盛大 AI 东京研究院 开源了旨在实现 “交互智能” 的端到端框架 Mio,通过认知核心、多模态动画师等五大模块协同,系统性解决了数字人在长期记忆、情感表达与自主进化方面的挑战。原文链接
6. 北京人形机器人创新中心开源国内首个符合国标的 VLA 大模型 XR-1
北京人形机器人创新中心 开源了具身视觉-语言-动作(VLA)大模型 XR-1,成为国内首个符合具身智能国家标准的模型,具备跨平台运行能力,能精准执行取放、推拉等复杂双臂技能。原文链接
7. 开源 AI 绘画提示词工具 PromptFill,通过“填空式”交互降低创作门槛
一款名为 PromptFill 的开源工具通过创新的 “填空式”可视化交互,将复杂提示词拆解为独立变量,用户通过点选、拖拽即可快速构建完整 Prompt 结构,大幅降低 AI 绘画创作门槛。原文链接
8. 蚂蚁集团牵头推动多智能体可信国际标准在 ITU 成功立项
由 蚂蚁集团 牵头,联合信通院、中国电信等单位提出的 《终端多智能体系统可信要求》 国际标准项目在 ITU 成功立项,其核心技术源于此前开源的智能体可信互联技术 ASL。原文链接
9. 生成式 AI 深度渗透游戏开发,Steam 热销榜前十有一半出自 AI 拥护者
根据最新 Steam 销量榜,全球最畅销的前十名游戏中,有一半 出自已公开拥抱 AI 技术的开发工作室,AI 正从“行业谈资”转变为推动 AAA 级大作生产的实战利器。原文链接
10. 语音约会应用 Known 获 970 万美元融资,AI 引导对话实现 80% 线下转化率
AI 约会应用 Known 凭借一套 AI 语音引导的深度对话式匹配系统,实现 80% 的初次介绍转化为线下约会,远超传统交友软件不足 10% 的见面率,近日完成 970 万美元融资。原文链接