Skip to content

1. Google 开源 A2UI 标准,让 AI 实时生成安全的图形化界面

Google 推出了开源项目 A2UI,旨在让 AI 智能体通过生成安全的 JSON 数据结构来实时创建跨平台 UI,解决了传统 AI 输出可执行代码的安全风险与跨框架兼容性问题。原文链接

2. 通义千问开源 Qwen-Image-Layered 模型,实现 PS 级图层精准编辑

阿里 开源了图像生成模型 Qwen-Image-Layered,该模型可将图片自动分解为独立的 RGBA 图层,支持对任意图层进行重新着色、物体替换等原生编辑,实现 PS 级别的精准控制原文链接

3. MiniMax 开源视觉分词器预训练框架 VTP,首次展示 Tokenizer 的 Scaling Law

MiniMax海螺视频团队 开源了视觉分词器预训练框架 VTP,通过联合优化理解、重建与生成任务,首次证明了 Tokenizer 也具备明确的 Scaling Law,能显著提升下游生成模型的性能与效率。原文链接

4. 英伟达开源通用游戏基础模型 NitroGen,具备跨游戏泛化能力

英伟达 开源了能玩 1000+ 款游戏 的通用基础模型 NitroGen,该模型基于 GR00T 架构,仅需微调即可上手新游戏,具备跨游戏的泛化能力,为通用具身智能铺路。原文链接

5. 盛大 AI 东京研究院开源 Mio 框架,系统性解决数字人“灵魂缺失”问题

盛大 AI 东京研究院 开源了旨在实现 “交互智能” 的端到端框架 Mio,通过认知核心、多模态动画师等五大模块协同,系统性解决了数字人在长期记忆、情感表达与自主进化方面的挑战。原文链接

6. 北京人形机器人创新中心开源国内首个符合国标的 VLA 大模型 XR-1

北京人形机器人创新中心 开源了具身视觉-语言-动作(VLA)大模型 XR-1,成为国内首个符合具身智能国家标准的模型,具备跨平台运行能力,能精准执行取放、推拉等复杂双臂技能。原文链接

7. 开源 AI 绘画提示词工具 PromptFill,通过“填空式”交互降低创作门槛

一款名为 PromptFill 的开源工具通过创新的 “填空式”可视化交互,将复杂提示词拆解为独立变量,用户通过点选、拖拽即可快速构建完整 Prompt 结构,大幅降低 AI 绘画创作门槛。原文链接

8. 蚂蚁集团牵头推动多智能体可信国际标准在 ITU 成功立项

蚂蚁集团 牵头,联合信通院、中国电信等单位提出的 《终端多智能体系统可信要求》 国际标准项目在 ITU 成功立项,其核心技术源于此前开源的智能体可信互联技术 ASL原文链接

9. 生成式 AI 深度渗透游戏开发,Steam 热销榜前十有一半出自 AI 拥护者

根据最新 Steam 销量榜,全球最畅销的前十名游戏中,有一半 出自已公开拥抱 AI 技术的开发工作室,AI 正从“行业谈资”转变为推动 AAA 级大作生产的实战利器。原文链接

10. 语音约会应用 Known 获 970 万美元融资,AI 引导对话实现 80% 线下转化率

AI 约会应用 Known 凭借一套 AI 语音引导的深度对话式匹配系统,实现 80% 的初次介绍转化为线下约会,远超传统交友软件不足 10% 的见面率,近日完成 970 万美元融资。原文链接

每日精选 AI 前沿资讯