让 Agent 学会"先预测,再行动"
# 让 Agent 学会"先预测,再行动"
Source: 公众号:通义实验室(千问) | Published: 2026-06-24
Summary
通义千问推出首个原生语言世界模型 Qwen-AgentWorld,覆盖 MCP、Search、Terminal、SWE、Web、OS、Android 七大领域。模型基于超 1000 万条真实交互轨迹,经 CPT→SFT→RL 三阶段训练,在 AgentWorldBench 上超越 GPT-5.4(58.25)和 Claude Opus 4.8,Qwen-AgentWorld-397B-A17B 取得 58.71 分。两种范式已验证其能力:作为解耦环境模拟器实现可控 Sim RL,在 WideSearch 上超越真实环境 RL(F1 50.3% vs 45.6%);作为智能体基础模型,LWM 预热可迁移至七个基准(三个完全未出现在训练集中)。模型与评测基准已开源
Details
让 Agent 学会"先预测,再行动"
这个工具是什么?
通义千问推出首个原生语言世界模型 Qwen-能自动完成任务的AI助手World,覆盖 MCP、Search、Terminal、SWE、Web、OS、Android 七大领域。模型基于超 1000 万条真实交互轨迹,经 CPT→SFT→RL 三阶段训练,在 能自动完成任务的AI助手WorldBench 上超越 GPT-5.4(58.25)和 Claude Opus 4.8,Qwen-能自动完成任务的AI助手World-397B-A17B 取得 58.71 分。两种范式已验证其能力:作为解耦环境模拟器实现可控 Sim RL,在 WideSearch 上超越真实环境 RL(F1 50.3% vs 45.6%);作为能自动完成任务的AI助手基础模型,LWM 预热可迁移至七个基准(三个完全未出现在训练集中)。模型与评测基准已代码公开可免费使用
能帮你做什么?
这个工具可以帮你:
1. 提升工作效率
2. 自动化重复任务
3. 获得更好的AI体验
适合谁用?
- ✅ 适合:想要提升效率的普通用户
- ✅ 适合:对AI感兴趣的新手
- ❌ 不适合:需要高度定制化的专业用户
总结
这是一个值得尝试的AI工具。如果你想要...,它会是一个不错的选择。
---
数据来源:公众号:通义实验室(千问) | 更新时间:2026/6/25
---
**Related Links**
- Original: https://mp.weixin.qq.com/s/NV9WGpGsfFz35jww5agM9g
Source: 公众号:通义实验室(千问)