让 Agent 学会"先预测，再行动"

# 让 Agent 学会"先预测，再行动"

Source: 公众号：通义实验室（千问） | Published: 2026-06-24

Summary

通义千问推出首个原生语言世界模型 Qwen-AgentWorld，覆盖 MCP、Search、Terminal、SWE、Web、OS、Android 七大领域。模型基于超 1000 万条真实交互轨迹，经 CPT→SFT→RL 三阶段训练，在 AgentWorldBench 上超越 GPT-5.4（58.25）和 Claude Opus 4.8，Qwen-AgentWorld-397B-A17B 取得 58.71 分。两种范式已验证其能力：作为解耦环境模拟器实现可控 Sim RL，在 WideSearch 上超越真实环境 RL（F1 50.3% vs 45.6%）；作为智能体基础模型，LWM 预热可迁移至七个基准（三个完全未出现在训练集中）。模型与评测基准已开源

Details

让 Agent 学会"先预测，再行动"

这个工具是什么？

通义千问推出首个原生语言世界模型 Qwen-能自动完成任务的AI助手World，覆盖 MCP、Search、Terminal、SWE、Web、OS、Android 七大领域。模型基于超 1000 万条真实交互轨迹，经 CPT→SFT→RL 三阶段训练，在能自动完成任务的AI助手WorldBench 上超越 GPT-5.4（58.25）和 Claude Opus 4.8，Qwen-能自动完成任务的AI助手World-397B-A17B 取得 58.71 分。两种范式已验证其能力：作为解耦环境模拟器实现可控 Sim RL，在 WideSearch 上超越真实环境 RL（F1 50.3% vs 45.6%）；作为能自动完成任务的AI助手基础模型，LWM 预热可迁移至七个基准（三个完全未出现在训练集中）。模型与评测基准已代码公开可免费使用

能帮你做什么？

这个工具可以帮你：

1. 提升工作效率

2. 自动化重复任务

3. 获得更好的AI体验

适合谁用？

✅ 适合：想要提升效率的普通用户
✅ 适合：对AI感兴趣的新手
❌ 不适合：需要高度定制化的专业用户

总结

这是一个值得尝试的AI工具。如果你想要...，它会是一个不错的选择。

---

数据来源：公众号：通义实验室（千问） | 更新时间：2026/6/25

---

**Related Links**

Original: https://mp.weixin.qq.com/s/NV9WGpGsfFz35jww5agM9g