CLI 工具
发布日期:2026年4月6日 信息来源:腾讯新闻(硅基与红尘专栏)
二、核心更新内容
1. 多媒体生成原生化:视频与音乐直接进入工具层
本次更新最引人注目的变化,是 OpenClaw 将 视频生成 和 音乐生成 做成了原生能力。
此前,许多 Agent 产品虽然也能”接视频””接生图”,但本质上更像外挂:要么依赖额外插件,要么需要跳转到外部服务折腾。现在,OpenClaw 直接将 video_generate 和 music_generate 放入工具体系,Agent 可以在对话中直接调用,生成完成后将媒体文件原样返回到聊天界面。
支持的提供商阵容:
- 图像生成:ComfyUI、fal、Google、MiniMax、OpenAI 等
- 音乐生成:ComfyUI、Google Lyria、MiniMax
- 视频生成:Alibaba Model Studio Wan、BytePlus、ComfyUI、fal、Google、MiniMax、OpenAI、Qwen、Runway、Together AI、xAI 等
这一改变的深层意义在于:多媒体能力开始被纳入 Agent 的日常工作流。Agent 不再只能给用户一段文字解释,还能顺手生成封面、配图、短视频、背景音乐,甚至把整个内容生产链条串起来。用户跟它聊的是一件事,它返回的不一定只是一段文字,可能直接就是成品。
这对内容创作、宣传素材、社媒分发、品牌资产生产,都是一个非常大的拐点。
2. /dreaming 记忆巩固系统:认真处理”长期记忆”
如果说多媒体生成是本次更新最显眼的部分,那 /dreaming 可能才是最有后劲的部分。
这套系统的正式名称是 Memory Consolidation System(记忆巩固系统),核心目标是让 Agent 不只是”记住最近聊过什么”,而是能够把高价值信息慢慢固化成长期记忆。
很多人用 Agent 都会碰到同一个问题:今天刚把偏好、工作流、规则、项目背景喂给它,明天再看,它又像失忆了一样。/dreaming 想解决的,就是这个老毛病。
三阶段设计:
| 阶段 | 名称 | 功能 |
|---|---|---|
| Light Phase | 浅睡阶段 | 收集最近的日常信号、召回痕迹和候选记忆,做去重和暂存,只写入浅睡块,不立刻修改长期记忆 |
| Deep Phase | 深睡阶段 | 根据加权评分判断哪些内容值得晋升进长期记忆,写入 MEMORY.md,过程沉淀到 DREAMS.md |
| REM Phase | 快速眼动阶段 | 从记忆中抽取主题、总结模式、捕捉高层长期信号,写出 REM block,为 Deep 阶段提供强化线索 |
评分权重:
- Frequency(频率):0.24
- Relevance(相关性):0.30
- Query diversity(查询多样性):0.15
- Recency(时效性):0.15
- Consolidation(巩固度):0.10
- Conceptual richness(概念丰富度):0.06
启用方式:
/dreaming on
/dreaming off
/dreaming status
/dreaming help
openclaw memory promote
openclaw memory promote-explain
为什么重要?
长期运行的 Agent,最怕的不是回答不出来,而是它始终停留在”每次都重新认识你”的状态。/dreaming 往前走了一步:它开始认真回答——什么东西该记,为什么记,记进去之后还能不能解释清楚。这直接决定了 Agent 能否真正变成”陪你长期做事”的系统。
3. 结构化任务进度:长任务不再”黑盒”
本次更新还引入了一个很实用但容易被低估的功能:Structured Task Progress(结构化任务进度)。
此前 Agent 做复杂任务时,用户最难受的一点是不知道它到底干到哪了。看见的往往只有两种状态:没反应,或突然回一大段。中间发生了什么,拆了几步,卡在哪,用户并不清楚。
现在,OpenClaw 开始支持实验性的结构化计划更新和执行事件,UI 里可以更明确地显示任务的分步进度。这对于以下场景尤为关键:
- 自动化网页操作
- 多文件生成与修改
- 长链路调研
- 多节点协作
- 复杂代码任务
用户最需要的,不是漂亮文案,而是可见性。知道 Agent 现在在第几步,知道它到底是在执行、等待、还是失败了,这种透明度直接决定一个系统用起来到底稳不稳。
4. Prompt Cache 优化:省钱又稳
本次更新明显下力气改进了 Prompt Cache 复用,包括:
- 更好的前缀复用
- 更确定的工具排序
- 更合理的图像历史处理
- 系统提示指纹识别
- 移除重复工具清单,减少缓存失效
- 新增
openclaw status --verbose做缓存诊断
这些底层优化带来的结果很直接:更快、更便宜、更稳定。尤其是使用 GPT-5.4 等大模型时,缓存命中率一上去,差别会非常明显。
5. 12 种语言支持:国际化真正落地
OpenClaw 本次将 Control UI 和官方文档一起补齐了多语言支持,新增的 12 种语言包括:
简体中文、繁体中文、巴西葡萄牙语、德语、西班牙语、日语、韩语、法语、土耳其语、印度尼西亚语、波兰语、乌克兰语。
这看起来不如视频生成那么炸裂,但对产品扩散其实非常关键。真正挡住很多普通用户的,不只是配置难,而是信息入口一直在英语世界里。对中文用户而言,这波更新的实际价值很大:上手门槛明显往下掉了。
6. Anthropic 路线调整:拥抱更可控的模型接入
本次版本还有一个不容忽视的变化:模型提供商策略调整。
背景:Anthropic 最近的政策变化,将 OpenClaw 这类第三方 harness 使用方式归到”Extra Usage”里,计费逻辑变得更麻烦。
OpenClaw 官方的应对:
- 已移除 Claude CLI 后端
- 新用户若想走 Anthropic,需改用 API Key
- 旧配置可尝试用
openclaw doctor修复 - 官方更建议转向 OpenAI Codex、Qwen、MiniMax、GLM 等路线
这其实不是一条普通的兼容性说明,更像是一次产品路线表态。外部政策一变,依赖第三方封装接口的方案立刻会变脆。OpenClaw 这次直接把方向切得更明确:拥抱更可控、更清晰的模型接入路径。
四、升级建议
强烈建议升级,尤其是以下用户:
- 需要多媒体生成能力的内容创作者
- 希望建立长期记忆的用户
- 执行复杂多步任务的用户
- 关注成本优化的重度使用者
升级后建议立即做三件事:
- 运行
openclaw doctor --fix,先迁移旧配置 - 尝试
/dreaming on,看看记忆巩固链路是否适合长期使用 - 让 Agent 直接生成一段视频、音乐或完整素材流,感受多媒体能力
信息源链接: