行业动态

CLI 工具

· 约 10 分钟阅读

发布日期:2026年4月6日 信息来源:腾讯新闻(硅基与红尘专栏)

二、核心更新内容

1. 多媒体生成原生化:视频与音乐直接进入工具层

本次更新最引人注目的变化,是 OpenClaw 将 视频生成音乐生成 做成了原生能力。

此前,许多 Agent 产品虽然也能”接视频””接生图”,但本质上更像外挂:要么依赖额外插件,要么需要跳转到外部服务折腾。现在,OpenClaw 直接将 video_generatemusic_generate 放入工具体系,Agent 可以在对话中直接调用,生成完成后将媒体文件原样返回到聊天界面。

支持的提供商阵容

  • 图像生成:ComfyUI、fal、Google、MiniMax、OpenAI 等
  • 音乐生成:ComfyUI、Google Lyria、MiniMax
  • 视频生成:Alibaba Model Studio Wan、BytePlus、ComfyUI、fal、Google、MiniMax、OpenAI、Qwen、Runway、Together AI、xAI 等

这一改变的深层意义在于:多媒体能力开始被纳入 Agent 的日常工作流。Agent 不再只能给用户一段文字解释,还能顺手生成封面、配图、短视频、背景音乐,甚至把整个内容生产链条串起来。用户跟它聊的是一件事,它返回的不一定只是一段文字,可能直接就是成品。

这对内容创作、宣传素材、社媒分发、品牌资产生产,都是一个非常大的拐点。

2. /dreaming 记忆巩固系统:认真处理”长期记忆”

如果说多媒体生成是本次更新最显眼的部分,那 /dreaming 可能才是最有后劲的部分。

这套系统的正式名称是 Memory Consolidation System(记忆巩固系统),核心目标是让 Agent 不只是”记住最近聊过什么”,而是能够把高价值信息慢慢固化成长期记忆。

很多人用 Agent 都会碰到同一个问题:今天刚把偏好、工作流、规则、项目背景喂给它,明天再看,它又像失忆了一样。/dreaming 想解决的,就是这个老毛病。

三阶段设计

阶段名称功能
Light Phase浅睡阶段收集最近的日常信号、召回痕迹和候选记忆,做去重和暂存,只写入浅睡块,不立刻修改长期记忆
Deep Phase深睡阶段根据加权评分判断哪些内容值得晋升进长期记忆,写入 MEMORY.md,过程沉淀到 DREAMS.md
REM Phase快速眼动阶段从记忆中抽取主题、总结模式、捕捉高层长期信号,写出 REM block,为 Deep 阶段提供强化线索

评分权重

  • Frequency(频率):0.24
  • Relevance(相关性):0.30
  • Query diversity(查询多样性):0.15
  • Recency(时效性):0.15
  • Consolidation(巩固度):0.10
  • Conceptual richness(概念丰富度):0.06

启用方式

/dreaming on
/dreaming off
/dreaming status
/dreaming help

openclaw memory promote
openclaw memory promote-explain

为什么重要?

长期运行的 Agent,最怕的不是回答不出来,而是它始终停留在”每次都重新认识你”的状态。/dreaming 往前走了一步:它开始认真回答——什么东西该记,为什么记,记进去之后还能不能解释清楚。这直接决定了 Agent 能否真正变成”陪你长期做事”的系统。

3. 结构化任务进度:长任务不再”黑盒”

本次更新还引入了一个很实用但容易被低估的功能:Structured Task Progress(结构化任务进度)

此前 Agent 做复杂任务时,用户最难受的一点是不知道它到底干到哪了。看见的往往只有两种状态:没反应,或突然回一大段。中间发生了什么,拆了几步,卡在哪,用户并不清楚。

现在,OpenClaw 开始支持实验性的结构化计划更新和执行事件,UI 里可以更明确地显示任务的分步进度。这对于以下场景尤为关键:

  • 自动化网页操作
  • 多文件生成与修改
  • 长链路调研
  • 多节点协作
  • 复杂代码任务

用户最需要的,不是漂亮文案,而是可见性。知道 Agent 现在在第几步,知道它到底是在执行、等待、还是失败了,这种透明度直接决定一个系统用起来到底稳不稳。

4. Prompt Cache 优化:省钱又稳

本次更新明显下力气改进了 Prompt Cache 复用,包括:

  • 更好的前缀复用
  • 更确定的工具排序
  • 更合理的图像历史处理
  • 系统提示指纹识别
  • 移除重复工具清单,减少缓存失效
  • 新增 openclaw status --verbose 做缓存诊断

这些底层优化带来的结果很直接:更快、更便宜、更稳定。尤其是使用 GPT-5.4 等大模型时,缓存命中率一上去,差别会非常明显。

5. 12 种语言支持:国际化真正落地

OpenClaw 本次将 Control UI 和官方文档一起补齐了多语言支持,新增的 12 种语言包括:

简体中文、繁体中文、巴西葡萄牙语、德语、西班牙语、日语、韩语、法语、土耳其语、印度尼西亚语、波兰语、乌克兰语。

这看起来不如视频生成那么炸裂,但对产品扩散其实非常关键。真正挡住很多普通用户的,不只是配置难,而是信息入口一直在英语世界里。对中文用户而言,这波更新的实际价值很大:上手门槛明显往下掉了

6. Anthropic 路线调整:拥抱更可控的模型接入

本次版本还有一个不容忽视的变化:模型提供商策略调整。

背景:Anthropic 最近的政策变化,将 OpenClaw 这类第三方 harness 使用方式归到”Extra Usage”里,计费逻辑变得更麻烦。

OpenClaw 官方的应对

  • 已移除 Claude CLI 后端
  • 新用户若想走 Anthropic,需改用 API Key
  • 旧配置可尝试用 openclaw doctor 修复
  • 官方更建议转向 OpenAI Codex、Qwen、MiniMax、GLM 等路线

这其实不是一条普通的兼容性说明,更像是一次产品路线表态。外部政策一变,依赖第三方封装接口的方案立刻会变脆。OpenClaw 这次直接把方向切得更明确:拥抱更可控、更清晰的模型接入路径

四、升级建议

强烈建议升级,尤其是以下用户:

  • 需要多媒体生成能力的内容创作者
  • 希望建立长期记忆的用户
  • 执行复杂多步任务的用户
  • 关注成本优化的重度使用者

升级后建议立即做三件事

  1. 运行 openclaw doctor --fix,先迁移旧配置
  2. 尝试 /dreaming on,看看记忆巩固链路是否适合长期使用
  3. 让 Agent 直接生成一段视频、音乐或完整素材流,感受多媒体能力

信息源链接

分享到: QQ 微博