行业动态

OpenClaw v2026.4.5 重大版本发布:多媒体生成入核心、/dreaming 记忆系统落地、任务进度透明化

· 约 4 分钟阅读

日期: 2026年4月11日 来源: OpenClaw 官方发布 / 腾讯新闻 / CSDN / 今日头条 综合报道 标签: #OpenClaw #版本更新 #AI Agent #多媒体生成 #长期记忆

二、最亮眼的更新:视频与音乐生成原生化

本次更新中最引人注目的变化,是 OpenClaw 将 video_generatemusic_generate 直接纳入了原生工具体系。Agent 在对话中可以直接调用这两项能力,生成完成后将媒体文件原样返回聊天流,无需依赖外部插件或跳转第三方服务。

官方提供的提供商支持矩阵非常丰富:

  • 图像生成:ComfyUI、fal、Google、MiniMax、OpenAI 等
  • 音乐生成:ComfyUI、Google Lyria、MiniMax
  • 视频生成:Alibaba Model Studio Wan、BytePlus、ComfyUI、fal、Google、MiniMax、OpenAI、Qwen、Runway、Together AI、xAI 等

这一步的意义不在于”能不能生成”——以前靠外挂也能做——而在于生成这件事终于被纳入了日常工作流。Agent 不再只是给你一段文字解释,它还能顺手产出封面图、配图、短视频、背景音乐,甚至把整条内容生产链路串起来。对内容创作、宣传素材制作、社媒分发、品牌资产生产而言,这是一个实质性的拐点。

四、结构化任务进度:长任务不再只有”干等”

本次更新引入了实验性的 Structured Task Progress(结构化任务进度)功能。此前 Agent 执行复杂任务时,用户往往只能看到两种状态——没反应,或者突然回一大段。中间拆了几步、卡在哪里,完全不可知。

现在 OpenClaw 开始支持结构化的计划更新和执行事件,UI 中可以明确显示任务的分步进度。对多步工作流(自动化网页操作、多文件生成与修改、长链路调研、多节点协作、复杂代码任务等)而言,这种透明度比”再多一个花哨功能”更有价值。

六、12种语言本地化:用户门槛真正在降

Control UI 和官方文档同步补齐了12种语言支持:简体中文、繁体中文、巴西葡萄牙语、德语、西班牙语、日语、韩语、法语、土耳其语、印度尼西亚语、波兰语、乌克兰语。

对中文用户来说,这波更新的实际价值很大——上手门槛明显往下掉了。

八、升级建议

如果你已经在使用 OpenClaw,建议升级后立刻做三件事:

  1. 运行 openclaw doctor --fix,先迁移旧配置
  2. 开启 /dreaming on,体验记忆巩固链路
  3. 让 Agent 直接生成一段视频或音乐,感受多媒体能力的推进程度

本文基于 OpenClaw 官方发布公告及腾讯新闻、CSDN、今日头条等多源报道整理。

分享到: QQ 微博