OpenClaw v2026.4.5版本更新,集成视频音乐生成能力,支持多语言控制界面
OpenClaw v2026.4.5 版本更新,集成视频音乐生成能力,支持多语言控制界面。
OpenClaw 发布 v2026.4.5 版本,这是该项目正式定名后的首次重大更新。版本号采用日期格式,表明团队正加速迭代。此次更新引入了视频生成和音乐生成工具,新增 Qwen、Fireworks AI、StepFun 等多个模型提供商支持,并为控制界面添加了包含简体中文在内的 12 种语言本地化。
内置视频与音乐生成工具
新版本最大的亮点是加入了 `video_generate` 和 `music_generate` 两个内置工具。Agent 现在可以直接调用配置好的视频生成提供商,在回复中直接返回生成的媒体内容。视频生成方面集成了 xAI 的 Grok Imagine Video、阿里云 Model Studio 的 Wan 模型,以及 Runway 三个提供商,均有对应的首选模型配置。音乐生成则捆绑了 Google Lyria 和 MiniMax 提供商,并支持基于 ComfyUI 工作流的音频生成,具备异步任务追踪和后续交付能力。
ComfyUI 插件的加入让本地和云端工作流都能接入 OpenClaw。这个捆绑的 `comfy` 媒体插件支持图像、视频、音乐三类生成,带有提示词注入、参考图上传、实时测试和输出下载功能。对于已经在本地部署 ComfyUI 的用户来说,可以直接复用现有工作流。
多模型提供商扩展
模型生态方面,v2026.4.5 新增了对 Qwen、Fireworks AI、StepFun 的支持,并补充了 MiniMax TTS、Ollama Web Search 和 MiniMax Search 集成。这些捆绑式提供商覆盖了聊天、语音、搜索三大场景,用户无需额外配置即可快速切换。
Amazon Bedrock 也得到了增强。新版本加入了 Mantle 支持和推理配置自动发现功能,能够自动注入请求区域。这意味着 Bedrock 托管的 Claude、GPT-OSS、Qwen、Kimi、GLM 等模型路由可以更少地依赖手动设置。AWS 凭证链自动检测让 `provider: “auto”` 配置真正可用。
控制界面多语言化
控制界面的本地化是此次更新的另一个重点。OpenClaw 现在支持简体中文、繁体中文、巴西葡萄牙语、德语、西班牙语、日语、韩语、法语、土耳其语、印尼语、波兰语和乌克兰语,共 12 种语言。这一改进降低了非英语用户的使用门槛。
此外,Skills 面板新增了 ClawHub 搜索、详情查看和安装流程,用户可以直接在界面内发现和安装技能包,无需跳转到命令行。
安全与配置清理
v2026.4.5 包含一项破坏性变更:移除了 `talk.voiceId` / `talk.apiKey`、`agents.*.sandbox.perSession`、`browser.ssrfPolicy.allowPrivateNetwork` 等旧配置别名。这些别名在加载时仍会兼容,`openclaw doctor –fix` 也提供迁移支持,但建议用户尽快切换到规范的配置路径。
iOS 和 Matrix 渠道新增了执行审批的原生通知支持。iOS 端通过 APNs 推送审批请求,Matrix 则支持账户级审批者和频道/私信投递。这些改进让敏感操作的审批流程更顺畅。
记忆系统增强
实验性的 Dreaming 记忆系统迎来了大幅更新。新版本引入了加权短期记忆提升、多语言概念标签、可配置的衰退控制,以及三阶段协作模式(浅层、深层、REM)。记忆内容现在写入顶层的 `dreams.md` 而非日常记忆笔记,方便显式读取。配套的 Dream Diary 界面和 `/dreaming` 命令让用户能更直观地查看和管理长期记忆的形成过程。
版本发布页显示,macOS 安装包约 19.8MB,Windows 和通用 zip 包约 25MB。从创建到发布仅用了不到一小时,团队迭代效率可见一斑。