Carry Code v0.7.5

发布日期: 2026年3月12日
版本号: 0.7.5
提交数量: 自 v0.7.4 以来 121 个 commits

✨ 主要新功能

1. 🌐 浏览器自动化工具 (`core_browser`)

强大的内置网页自动化工具，让 AI 能够与网页交互：

操作	描述
`navigate`	带策略验证导航到 URL
`click`	与页面元素交互
`type`	在表单字段中输入文本
`extract`	从页面提取结构化内容
`screenshot`	截取页面截图
`evaluate`	在页面上下文中执行 JavaScript
`trace_start/trace_stop`	记录交互跟踪
`close`	清理浏览器会话

主要特性:

会话池管理: 支持多会话和自动清理
URL 策略验证: 可配置的域名白名单和协议拦截
无需确认: 浏览器操作流程简化
完整测试覆盖: 全面的测试套件确保可靠性

2. 🔍 SkillHub 集成 (`/skill find-skills`)

从 Tencent SkillHub 发现和安装技能：

# 搜索技能
/skill find-skills 天气

关键词搜索: 按名称或描述查找技能
最近搜索历史: 快速访问过去的搜索
结构化结果: 解析和格式化的技能信息
一键安装: 直接从搜索结果安装
增强提示: 改进的搜索指导和建议

3. 🚀 `/init` 命令 - 项目初始化

用于快速初始化项目并配置 AGENTS.md 的新命令：

/init

功能特性：

自动检测项目类型 — 自动识别项目框架和编程语言
生成项目专属规则 — 根据项目类型创建定制化的 AGENTS.md
快速设置 — 一键初始化，保持项目标准一致性

支持的项目类型：

TypeScript/JavaScript 项目
Python 项目
Rust 项目
Go 项目
更多…

4. ❓ `/help` 命令 - 交互式命令指南

全面的内置斜杠命令帮助系统：

/help

功能特性：

按功能分类 — 命令按会话、工具、设置等类别组织
上下文感知建议 — 根据当前上下文智能推荐
完整国际化支持 — 支持中文和英文
详细示例 — 每个命令都提供实用示例

5. 🔄 `/agent` 命令 - 快速模式切换

在 Agent 工作模式间即时切换：

/agent

模式：

Plan 模式 — 架构和规划任务（只读分析）
Build 模式 — 实现和编码任务（读写执行）

使用场景：

快速在分析和实现之间切换
在 Plan 模式下安全探索后再进行修改
无需手动选择，简化工作流程

6. 📊 Token 预算管理与统计

全面的 Token 追踪和预算管理系统：

输入 Token 估算: 发送请求前准确预测 Token 使用量
上下文预算追踪: 实时监控上下文窗口利用率
缓存内容支持: 正确处理 Gemini 和 Ollama 的缓存 Token
调用级统计: 使用 derive_call_scoped_stats 提供详细的每次请求 Token 指标
智能压缩触发: 基于 Token 阈值自动触发上下文压缩
预算快照: 记录和追踪压缩预算决策

显示改进:

ProcessArea 中显示预估 Token 前缀（例如 “~1.2K tokens”）
实时输入/输出 Token 分解
空闲时优化的统计信息获取，提升性能

7. 🛠️ 增强的工具调用显示

完全重新设计的工具结果可视化：

结构化工具日志: 所有工具清晰一致的格式
时长摘要: 显示每次操作的执行时间
输入/输出摘要:
- 截断至前 5 行以提高可读性
- 长文件路径使用中间省略截断
- 300 字符摘要限制
Markdown 渲染: 带有语法高亮的丰富格式
键路径清理: 在 markdown 自动链接中安全显示路径

工具特定增强:

CoreFetch: 带 HTTP 错误处理的时长和输出摘要
CoreBash: 输入摘要截断、stdout/stderr 过滤
MCP 工具: 具有一致输入详细信息的显示格式

8. 📈 Mermaid 图表终端渲染

直接在终端中查看 Mermaid 图表：

终端原生渲染: 基于 ASCII 的图表，无需浏览器
中文字符支持: 针对 CJK 字符优化对齐
智能布局处理: 动态宽度管理和标签保留
优雅回退: 渲染失败时回退到纯文本
精美主题: 终端配色方案集成

mermaid

9. 🔄 会话检查点与回滚

高级会话管理能力：

用户回合检查点: 用户交互时自动创建检查点
回滚机制: 回退到任何之前的检查点状态
会话快照:
- 紧凑、节省空间的存储
- 保留提供商和模型元数据
- 源/目标修订版本追踪
软删除恢复: 重新激活之前清除的会话
异步审批: 非阻塞的审批模式处理

10. 🎨 终端背景检测

智能终端主题：

背景色检测: 自动检测浅色/深色主题
OSC 序列支持: 使用终端转义序列进行检测
主题适配: UI 组件适配终端背景
状态保留: 检测期间保持暂停状态

🔧 其他增强

代码高亮与渲染

新的 summary 语法: 操作摘要的专门高亮
词边界换行: 改进长行可读性
注释颜色区分: 注释与基础文本的独立样式
纯文本处理: 更好的纯文本输出支持
正则高亮器: 增强多种语言的语法高亮

CLI 改进

重构的参数解析: 更强大的 CLI 命令处理
新命令: help、version、once、update 功能完整
快速入门指南: 内置结构化快捷键帮助
i18n 支持: CLI 消息的完整本地化

会话事件处理

增强的订阅管理: 更好的事件监听器处理
错误追踪: 改进的错误传播和日志记录
元数据更新: 无需完全重载即可更新会话元数据
消息追加: 无需重新渲染即可高效添加消息

模型配置

简化配置: 移除 ui_model_name 和 api_model_name 字段
提供商信息: 会话中增强的提供商/模型追踪
用量提取: 改进 Ollama 的 Token 用量解析

🐛 修复与改进

Bash 工具: 简化命令禁止逻辑，使用自定义错误处理增强语法验证
Browser 工具: 移除命令确认要求，工作流程更流畅
延迟显示: 更简洁的输出，不显示 providerId
工具检测: 简化 RichArea 组件中的逻辑
响应摘要: 摘要中包含文件计数和行范围
会话稳定性: 改进快照处理的测试稳定性

📦 依赖更新

添加 beautiful-mermaid 用于图表渲染
更新 Playwright 和 Puppeteer 到最新版本
通过 20+ 新测试文件增强测试基础设施

📝 开发者更新

CI/CD: 定时清理工作流，清理旧工件和缓存
测试覆盖: 全面的测试，包括：
- 浏览器自动化
- Token 估算
- 工具结果格式化
- Mermaid 渲染
- 会话管理
代码质量: 重构核心模块以提高可维护性
文档: 更新 AGENTS.md 和 SKILL.md，提供更清晰的说明

🎯 升级指南

自动升级

# 使用安装脚本
curl -fsSL https://carrycode.ai/install.sh | bash

# 或 Windows 版本
irm https://carrycode.ai/install.ps1 | iex

验证安装

carry --version

🙏 致谢

感谢所有为本版本做出贡献的开发者！特别感谢在浏览器自动化、SkillHub 集成、斜杠命令和 Token 管理方面的广泛工作。

祝您使用 Carry Code v0.7.5 编码愉快！🎉