跳转到内容

Carry Code v0.7.5

发布日期: 2026年3月12日
版本号: 0.7.5
提交数量: 自 v0.7.4 以来 121 个 commits


1. 🌐 浏览器自动化工具 (core_browser)

Section titled “1. 🌐 浏览器自动化工具 (core_browser)”

强大的内置网页自动化工具,让 AI 能够与网页交互:

操作描述
navigate带策略验证导航到 URL
click与页面元素交互
type在表单字段中输入文本
extract从页面提取结构化内容
screenshot截取页面截图
evaluate在页面上下文中执行 JavaScript
trace_start/trace_stop记录交互跟踪
close清理浏览器会话

主要特性:

  • 会话池管理: 支持多会话和自动清理
  • URL 策略验证: 可配置的域名白名单和协议拦截
  • 无需确认: 浏览器操作流程简化
  • 完整测试覆盖: 全面的测试套件确保可靠性

2. 🔍 SkillHub 集成 (/skill find-skills)

Section titled “2. 🔍 SkillHub 集成 (/skill find-skills)”

从 Tencent SkillHub 发现和安装技能:

Terminal window
# 搜索技能
/skill find-skills 天气
  • 关键词搜索: 按名称或描述查找技能
  • 最近搜索历史: 快速访问过去的搜索
  • 结构化结果: 解析和格式化的技能信息
  • 一键安装: 直接从搜索结果安装
  • 增强提示: 改进的搜索指导和建议

用于快速初始化项目并配置 AGENTS.md 的新命令:

Terminal window
/init

功能特性

  • 自动检测项目类型 — 自动识别项目框架和编程语言
  • 生成项目专属规则 — 根据项目类型创建定制化的 AGENTS.md
  • 快速设置 — 一键初始化,保持项目标准一致性

支持的项目类型

  • TypeScript/JavaScript 项目
  • Python 项目
  • Rust 项目
  • Go 项目
  • 更多…

4. ❓ /help 命令 - 交互式命令指南

Section titled “4. ❓ /help 命令 - 交互式命令指南”

全面的内置斜杠命令帮助系统:

Terminal window
/help

功能特性

  • 按功能分类 — 命令按会话、工具、设置等类别组织
  • 上下文感知建议 — 根据当前上下文智能推荐
  • 完整国际化支持 — 支持中文和英文
  • 详细示例 — 每个命令都提供实用示例

5. 🔄 /agent 命令 - 快速模式切换

Section titled “5. 🔄 /agent 命令 - 快速模式切换”

在 Agent 工作模式间即时切换:

Terminal window
/agent

模式

  • Plan 模式 — 架构和规划任务(只读分析)
  • Build 模式 — 实现和编码任务(读写执行)

使用场景

  • 快速在分析和实现之间切换
  • 在 Plan 模式下安全探索后再进行修改
  • 无需手动选择,简化工作流程

全面的 Token 追踪和预算管理系统:

  • 输入 Token 估算: 发送请求前准确预测 Token 使用量
  • 上下文预算追踪: 实时监控上下文窗口利用率
  • 缓存内容支持: 正确处理 Gemini 和 Ollama 的缓存 Token
  • 调用级统计: 使用 derive_call_scoped_stats 提供详细的每次请求 Token 指标
  • 智能压缩触发: 基于 Token 阈值自动触发上下文压缩
  • 预算快照: 记录和追踪压缩预算决策

显示改进:

  • ProcessArea 中显示预估 Token 前缀(例如 “~1.2K tokens”)
  • 实时输入/输出 Token 分解
  • 空闲时优化的统计信息获取,提升性能

完全重新设计的工具结果可视化:

  • 结构化工具日志: 所有工具清晰一致的格式
  • 时长摘要: 显示每次操作的执行时间
  • 输入/输出摘要:
    • 截断至前 5 行以提高可读性
    • 长文件路径使用中间省略截断
    • 300 字符摘要限制
  • Markdown 渲染: 带有语法高亮的丰富格式
  • 键路径清理: 在 markdown 自动链接中安全显示路径

工具特定增强:

  • CoreFetch: 带 HTTP 错误处理的时长和输出摘要
  • CoreBash: 输入摘要截断、stdout/stderr 过滤
  • MCP 工具: 具有一致输入详细信息的显示格式

直接在终端中查看 Mermaid 图表:

  • 终端原生渲染: 基于 ASCII 的图表,无需浏览器
  • 中文字符支持: 针对 CJK 字符优化对齐
  • 智能布局处理: 动态宽度管理和标签保留
  • 优雅回退: 渲染失败时回退到纯文本
  • 精美主题: 终端配色方案集成

mermaid

高级会话管理能力:

  • 用户回合检查点: 用户交互时自动创建检查点
  • 回滚机制: 回退到任何之前的检查点状态
  • 会话快照:
    • 紧凑、节省空间的存储
    • 保留提供商和模型元数据
    • 源/目标修订版本追踪
  • 软删除恢复: 重新激活之前清除的会话
  • 异步审批: 非阻塞的审批模式处理

智能终端主题:

  • 背景色检测: 自动检测浅色/深色主题
  • OSC 序列支持: 使用终端转义序列进行检测
  • 主题适配: UI 组件适配终端背景
  • 状态保留: 检测期间保持暂停状态

  • 新的 summary 语法: 操作摘要的专门高亮
  • 词边界换行: 改进长行可读性
  • 注释颜色区分: 注释与基础文本的独立样式
  • 纯文本处理: 更好的纯文本输出支持
  • 正则高亮器: 增强多种语言的语法高亮
  • 重构的参数解析: 更强大的 CLI 命令处理
  • 新命令: helpversiononceupdate 功能完整
  • 快速入门指南: 内置结构化快捷键帮助
  • i18n 支持: CLI 消息的完整本地化
  • 增强的订阅管理: 更好的事件监听器处理
  • 错误追踪: 改进的错误传播和日志记录
  • 元数据更新: 无需完全重载即可更新会话元数据
  • 消息追加: 无需重新渲染即可高效添加消息
  • 简化配置: 移除 ui_model_nameapi_model_name 字段
  • 提供商信息: 会话中增强的提供商/模型追踪
  • 用量提取: 改进 Ollama 的 Token 用量解析

  • Bash 工具: 简化命令禁止逻辑,使用自定义错误处理增强语法验证
  • Browser 工具: 移除命令确认要求,工作流程更流畅
  • 延迟显示: 更简洁的输出,不显示 providerId
  • 工具检测: 简化 RichArea 组件中的逻辑
  • 响应摘要: 摘要中包含文件计数和行范围
  • 会话稳定性: 改进快照处理的测试稳定性

  • 添加 beautiful-mermaid 用于图表渲染
  • 更新 Playwright 和 Puppeteer 到最新版本
  • 通过 20+ 新测试文件增强测试基础设施

  • CI/CD: 定时清理工作流,清理旧工件和缓存
  • 测试覆盖: 全面的测试,包括:
    • 浏览器自动化
    • Token 估算
    • 工具结果格式化
    • Mermaid 渲染
    • 会话管理
  • 代码质量: 重构核心模块以提高可维护性
  • 文档: 更新 AGENTS.md 和 SKILL.md,提供更清晰的说明

Terminal window
# 使用安装脚本
curl -fsSL https://carrycode.ai/install.sh | bash
# 或 Windows 版本
irm https://carrycode.ai/install.ps1 | iex
carry/0.7.5
carry --version

感谢所有为本版本做出贡献的开发者!特别感谢在浏览器自动化、SkillHub 集成、斜杠命令和 Token 管理方面的广泛工作。


祝您使用 Carry Code v0.7.5 编码愉快!🎉