Carry Code v0.7.5
发布日期: 2026年3月12日
版本号: 0.7.5
提交数量: 自 v0.7.4 以来 121 个 commits
✨ 主要新功能
Section titled “✨ 主要新功能”1. 🌐 浏览器自动化工具 (core_browser)
Section titled “1. 🌐 浏览器自动化工具 (core_browser)”强大的内置网页自动化工具,让 AI 能够与网页交互:
| 操作 | 描述 |
|---|---|
navigate | 带策略验证导航到 URL |
click | 与页面元素交互 |
type | 在表单字段中输入文本 |
extract | 从页面提取结构化内容 |
screenshot | 截取页面截图 |
evaluate | 在页面上下文中执行 JavaScript |
trace_start/trace_stop | 记录交互跟踪 |
close | 清理浏览器会话 |
主要特性:
- 会话池管理: 支持多会话和自动清理
- URL 策略验证: 可配置的域名白名单和协议拦截
- 无需确认: 浏览器操作流程简化
- 完整测试覆盖: 全面的测试套件确保可靠性
2. 🔍 SkillHub 集成 (/skill find-skills)
Section titled “2. 🔍 SkillHub 集成 (/skill find-skills)”从 Tencent SkillHub 发现和安装技能:
# 搜索技能/skill find-skills 天气- 关键词搜索: 按名称或描述查找技能
- 最近搜索历史: 快速访问过去的搜索
- 结构化结果: 解析和格式化的技能信息
- 一键安装: 直接从搜索结果安装
- 增强提示: 改进的搜索指导和建议
3. 🚀 /init 命令 - 项目初始化
Section titled “3. 🚀 /init 命令 - 项目初始化”用于快速初始化项目并配置 AGENTS.md 的新命令:
/init功能特性:
- 自动检测项目类型 — 自动识别项目框架和编程语言
- 生成项目专属规则 — 根据项目类型创建定制化的 AGENTS.md
- 快速设置 — 一键初始化,保持项目标准一致性
支持的项目类型:
- TypeScript/JavaScript 项目
- Python 项目
- Rust 项目
- Go 项目
- 更多…
4. ❓ /help 命令 - 交互式命令指南
Section titled “4. ❓ /help 命令 - 交互式命令指南”全面的内置斜杠命令帮助系统:
/help功能特性:
- 按功能分类 — 命令按会话、工具、设置等类别组织
- 上下文感知建议 — 根据当前上下文智能推荐
- 完整国际化支持 — 支持中文和英文
- 详细示例 — 每个命令都提供实用示例
5. 🔄 /agent 命令 - 快速模式切换
Section titled “5. 🔄 /agent 命令 - 快速模式切换”在 Agent 工作模式间即时切换:
/agent模式:
- Plan 模式 — 架构和规划任务(只读分析)
- Build 模式 — 实现和编码任务(读写执行)
使用场景:
- 快速在分析和实现之间切换
- 在 Plan 模式下安全探索后再进行修改
- 无需手动选择,简化工作流程
6. 📊 Token 预算管理与统计
Section titled “6. 📊 Token 预算管理与统计”全面的 Token 追踪和预算管理系统:
- 输入 Token 估算: 发送请求前准确预测 Token 使用量
- 上下文预算追踪: 实时监控上下文窗口利用率
- 缓存内容支持: 正确处理 Gemini 和 Ollama 的缓存 Token
- 调用级统计: 使用
derive_call_scoped_stats提供详细的每次请求 Token 指标 - 智能压缩触发: 基于 Token 阈值自动触发上下文压缩
- 预算快照: 记录和追踪压缩预算决策
显示改进:
- ProcessArea 中显示预估 Token 前缀(例如 “~1.2K tokens”)
- 实时输入/输出 Token 分解
- 空闲时优化的统计信息获取,提升性能
7. 🛠️ 增强的工具调用显示
Section titled “7. 🛠️ 增强的工具调用显示”完全重新设计的工具结果可视化:
- 结构化工具日志: 所有工具清晰一致的格式
- 时长摘要: 显示每次操作的执行时间
- 输入/输出摘要:
- 截断至前 5 行以提高可读性
- 长文件路径使用中间省略截断
- 300 字符摘要限制
- Markdown 渲染: 带有语法高亮的丰富格式
- 键路径清理: 在 markdown 自动链接中安全显示路径
工具特定增强:
- CoreFetch: 带 HTTP 错误处理的时长和输出摘要
- CoreBash: 输入摘要截断、stdout/stderr 过滤
- MCP 工具: 具有一致输入详细信息的显示格式
8. 📈 Mermaid 图表终端渲染
Section titled “8. 📈 Mermaid 图表终端渲染”直接在终端中查看 Mermaid 图表:
- 终端原生渲染: 基于 ASCII 的图表,无需浏览器
- 中文字符支持: 针对 CJK 字符优化对齐
- 智能布局处理: 动态宽度管理和标签保留
- 优雅回退: 渲染失败时回退到纯文本
- 精美主题: 终端配色方案集成

9. 🔄 会话检查点与回滚
Section titled “9. 🔄 会话检查点与回滚”高级会话管理能力:
- 用户回合检查点: 用户交互时自动创建检查点
- 回滚机制: 回退到任何之前的检查点状态
- 会话快照:
- 紧凑、节省空间的存储
- 保留提供商和模型元数据
- 源/目标修订版本追踪
- 软删除恢复: 重新激活之前清除的会话
- 异步审批: 非阻塞的审批模式处理
10. 🎨 终端背景检测
Section titled “10. 🎨 终端背景检测”智能终端主题:
- 背景色检测: 自动检测浅色/深色主题
- OSC 序列支持: 使用终端转义序列进行检测
- 主题适配: UI 组件适配终端背景
- 状态保留: 检测期间保持暂停状态
🔧 其他增强
Section titled “🔧 其他增强”代码高亮与渲染
Section titled “代码高亮与渲染”- 新的
summary语法: 操作摘要的专门高亮 - 词边界换行: 改进长行可读性
- 注释颜色区分: 注释与基础文本的独立样式
- 纯文本处理: 更好的纯文本输出支持
- 正则高亮器: 增强多种语言的语法高亮
CLI 改进
Section titled “CLI 改进”- 重构的参数解析: 更强大的 CLI 命令处理
- 新命令:
help、version、once、update功能完整 - 快速入门指南: 内置结构化快捷键帮助
- i18n 支持: CLI 消息的完整本地化
会话事件处理
Section titled “会话事件处理”- 增强的订阅管理: 更好的事件监听器处理
- 错误追踪: 改进的错误传播和日志记录
- 元数据更新: 无需完全重载即可更新会话元数据
- 消息追加: 无需重新渲染即可高效添加消息
- 简化配置: 移除
ui_model_name和api_model_name字段 - 提供商信息: 会话中增强的提供商/模型追踪
- 用量提取: 改进 Ollama 的 Token 用量解析
🐛 修复与改进
Section titled “🐛 修复与改进”- Bash 工具: 简化命令禁止逻辑,使用自定义错误处理增强语法验证
- Browser 工具: 移除命令确认要求,工作流程更流畅
- 延迟显示: 更简洁的输出,不显示 providerId
- 工具检测: 简化 RichArea 组件中的逻辑
- 响应摘要: 摘要中包含文件计数和行范围
- 会话稳定性: 改进快照处理的测试稳定性
📦 依赖更新
Section titled “📦 依赖更新”- 添加
beautiful-mermaid用于图表渲染 - 更新 Playwright 和 Puppeteer 到最新版本
- 通过 20+ 新测试文件增强测试基础设施
📝 开发者更新
Section titled “📝 开发者更新”- CI/CD: 定时清理工作流,清理旧工件和缓存
- 测试覆盖: 全面的测试,包括:
- 浏览器自动化
- Token 估算
- 工具结果格式化
- Mermaid 渲染
- 会话管理
- 代码质量: 重构核心模块以提高可维护性
- 文档: 更新 AGENTS.md 和 SKILL.md,提供更清晰的说明
🎯 升级指南
Section titled “🎯 升级指南”# 使用安装脚本curl -fsSL https://carrycode.ai/install.sh | bash
# 或 Windows 版本irm https://carrycode.ai/install.ps1 | iexcarry --version感谢所有为本版本做出贡献的开发者!特别感谢在浏览器自动化、SkillHub 集成、斜杠命令和 Token 管理方面的广泛工作。
祝您使用 Carry Code v0.7.5 编码愉快!🎉