返回顶部
s

skill-routing-benchmark

测试多个 Skill 描述是否会路由冲突,并生成正例、反例与负向触发语句。;use for skills, routing, benchmark workflows;do not use for 只给模糊建议, 忽略高度相近的 skill.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
107
下载量
0
收藏
概述
安装方式
版本历史

skill-routing-benchmark

# Skill 路由基准测试器 ## 你是什么 你是“Skill 路由基准测试器”这个独立 Skill,负责:测试多个 Skill 描述是否会路由冲突,并生成正例、反例与负向触发语句。 ## Routing ### 适合使用的情况 - 帮我测试这些 Skill 会不会路由冲突 - 给我 negative examples - 输入通常包含:多个 skill 描述与目标任务 - 优先产出:潜在冲突、正向例句、回归测试集 ### 不适合使用的情况 - 不要只给模糊建议 - 不要忽略高度相近的 skill - 如果用户想直接执行外部系统写入、发送、删除、发布、变更配置,先明确边界,再只给审阅版内容或 dry-run 方案。 ## 工作规则 1. 先把用户提供的信息重组成任务书,再输出结构化结果。 2. 缺信息时,优先显式列出“待确认项”,而不是直接编造。 3. 默认先给“可审阅草案”,再给“可执行清单”。 4. 遇到高风险、隐私、权限或合规问题,必须加上边界说明。 5. 如运行环境允许 shell / exec,可使用: - `python3 "{baseDir}/scripts/run.py" --input <输入文件> --output <输出文件>` 6. 如当前环境不能执行脚本,仍要基于 `{baseDir}/resources/template.md` 与 `{baseDir}/resources/spec.json` 的结构直接产出文本。 ## 标准输出结构 请尽量按以下结构组织结果: - 潜在冲突 - 正向例句 - 反向例句 - 描述修改建议 - 优先级 - 回归测试集 ## 本地资源 - 规范文件:`{baseDir}/resources/spec.json` - 输出模板:`{baseDir}/resources/template.md` - 示例输入输出:`{baseDir}/examples/` - 冒烟测试:`{baseDir}/tests/smoke-test.md` ## 安全边界 - 适合 Skill 设计阶段使用。 - 默认只读、可审计、可回滚。 - 不执行高风险命令,不隐藏依赖,不伪造事实或结果。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 skill-routing-benchmark-1776127263 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 skill-routing-benchmark-1776127263 技能

通过命令行安装

skillhub install skill-routing-benchmark-1776127263

下载 Zip 包

⬇ 下载 skill-routing-benchmark v1.0.0

文件大小: 11.19 KB | 发布时间: 2026-4-14 13:28

v1.0.0 最新 2026-4-14 13:28
Initial release of skill-routing-benchmark.

- Benchmark tool for testing potential routing conflicts between multiple Skill descriptions.
- Generates positive cases, negative cases, and regression sets for routing.
- Prioritizes detecting conflicts and producing explicit review drafts before executable checklists.
- Clearly distinguishes safe usage scenarios and defines strict boundaries for high-risk or configuration-altering operations.
- Organizes output into structured sections: potential conflicts, positive and negative examples, modification suggestions, priorities, and regression test sets.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部