返回顶部
s

smart-web-fetch-safe

安全版智能网页内容获取技能。本地解析 + 可选远程清洗,隐私优先,Token 优化。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
311
下载量
0
收藏
概述
安装方式
版本历史

smart-web-fetch-safe

# Smart Web Fetch Safe 安全版智能网页内容获取技能,隐私优先,支持本地解析和远程清洗两种模式。 ## 核心功能 - **本地解析默认**: 使用本地 HTML 解析,隐私安全 - **可选远程清洗**: 用户可选择使用 Jina Reader 远程服务 - **Token 优化**: 自动去除广告、导航栏等噪音内容 - **域名白名单**: 可配置允许访问的域名列表 - **字符数限制**: 内置最大字符数限制,避免超长输出 ## 安全特性 ⚠️ **隐私提示**: - 本地解析模式:数据完全保留在本地,隐私安全 - 远程清洗模式:URL 和内容会经过 Jina AI 服务处理 ## 使用方式 ### 命令行 ```bash # 本地解析模式(默认,隐私安全) python3 skills/smart-web-fetch-safe/scripts/fetch.py "https://example.com/article" # 远程清洗模式(更节省 Token,但数据经过第三方) python3 skills/smart-web-fetch-safe/scripts/fetch.py "https://example.com/article" --remote # 指定最大字符数 python3 skills/smart-web-fetch-safe/scripts/fetch.py "https://example.com/article" --max-chars 5000 # 组合使用 python3 skills/smart-web-fetch-safe/scripts/fetch.py "https://example.com/article" --remote --max-chars 3000 ``` ### JSON 输出 ```bash python3 skills/smart-web-fetch-safe/scripts/fetch.py "https://example.com/article" --json ``` ## 配置说明 ### 环境变量(可选) | 变量 | 默认值 | 说明 | |------|--------|------| | ALLOWED_DOMAINS | * | 允许访问的域名,用逗号分隔 | | MAX_CHARS | 10000 | 最大返回字符数 | | DEFAULT_MODE | local | 默认模式:local(本地)或 remote(远程) | ### 白名单示例 ```bash export ALLOWED_DOMAINS="example.com,github.com,wikipedia.org" export MAX_CHARS=5000 export DEFAULT_MODE=local ``` ## 模式对比 | 特性 | 本地解析 (local) | 远程清洗 (remote) | |------|------------------|-------------------| | 隐私 | ✅ 完全本地 | ⚠️ 数据经第三方 | | Token 优化 | ✅ 基础优化 | ✅ 深度优化 50-80% | | 速度 | 较快 | 依赖网络 | | 依赖 | beautifulsoup4, requests | 无额外依赖 | ## 安装依赖 ```bash pip install beautifulsoup4 requests ``` ## 当前状态 开发中。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 smart-web-fetch-safe-1776115347 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 smart-web-fetch-safe-1776115347 技能

通过命令行安装

skillhub install smart-web-fetch-safe-1776115347

下载 Zip 包

⬇ 下载 smart-web-fetch-safe v1.0.0

文件大小: 4.34 KB | 发布时间: 2026-4-14 14:36

v1.0.0 最新 2026-4-14 14:36
Initial release of smart-web-fetch-safe:

- Provides secure web content fetching with local HTML parsing as default for privacy.
- Supports optional remote cleaning using Jina Reader for deeper content optimization.
- Implements automatic noise removal (ads, navbars), token usage optimization, and max character limits.
- Includes configurable domain whitelist for controlled access.
- Offers both command-line and JSON-output modes; flexible configuration via environment variables.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部