返回顶部
w

web-extractor

使用 jina.ai 提取网页干净文本并让 Agent 总结。触发词:提取网页、总结新闻、提取文章、获取页面内容

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
227
下载量
1
收藏
概述
安装方式
版本历史

web-extractor

# 网页内容提取技能 使用 r.jina.ai 提取网页干净文本,过滤垃圾代码,提取干货内容。 ## 工作流程 ### 1. 提取网页内容 ```bash # 提取网页并保存为 md 文件 curl -s https://r.jina.ai/<URL> > /tmp/web-content.md ``` ### 2. 读取并总结 让 Agent 读取生成的 md 文件,总结核心观点。 ## 使用示例 **用户说:"帮我总结这个新闻 https://www.bbc.com/news/tech..."** 执行: ```bash curl -s "https://r.jina.ai/https://www.bbc.com/news/technology-xxx" > /tmp/news.md ``` 然后读取 /tmp/news.md 文件内容,分析并总结。 ## 注意事项 - r.jina.ai 会过滤掉 script、nav、广告 CSS 等垃圾代码 - 提取后是极干净的纯文本,对 AI 零负担 - 支持任何新闻网站、技术博客、文章页面 - 文件默认保存到 /tmp/ 目录,可自定义路径

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 web-extractor-1776119341 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 web-extractor-1776119341 技能

通过命令行安装

skillhub install web-extractor-1776119341

下载 Zip 包

⬇ 下载 web-extractor v1.0.0

文件大小: 1.25 KB | 发布时间: 2026-4-14 10:20

v1.0.0 最新 2026-4-14 10:20
- Initial release of web-extractor skill.
- Extracts clean text from web pages using r.jina.ai, removing scripts, navigation, ads, and unnecessary CSS.
- Allows easy summarization of core content by the Agent.
- Supports extracting from any news site, tech blog, or article page.
- Saved content is in pure text format for optimal AI processing.
- Default output path is /tmp/, with customizable file locations.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部