返回顶部
s

speech-recognition-local

本地语音转文字 / Local Speech-to-Text. 使用 faster-whisper 在本地运行 Whisper 模型,无需 API 费用,完全免费。收到语音消息(.ogg .m4a .mp3)自动触发转录,支持中文/英文/日语/自动检测。| Free local STT/TTS alternative — runs Whisper on your machine, no API costs, auto-transcribes voice messages in seconds.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.3
安全检测
已通过
202
下载量
0
收藏
概述
安装方式
版本历史

speech-recognition-local

# 本地语音识别 / Local Speech Recognition > 使用 faster-whisper 在本地运行 Whisper 模型,无需任何 API 费用。免费、离线、保护隐私。 > Runs faster-whisper locally — no API keys, no costs, fully offline & private. --- ## 功能特点 / Features - 🎙️ **全自动转录** — 收到语音消息自动触发,无需手动调用 - 💰 **完全免费** — 无需 API key,无任何费用 - 🔒 **隐私安全** — 所有处理在本地完成,音频不离开你的设备 - 🌐 **多语言支持** — 中文 / 英文 / 日语 / 自动检测 - ⚡ **快速响应** — VAD 静音过滤,模型内存缓存 - 📦 **主流格式** — .ogg .m4a .mp3 .wav --- ## 使用方式 / Usage 收到语音消息后,OpenClaw 自动调用转录脚本并将结果注入对话。 **转录命令 / Command:** ```bash python3 ~/.openclaw/workspace/skills/speech-recognition-local/scripts/transcribe.py <audio_file> [language] ``` **参数说明 / Parameters:** | 参数 | 默认值 | 说明 | |------|--------|------| | `audio_file` | — | 音频文件路径 / Audio file path | | `language` | `auto` | 语言:zh / en / ja / auto(默认自动检测) | --- ## 模型说明 / Model Info - 默认模型 / Default: `base`(精度与速度平衡) - 首次使用自动下载 / Auto-download on first use - VAD 静音过滤已启用 / VAD filtering enabled - 模型缓存在内存中 / Model cached in memory --- ## 适用场景 / Use Cases | 场景 / Scenario | 说明 | |----------------|------| | 语音消息转文字 | 将微信/飞书/Telegram 语音转为可阅读文本 | | 会议记录 | 录制音频后快速转录存档 | | 播客字幕 | 将音频文件批量转为文字稿 | | 隐私敏感场景 | 不希望音频数据上传第三方 | --- ## 限制 / Limitations - 支持格式 / Supported: `.ogg` `.m4a` `.mp3` `.wav` - 文件大小 / Max size: 25MB --- ## 安装前提 / Requirements - Python 3.8+ - faster-whisper(首次使用自动安装)

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 speech-recognition-local-1776101643 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 speech-recognition-local-1776101643 技能

通过命令行安装

skillhub install speech-recognition-local-1776101643

下载 Zip 包

⬇ 下载 speech-recognition-local v1.0.3

文件大小: 3.38 KB | 发布时间: 2026-4-14 13:15

v1.0.3 最新 2026-4-14 13:15
Fix English recognition: default to auto language detection, increase beam_size to 5 for better accuracy

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部