SKILL.md - 视频转录与内容优化
视频/音频转录 → 优化润色 → 多平台发布稿的完整工作流。
by artminding · published 2026-04-01
$ claw add gh:artminding/artminding-video-transcript-pro# SKILL.md - 视频转录与内容优化
视频/音频转录 → 优化润色 → 多平台发布稿的完整工作流。
**设计原则:最小化用户等待,最大化自动化。**
---
触发条件
用户请求:
---
工作流程
阶段1:前置确认(转录开始前)
**立即询问,不等转录:**
📹 已收到视频,转录前请确认以下信息:
📋 推测信息:
• 主题:[从文件名/上下文推测]
• 受众:[推测]
• 风格:知乎理性风 / 微信故事风 / 两者都要
• 输出:逐字稿 + 优化版 + 知乎文章 + 微信文章
⏱️ 3分钟无回应,我将使用上述推测自动继续。
💬 有修改请直接回复,如"主题改为xxx"或"只要知乎文章"。
🚪 您可以先离开,转录完成后我会通知您。**推测来源:**
| 来源 | 提取信息 |
|------|----------|
| 文件名 | `产品经理入门教程.mp4` → 主题:产品经理入门 |
| 用户历史偏好 | 记录在 `MEMORY.md`,如"偏好知乎理性风格" |
| 上下文对话 | 用户之前提到的主题/受众 |
| 视频元数据 | 时长、分辨率等(如有) |
**超时规则:**
---
阶段2:后台转录(用户可离开)
**默认设置:**
**执行命令:**
python transcribe_simple.py <视频文件路径> small**用户提示:**
🔄 转录中... 预计 5-15 分钟
您可以先离开,完成后我会通知您。**输出文件:** `{视频名}_转录.txt`
---
阶段3:自动优化(用户无需等待)
转录完成后,自动进行以下处理:
#### 3.1 错误识别与修正
**自动修正(高置信度):**
**记录待确认(低置信度):**
#### 3.2 文本润色
#### 3.3 知识补充(联网搜索)
#### 3.4 格式优化
#### 3.5 金句提取
**金句标准:**
| 类型 | 定义 | 示例 |
|------|------|------|
| 经验性 | 可迁移的实践智慧 | "做了十年程序员,我发现最重要的不是语言本身,而是解决问题的思路。" |
| 知识性 | 值得记忆的理论/数据 | "根据研究,人类专注力的黄金时长是25分钟,这就是番茄钟的由来。" |
| 判断性 | 独到观点或洞察 | "技术本身不会淘汰人,会用技术的人才会淘汰不会用的人。" |
**提取规则:**
#### 3.6 生成多平台文章
---
阶段4:输出 + 可审核
**输出格式:**
✅ 转录完成!已自动生成以下文件:
📁 输出文件:
• {视频名}_转录.txt(原始逐字稿)
• {视频名}_优化版.md(优化润色版)
• {视频名}_知乎.md(知乎发布稿)
• {视频名}_微信.md(微信公众号发布稿)
• {视频名}_小红书.md(小红书发布稿,极简版)
📝 自动修正的内容(如不同意请告诉我):
| 时间码 | 原文 | 修正为 | 原因 |
|--------|------|--------|------|
| [02:35] | Tensor Flow | TensorFlow | 标准拼写 |
| [05:12] | 皮托克 | PyTorch | 术语修正 |
💡 如需调整任何内容,随时告诉我。**用户可选操作:**
---
输出文件格式
优化版逐字稿
**字数对照表:**
| 音视频时长 | 字数要求 |
|-----------|---------|
| 20-30分钟 | 4500-7500字 |
| 30-60分钟 | 7500-12000字 |
| 60-90分钟 | 12000-18000字 |
| 90-120分钟 | 18000-24000字 |
| 120-150分钟 | 24000-30000字 |
| 150分钟以上 | 30000-37500字 |
**说明:** 优化版保留完整内容,字数约为原始转录的1.2-1.5倍(因添加术语解释、金句标注、背景知识等)
# {视频标题} - 优化版逐字稿
> 视频时长:XX分钟 | 主题:XXX | 受众:XXX
---
## 一、{章节标题}
[时间码起] {内容}
**关键术语**:XXX(简短解释)
{段落内容,关键词加粗}
> 💡 **金句**:{原话摘录}
---
## 二、{章节标题}
...
---
## 金句摘录
1. {金句1}
2. {金句2}
3. {金句3}
---
## 背景知识(可选)
### {术语/概念}
{详细解释,来自联网搜索}
---
*逐字稿生成时间:{日期} | 转录模型:Whisper small*知乎文章
**风格定位:** 理性 + 经验 + 科学 + 专业
**写作规范:**
**字数对照表:**
| 音视频时长 | 字数要求 |
|-----------|---------|
| 20-30分钟 | 3000-6000字 |
| 30-60分钟 | 6000-9000字 |
| 60-90分钟 | 9000-12000字 |
| 90-120分钟 | 12000-15000字 |
| 120-150分钟 | 15000-18000字 |
| 150分钟以上 | 18000-22500字 |
**配图提示词风格:**
# {标题:提问式或观点式}
{开头:提出问题/现象,100-200字}
---
## 一、{章节标题}
{正文内容}
*【配图位置】*一张关于{主题}的信息图,展示{具体内容},采用{配色}色调,简洁商务风格,适合知乎文章配图。
## 二、{章节标题}
{正文内容}
---
## 三、总结与思考
{总结 + 行动建议}
---
*本文基于视频《{视频名}》转录整理,转载请注明出处。*微信公众号文章
**风格定位:** 故事感 + 深度 + 专业
**写作规范:**
**字数对照表:**
| 音视频时长 | 字数要求 |
|-----------|---------|
| 20-30分钟 | 1200-1800字 |
| 30-60分钟 | 1800-3000字 |
| 60-90分钟 | 3000-3750字 |
| 90-120分钟 | 3750-4500字 |
| 120-150分钟 | 4500-5250字 |
| 150分钟以上 | 5250-7500字 |
**格式要求:**
**配图提示词风格:**
# {标题:场景化或情感化}
{开头:故事/场景切入,150-250字}
---
{正文第一部分}
*【配图位置】*一张{风格描述}的配图,展现{具体场景},色调{温暖/冷静/专业},适合公众号阅读氛围。
{正文第二部分}
---
## 写在最后
{升华 + 金句收尾}
---
*如果这篇文章对你有帮助,欢迎点赞、在看、转发。*小红书文章
**风格定位:** 极简 + 视觉化 + 话题标签
**写作规范:**
**字数对照表:**
| 音视频时长 | 字数要求 |
|-----------|---------|
| 20-30分钟 | 300-375字 |
| 30-60分钟 | 375-450字 |
| 60-90分钟 | 450-600字 |
| 90-120分钟 | 600-750字 |
| 120-150分钟 | 750-900字 |
| 150分钟以上 | 900-1050字 |
**格式要求:**
**配图提示词风格:**
# {标题:吸引眼球,带emoji}
{开头:一句话抓人,50字以内}
👉 **要点一:{标题}**
{内容,1-2句话}
👉 **要点二:{标题}**
{内容,1-2句话}
👉 **要点三:{标题}**
{内容,1-2句话}
---
💡 **一句话总结**:{核心观点,20字以内}
👇 你怎么看?评论区聊聊~
#{话题标签1} #{话题标签2} #{话题标签3}---
输出文件汇总
| 文件名 | 内容 | 格式 |
|--------|------|------|
| `{视频名}_转录.txt` | 原始逐字稿(带时间码) | TXT |
| `{视频名}_优化版.md` | 优化润色版逐字稿 | Markdown |
| `{视频名}_知乎.md` | 知乎平台发布稿 | Markdown |
| `{视频名}_微信.md` | 微信公众号发布稿 | Markdown |
| `{视频名}_小红书.md` | 小红书发布稿(极简版) | Markdown |
---
自动化规则
| 环节 | 自动处理 | 需用户确认 |
|------|----------|------------|
| 背景信息 | 推测 + 3分钟超时默认 | 用户在线时可修改 |
| 错误修正 | 高置信度自动修正 | 低置信度列表展示 |
| 知识补充 | 自动联网搜索 | 无需确认 |
| 金句提取 | 自动提取 | 无需确认 |
| 文章生成 | 自动生成 | 用户可要求修改 |
---
错误修正置信度规则
**高置信度(自动修正,不询问):**
**低置信度(列表展示,供审核):**
---
注意事项
1. **时间码精度**:保留秒级精度,格式 `[MM:SS]`
2. **保留原意**:润色时不得改变说话者原意
3. **敏感内容**:如涉及敏感话题,提醒用户注意发布平台规则
4. **版权提醒**:衍生文章发布时注明原始视频来源
5. **用户偏好记忆**:将用户偏好记录到 `MEMORY.md`,下次自动应用
---
示例交互
用户:帮我转录这个视频:产品经理入门教程.mp4
助理:📹 已收到视频,转录前请确认以下信息:
📋 推测信息:
• 主题:产品经理入门
• 受众:产品经理新人/转行者
• 风格:知乎 + 微信(两者都要)
• 输出:逐字稿 + 优化版 + 知乎文章 + 微信文章
⏱️ 3分钟无回应,我将使用上述推测自动继续。
💬 有修改请直接回复,如"主题改为xxx"或"只要知乎文章"。
🚪 您可以先离开,转录完成后我会通知您。
🔄 正在启动转录...
[用户离开]
[5分钟后转录完成,自动优化]
助理:✅ 转录完成!已自动生成以下文件:
📁 输出文件:
• 产品经理入门教程_转录.txt
• 产品经理入门教程_优化版.md
• 产品经理入门教程_知乎.md
• 产品经理入门教程_微信.md
📝 自动修正的内容:
| 时间码 | 原文 | 修正为 | 原因 |
|--------|------|--------|------|
| [02:35] | PRD文档 | PRD 文档 | 格式规范 |
| [08:12] | 阿里巴巴 | 阿里巴巴 | ✓ 确认正确 |
💡 如需调整任何内容,随时告诉我。---
*技能版本:v2.3 | 更新日期:2026-03-30*
*更新内容:完善多平台发布稿字数对照表,增强金句提取规则,添加配图提示词规范*
More tools from the same signal band
Order food/drinks (点餐) on an Android device paired as an OpenClaw node. Uses in-app menu and cart; add goods, view cart, submit order (demo, no real payment).
Sign plugins, rotate agent credentials without losing identity, and publicly attest to plugin behavior with verifiable claims and authenticated transfers.
The philosophical layer for AI agents. Maps behavior to Spinoza's 48 affects, calculates persistence scores, and generates geometric self-reports. Give your...