HomeBrowseUpload
← Back to registry
// Skill profile

SKILL.md - 视频转录与内容优化

视频/音频转录 → 优化润色 → 多平台发布稿的完整工作流。

by artminding · published 2026-04-01

开发工具自动化任务
Total installs
0
Stars
★ 0
Last updated
2026-04
// Install command
$ claw add gh:artminding/artminding-video-transcript-pro
View on GitHub
// Full documentation

# SKILL.md - 视频转录与内容优化

视频/音频转录 → 优化润色 → 多平台发布稿的完整工作流。

**设计原则:最小化用户等待,最大化自动化。**

---

触发条件

用户请求:

  • 转录视频/音频
  • 视频转文字
  • 整理录音内容
  • 制作知乎/微信文章
  • 或明确提出使用此技能
  • ---

    工作流程

    阶段1:前置确认(转录开始前)

    **立即询问,不等转录:**

    📹 已收到视频,转录前请确认以下信息:
    
    📋 推测信息:
    • 主题:[从文件名/上下文推测]
    • 受众:[推测]
    • 风格:知乎理性风 / 微信故事风 / 两者都要
    • 输出:逐字稿 + 优化版 + 知乎文章 + 微信文章
    
    ⏱️ 3分钟无回应,我将使用上述推测自动继续。
    💬 有修改请直接回复,如"主题改为xxx"或"只要知乎文章"。
    🚪 您可以先离开,转录完成后我会通知您。

    **推测来源:**

    | 来源 | 提取信息 |

    |------|----------|

    | 文件名 | `产品经理入门教程.mp4` → 主题:产品经理入门 |

    | 用户历史偏好 | 记录在 `MEMORY.md`,如"偏好知乎理性风格" |

    | 上下文对话 | 用户之前提到的主题/受众 |

    | 视频元数据 | 时长、分辨率等(如有) |

    **超时规则:**

  • 等待 **3分钟**
  • 无回应 → 使用推测信息自动继续
  • 有回应 → 更新推测,继续
  • ---

    阶段2:后台转录(用户可离开)

    **默认设置:**

  • 模型:Whisper `small`(平衡速度与质量)
  • 语言:中文(`zh`)
  • 输出:带时间码的逐字稿
  • **执行命令:**

    python transcribe_simple.py <视频文件路径> small

    **用户提示:**

    🔄 转录中... 预计 5-15 分钟
    您可以先离开,完成后我会通知您。

    **输出文件:** `{视频名}_转录.txt`

    ---

    阶段3:自动优化(用户无需等待)

    转录完成后,自动进行以下处理:

    #### 3.1 错误识别与修正

    **自动修正(高置信度):**

  • 常见同音字(已 → 以、在 → 再 等)
  • 标准术语拼写(TensorFlow, PyTorch, GitHub 等)
  • 明显的识别错误
  • **记录待确认(低置信度):**

  • 人名/地名/机构名
  • 专业术语(需结合上下文判断)
  • 数字/日期
  • #### 3.2 文本润色

  • 修正口语化表达(保留原意,提升流畅度)
  • 删除冗余填充词(然后、那个、就是、呃等)
  • 调整语序使逻辑更清晰
  • #### 3.3 知识补充(联网搜索)

  • 遇到专业术语:使用 `web_search` 或 `web_fetch` 查找权威解释
  • 重要概念:在首次出现处添加简短括号注释(≤20字)
  • 需深入的内容:文末添加"背景知识"小节
  • #### 3.4 格式优化

  • **关键词加粗**:核心概念、重要术语
  • **重点语句加粗**:需要读者注意的句子
  • **段落层级**:使用二级/三级标题分隔内容模块
  • **时间码保留**:每个段落开头标注起始时间码
  • #### 3.5 金句提取

    **金句标准:**

    | 类型 | 定义 | 示例 |

    |------|------|------|

    | 经验性 | 可迁移的实践智慧 | "做了十年程序员,我发现最重要的不是语言本身,而是解决问题的思路。" |

    | 知识性 | 值得记忆的理论/数据 | "根据研究,人类专注力的黄金时长是25分钟,这就是番茄钟的由来。" |

    | 判断性 | 独到观点或洞察 | "技术本身不会淘汰人,会用技术的人才会淘汰不会用的人。" |

    **提取规则:**

  • 每篇提取 3-8 条金句
  • 单独列出在文末"金句摘录"区域
  • 同时在正文中用 `**加粗**` 标记
  • #### 3.6 生成多平台文章

  • 知乎文章(理性 + 经验 + 科学 + 专业)
  • 微信文章(故事感 + 深度 + 专业)
  • 小红书文章(极简 + 视觉化 + 话题标签)
  • ---

    阶段4:输出 + 可审核

    **输出格式:**

    ✅ 转录完成!已自动生成以下文件:
    
    📁 输出文件:
    • {视频名}_转录.txt(原始逐字稿)
    • {视频名}_优化版.md(优化润色版)
    • {视频名}_知乎.md(知乎发布稿)
    • {视频名}_微信.md(微信公众号发布稿)
    • {视频名}_小红书.md(小红书发布稿,极简版)
    
    📝 自动修正的内容(如不同意请告诉我):
    | 时间码 | 原文 | 修正为 | 原因 |
    |--------|------|--------|------|
    | [02:35] | Tensor Flow | TensorFlow | 标准拼写 |
    | [05:12] | 皮托克 | PyTorch | 术语修正 |
    
    💡 如需调整任何内容,随时告诉我。

    **用户可选操作:**

  • 直接使用(无需回复)
  • 要求修改("第3段的术语解释不对,应该是...")
  • 重新生成某部分("微信文章太长了,缩短到1500字")
  • ---

    输出文件格式

    优化版逐字稿

    **字数对照表:**

    | 音视频时长 | 字数要求 |

    |-----------|---------|

    | 20-30分钟 | 4500-7500字 |

    | 30-60分钟 | 7500-12000字 |

    | 60-90分钟 | 12000-18000字 |

    | 90-120分钟 | 18000-24000字 |

    | 120-150分钟 | 24000-30000字 |

    | 150分钟以上 | 30000-37500字 |

    **说明:** 优化版保留完整内容,字数约为原始转录的1.2-1.5倍(因添加术语解释、金句标注、背景知识等)

    # {视频标题} - 优化版逐字稿
    
    > 视频时长:XX分钟 | 主题:XXX | 受众:XXX
    
    ---
    
    ## 一、{章节标题}
    [时间码起] {内容}
    
    **关键术语**:XXX(简短解释)
    
    {段落内容,关键词加粗}
    
    > 💡 **金句**:{原话摘录}
    
    ---
    
    ## 二、{章节标题}
    ...
    
    ---
    
    ## 金句摘录
    
    1. {金句1}
    2. {金句2}
    3. {金句3}
    
    ---
    
    ## 背景知识(可选)
    
    ### {术语/概念}
    {详细解释,来自联网搜索}
    
    ---
    
    *逐字稿生成时间:{日期} | 转录模型:Whisper small*

    知乎文章

    **风格定位:** 理性 + 经验 + 科学 + 专业

    **写作规范:**

  • 标题:提问式或观点式,引发思考
  • 开头:提出问题或现象,吸引阅读
  • 正文:逻辑递进,论点 + 论据 + 案例
  • 结尾:总结 + 行动建议或开放讨论
  • 篇幅:根据音视频时长动态调整
  • **字数对照表:**

    | 音视频时长 | 字数要求 |

    |-----------|---------|

    | 20-30分钟 | 3000-6000字 |

    | 30-60分钟 | 6000-9000字 |

    | 60-90分钟 | 9000-12000字 |

    | 90-120分钟 | 12000-15000字 |

    | 120-150分钟 | 15000-18000字 |

    | 150分钟以上 | 18000-22500字 |

    **配图提示词风格:**

  • 信息图/示意图/流程图
  • 配色:蓝色系、灰色系、专业商务风
  • 尺寸:16:9 或 4:3
  • # {标题:提问式或观点式}
    
    {开头:提出问题/现象,100-200字}
    
    ---
    
    ## 一、{章节标题}
    
    {正文内容}
    
    *【配图位置】*

    一张关于{主题}的信息图,展示{具体内容},采用{配色}色调,简洁商务风格,适合知乎文章配图。

    
    ## 二、{章节标题}
    
    {正文内容}
    
    ---
    
    ## 三、总结与思考
    
    {总结 + 行动建议}
    
    ---
    
    *本文基于视频《{视频名}》转录整理,转载请注明出处。*

    微信公众号文章

    **风格定位:** 故事感 + 深度 + 专业

    **写作规范:**

  • 标题:场景化或情感化,引发共鸣
  • 开头:故事或场景切入,快速代入
  • 正文:故事主线 + 知识穿插 + 情感共鸣
  • 结尾:升华 + 金句收尾
  • 篇幅:根据音视频时长动态调整(适合移动端)
  • **字数对照表:**

    | 音视频时长 | 字数要求 |

    |-----------|---------|

    | 20-30分钟 | 1200-1800字 |

    | 30-60分钟 | 1800-3000字 |

    | 60-90分钟 | 3000-3750字 |

    | 90-120分钟 | 3750-4500字 |

    | 120-150分钟 | 4500-5250字 |

    | 150分钟以上 | 5250-7500字 |

    **格式要求:**

  • 短段落(每段 ≤ 3行)
  • 多用空行分隔,阅读节奏感
  • 适当使用表情符号(不过度)
  • **配图提示词风格:**

  • 场景图/概念图/氛围图
  • 配色:温暖、高级、有质感
  • 尺寸:2.35:1(封面)或 16:9(正文)
  • # {标题:场景化或情感化}
    
    {开头:故事/场景切入,150-250字}
    
    ---
    
    {正文第一部分}
    
    *【配图位置】*

    一张{风格描述}的配图,展现{具体场景},色调{温暖/冷静/专业},适合公众号阅读氛围。

    
    {正文第二部分}
    
    ---
    
    ## 写在最后
    
    {升华 + 金句收尾}
    
    ---
    
    *如果这篇文章对你有帮助,欢迎点赞、在看、转发。*

    小红书文章

    **风格定位:** 极简 + 视觉化 + 话题标签

    **写作规范:**

  • 标题:吸引眼球,带emoji,控制在20字以内
  • 开头:一句话抓人,快速切入
  • 正文:要点清晰,多用emoji和符号
  • 结尾:引导互动 + 话题标签
  • 篇幅:根据音视频时长动态调整(极简版)
  • **字数对照表:**

    | 音视频时长 | 字数要求 |

    |-----------|---------|

    | 20-30分钟 | 300-375字 |

    | 30-60分钟 | 375-450字 |

    | 60-90分钟 | 450-600字 |

    | 90-120分钟 | 600-750字 |

    | 120-150分钟 | 750-900字 |

    | 150分钟以上 | 900-1050字 |

    **格式要求:**

  • 每条要点独立成行
  • 多用emoji(每条要点1-2个)
  • 关键数字加粗或特殊标记
  • 必须带话题标签(3-5个)
  • **配图提示词风格:**

  • 封面图:大字报风格,标题醒目
  • 正文图:信息图/清单图/对比图
  • 配色:高饱和度、年轻化
  • # {标题:吸引眼球,带emoji}
    
    {开头:一句话抓人,50字以内}
    
    👉 **要点一:{标题}**
    {内容,1-2句话}
    
    👉 **要点二:{标题}**
    {内容,1-2句话}
    
    👉 **要点三:{标题}**
    {内容,1-2句话}
    
    ---
    
    💡 **一句话总结**:{核心观点,20字以内}
    
    👇 你怎么看?评论区聊聊~
    
    #{话题标签1} #{话题标签2} #{话题标签3}

    ---

    输出文件汇总

    | 文件名 | 内容 | 格式 |

    |--------|------|------|

    | `{视频名}_转录.txt` | 原始逐字稿(带时间码) | TXT |

    | `{视频名}_优化版.md` | 优化润色版逐字稿 | Markdown |

    | `{视频名}_知乎.md` | 知乎平台发布稿 | Markdown |

    | `{视频名}_微信.md` | 微信公众号发布稿 | Markdown |

    | `{视频名}_小红书.md` | 小红书发布稿(极简版) | Markdown |

    ---

    自动化规则

    | 环节 | 自动处理 | 需用户确认 |

    |------|----------|------------|

    | 背景信息 | 推测 + 3分钟超时默认 | 用户在线时可修改 |

    | 错误修正 | 高置信度自动修正 | 低置信度列表展示 |

    | 知识补充 | 自动联网搜索 | 无需确认 |

    | 金句提取 | 自动提取 | 无需确认 |

    | 文章生成 | 自动生成 | 用户可要求修改 |

    ---

    错误修正置信度规则

    **高置信度(自动修正,不询问):**

  • 常见技术术语拼写(TensorFlow, PyTorch, GitHub, Kubernetes 等)
  • 标准中文同音字(已经 → 已经,在 → 再)
  • 常见品牌名(Apple, Microsoft, Google 等)
  • **低置信度(列表展示,供审核):**

  • 人名(可能同音不同字)
  • 地名(可能地方口音影响)
  • 专业领域术语(需上下文判断)
  • 数字/日期(可能识别错误)
  • ---

    注意事项

    1. **时间码精度**:保留秒级精度,格式 `[MM:SS]`

    2. **保留原意**:润色时不得改变说话者原意

    3. **敏感内容**:如涉及敏感话题,提醒用户注意发布平台规则

    4. **版权提醒**:衍生文章发布时注明原始视频来源

    5. **用户偏好记忆**:将用户偏好记录到 `MEMORY.md`,下次自动应用

    ---

    示例交互

    用户:帮我转录这个视频:产品经理入门教程.mp4
    
    助理:📹 已收到视频,转录前请确认以下信息:
    
    📋 推测信息:
    • 主题:产品经理入门
    • 受众:产品经理新人/转行者
    • 风格:知乎 + 微信(两者都要)
    • 输出:逐字稿 + 优化版 + 知乎文章 + 微信文章
    
    ⏱️ 3分钟无回应,我将使用上述推测自动继续。
    💬 有修改请直接回复,如"主题改为xxx"或"只要知乎文章"。
    🚪 您可以先离开,转录完成后我会通知您。
    
    🔄 正在启动转录...
    
    [用户离开]
    
    [5分钟后转录完成,自动优化]
    
    助理:✅ 转录完成!已自动生成以下文件:
    
    📁 输出文件:
    • 产品经理入门教程_转录.txt
    • 产品经理入门教程_优化版.md
    • 产品经理入门教程_知乎.md
    • 产品经理入门教程_微信.md
    
    📝 自动修正的内容:
    | 时间码 | 原文 | 修正为 | 原因 |
    |--------|------|--------|------|
    | [02:35] | PRD文档 | PRD 文档 | 格式规范 |
    | [08:12] | 阿里巴巴 | 阿里巴巴 | ✓ 确认正确 |
    
    💡 如需调整任何内容,随时告诉我。

    ---

    *技能版本:v2.3 | 更新日期:2026-03-30*

    *更新内容:完善多平台发布稿字数对照表,增强金句提取规则,添加配图提示词规范*

    // Comments
    Sign in with GitHub to leave a comment.
    // Related skills

    More tools from the same signal band