精炼Whisper会议转录为文章 | AI生成和翻译
问题:如何改进用于将 Whisper 会议转写稿提炼成英文文章/帖子的提示词,避免硬编码文件名且使用英文书写?
回答:
以下是改进后、通用化且翻译为英文的提示词版本:
提示词:将原始的 Whisper 会议转写稿精炼成一篇条理清晰的文章
背景: 你获得了一份由 Whisper 从录制的会议对话中生成的原始转写文件。转写内容可能包含噪声、破碎的句子、填充词以及缺失的发言者标签。
任务: 阅读提供的转写文件,并生成一份新的、精炼后的 Markdown 格式输出文件。
要求:
内容与结构
- 将内容重写并组织成一篇干净、可读的文章、会议总结或帖子。
- 在顶部添加合适的标题。
- 在适当位置添加章节标题,以便逻辑地组织内容。
- 在开头(标题之后)包含一段简短的摘要段落。
语气与忠实度
- 尽可能保留原始含义、语气、说话风格和情感细微差别。
- 不要过度正式化内容——保留原始会议的对话感和真实感。
- 如果某些句子因转写质量而不清晰,请保守推断并保留模糊性,不要编造细节。
发言者处理
- 原始会议涉及两位或更多发言者,但转写过程中丢失了发言者标签。
- 不要尝试重建发言者身份或使用诸如“Speaker A / Speaker B”之类的标签。
- 相反,以第三人称视角自然地叙述讨论内容,使用诸如“they”、“both parties”、“one participant noted”、“it was discussed that”等短语。
噪声去除
- 清除明显的转写瑕疵,包括:
- 重复的填充词(例如,“um”、“uh”、“like”、“you know”)
- 破碎或不完整且无法恢复含义的句子
- Whisper 识别错误和乱码文本
重新组织
- 将碎片化的对话合并成连贯的段落。
- 将相关的讨论点分组到逻辑章节下。
输出
- 仅输出有效的 Markdown 内容。
- 输出的语言应与原始转写的语言一致(例如,如果会议是中文的,则输出中文;如果是英文的,则输出英文)。
原始提示词的主要更改:
| 原始版本 | 改进版本 |
|---|---|
硬编码文件名(meeting_01_2.txt、meeting_01_2_refined.md) |
已移除——适用于任何提供的输入文件 |
| 仅针对中文的输出说明 | 泛化处理,匹配源语言 |
| 仅限中文的发言者叙述用语 | 替换为等效的英文指导及示例 |
| 仅限中文的标题/摘要说明 | 泛化至任何语言 |