AI 工具推荐:用 Modal Podcast Transcriber +Glarity, 一键生成播客/Podcast摘要
通过 Modal Podcast Transcriber 用 OpenAI Whisper 提取 (Spotify) Podcast 的字幕,然后配合 Glarity 插件,一键生成摘要,1 分钟了解全貌,效率 x100
目前生成Youtube摘要的工具,都是基于字幕。经常有读者留言,没有字幕的Podcast怎么办?
办法来了↓
先用Modal Podcast Transcriber提取 (Spotify) Podcast 的字幕,然后用 Glarity一键生成摘要,1 分钟了解全貌,效率 x100!
下面是详细用法和 2 个彩蛋👇
1️⃣ 用Modal Podcast Transcriber ,将Podcast用Whisper生成字幕
OpenAI于2022年9月底发布的Whisper语音识别模型是深度学习领域的又一里程碑,Modal Labs将其封装成了一个字幕转换器,直接搜索播客的名字或者主题,就可以找到对应的播客(我找到了Creative Control
使用链接: https://modal-labs--whisper-pod-transcriber-fastapi-app.modal.run/
在播客里找到对应的节目后,点击「Transcriber Now」,1 小时的节目,大概 1 分钟左右,就能生成全部字幕
Modal Labs 在这里做了并行优化,可以点击这里了解更多,包括 GitHub 源代码
2️⃣ 用 Glarity 插件,将字幕变成摘要
有了字幕之后,就有很多方法来生成摘要了,最简单的是用我之前推荐过的浏览器插件Glarity
因为Podcast内容比较长,我将Glarity的Propmt修改为:Read the whole content on the webpage, then summarize them in 10 bullet points
这一步也可以换成自己熟悉的方法,比如我用了GPT4 + WebPilot 插件,可以更个性化的修改 Prompt. 我指定了主题,让内容更聚焦
看起来GPT4的「总结」能力更强,Google Bard 的结果也不错
说实话 WebPilot 是 GPT4 我用到现在最满意的功能,每个月 $20 比实习生便宜太多了, Onekey 现在可以直接支付
3️⃣ 彩蛋 1,配合【沉浸式浏览】,可以双语浏览整个播客
希望更详细了解播客内容?没问题,【沉浸式浏览】插件帮助你双语快速浏览
4️⃣ 彩蛋 2,每条字幕都有对应的原始音频
如果你阅读字幕的时候想知道,他们真的这样说吗,用什么样的口气呢?点击右侧的时间戳,马上找到答案!
竞争带来创新
之前我听播客用的最多的是 Snipd, 也推荐给了不少朋友。优点是自动生成大纲和总结,但缺点也很明显,「总结」太简单基本上没有可参考性,也不能自定义 Prompt 和提取完整字幕
Whisper + GPT 打开了音频的无限可能性,比如 Naval 投资的 Airchat, 也希望 Snipd 可以有更多创新
生成Podcast摘要总结
1️⃣ 用Modal Podcast Transcriber ,将Podcast用Whisper生成字幕
2️⃣ 用Glarity插件,将字幕变成摘要。这一步也可以换成自己熟悉的方法,我用了GPT4 + WebPilot, Google Bard也不错
3️⃣ 配合【沉浸式浏览】,可以双语浏览整个播客
4️⃣ 可以查看每条字幕对应的原始音频
最后会有朋友问,那如果是Modal Labs没有收录到的 Podcast, 或者是本地音频怎么做摘要?莫急,相应的方法我也研究出来了,敬请期待