比NotebookLM更好的「开源播客」,可根据多模态内容生成30分钟以上播客音频。
安爸
发布于
之前给大家分享过一个类似的AI播客项目,今天给大家分享的podcastfy可以支持更长的内容。
长篇播客才是市场真正大量需要的。
而且还有个关键点,它可以分析多模态的内容,像是网页、图片、PDF等等。
使用体验来看,比NotebookLM要好一些。
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)

项目简介
Podcastfy 是一个开源 Python 工具,能将文本、图片、网站、YouTube 视频、PDF 等多模态内容,借助生成式 AI 转化为播客。它支持自定义播客风格、声音等,可运行本地大语言模型,适配 100 多种语言模型和多种文本转语音模型,能生成短则 2 – 5 分钟、长则 30 分钟以上的播客,还可通过 CLI 和 Python 包实现自动化工作流。

DEMO
下面这段是根据两张图片生成的。

功能特点

多源内容支持:可将文本、图片、网站、YouTube 视频、PDF 等多种形式内容转化为播客
AI 驱动生成:借助生成式 AI 自动创建多语言音频对话,支持 100 多种语言模型
自定义能力强:可自定义播客风格、声音等参数,满足个性化需求
灵活部署选项:支持运行本地大语言模型,适配多种文本转语音模型
长度可控:能生成 2-5 分钟短播客或 30 分钟以上长播客
便捷集成:提供 CLI 和 Python 包,便于实现自动化工作流
项目链接
https://github.com/souzatharsis/podcastfy
关注「开源AI项目落地」公众号
(文:开源AI项目落地)
扫描二维码,在手机上阅读