安爸-超级家庭

9.2k星星!基于AI模型的开源视频字幕工具,字级时间戳准确度超剪映。

安爸 发布于

给视频加字幕、翻译字幕,之前这类开源也给大家推荐过,今天找到一个更好一些的。

像是给视频加字幕,这个剪映也能干,但是说实话,准确率还是差了点,而且剪映现在也涨价了,38块钱一个月了。

翻译字幕剪映干不了,自己要是一条一条的去翻译真会把人搞崩溃。

今天给大家推荐的VideoCaptioner,各方面做得都还不错,时间戳(保证字幕跟视频对齐)、字幕校正这些有了很大的优化。

扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)

项目简介

VideoCaptioner 是一个基于多模态大模型的视频字幕生成工具。它能够自动解析视频内容,提取画面与语音信息,并生成精准、流畅的中文或英文字幕。项目支持多种视频格式,结合大语言模型的强大理解能力,不仅能识别场景和对话,还能输出自然语言描述,提升视频的可读性与可传播性。适合自媒体创作者、教学视频制作人以及需要快速生成字幕的用户使用。

DEMO

页面预览

功能演示

· whisper转录

· 转录后的字幕

· 进行断句与字幕的优化翻译

· 合成的视频

功能特点

  • 语音识别:支持本地 Whisper/FasterWhisper 与在线接口,无需高配亦可生成精准字幕。
  • VAD 静音切分与人声分离:更干净的语音轨道,提升识别准确率。
  • 字级时间戳:提供更精细的时间对齐,便于校对与二次编辑。
  • LLM 智能断句/校正:根据上下文优化断句与术语格式,使字幕更自然可读。
  • 字幕翻译:支持传统引擎与 LLM 方案,一键生成多语字幕。
  • 批量处理:支持批量生成与合成字幕,提升工作流效率。
  • 多线程优化:加速字幕生成、翻译与合成流程。
  • 可视化编辑与预览:内置直观的字幕编辑界面,所见即所得预览。
  • 一键全流程:从识别、断句、优化、翻译到视频成片一站式处理。

项目链接

https://github.com/WEIFENG2333/VideoCaptioner

关注「开源AI项目落地」公众号

(文:开源AI项目落地)

9.2k星星!基于AI模型的开源视频字幕工具,字级时间戳准确度超剪映。最先出现在每时AI


扫描二维码,在手机上阅读