网友评分:
5分
硬字幕提取工具是一款小巧易用的字幕提取软件,可以帮助用户快速提取对应视频的字幕内容,软件覆盖了VideoSubFinder、SubtitleEdit、以及百度讯飞搜狗OCR的一个工具,方便实用。软件采用AI文字检测+传统的数字图像处理技术,提取字幕图片和时间轴信息,然后利用百度讯飞有道OCR通用文字识别云引擎+离线ocr引擎识别出文字,在校对窗校对后生成srt字幕文件,最后还可选调用第三方工具APP做调轴补漏等工作,从开始到结束,整个字幕提取流程一气呵成,快速准确、识别率高、省时省力。有需要的朋友欢迎下载使用!
支持“双语字幕”识别、字幕翻译、动态字幕等功能
支持字幕保存,导入等功能
支持在线翻译功能。
1、准备百度OCR服务APP_ID / API_KEY / SECRET_KEY
百度注册获取百度通用文字识别服务的APP_ID / API_KEY / SECRET_KEY,
一个手机号码注册一个账号(须实名认证)。
每账号每天免费识别次数有规定,如不够用可多注册几个账号。对于长期需求用户,建议购买次数吧,价格不贵,还能支持国家高科技发展。
注册步骤很简单,可自行百度,获得的APP_ID / API_KEY / SECRET_KEY信息先保存起来下面会用到。
如果您现在没时间注册,可以下载本工具支持离线OCR识别的版本,使用里面的离线ocr来识别,本步骤可略过。
2、准备工作流程中最后可能用到的APP2第三方软件
百度下载安装Subtitle Edit 作为 APP2
注:APP2 不指定,可以选用户熟悉的其他软件,例如SubtitleEdit可换成Aegisub或 ArcTime
如果对提取的字幕不需要精调,只是一般使用,本步骤可略过。
如果是离线OCR版须安装包内的vlc-3.0.12-win64.exe,不然智能截图不能工作。
3、设置硬字幕提取工具
打开软件
点击‘系统设置’
填入步骤1获得的百度OCR服务APP_ID / API_KEY / SECRET_KEY(如使用离线ocr引擎则不用做此步)
点Browse找到步骤2安装好的AP2P的入口exe文件(如不需调轴补漏则不用做此步),然后Save保存设置。
4、用VideoSubFinder_5.50_x64生成RGBImages
点击主界面VideoSubF按键,将启动运行VideoSubFinder_5.50_x64(旁边的‘智能截图’按键是类似于VideoSubFinder的另一个截图工具,采用AI文字检测+传统的数字图像处理技术,善于提取复杂动态字幕并能做到100%不漏,高级用户可学习第四章之-高级功能)
点击左上角File -> Open Video(FFMPEG)(如不能打开视频,可换OPENCV),打开要提取字幕的视频文件(本例为:倚天屠龙记之魔教教主-中字.mp4)
快速浏览全片,查看字幕区间矩形最大范围(注意有些视频是两层字幕),用两根竖线两根横线设置字幕截图区间(四根线在视频窗口边缘不容易发现,试着点击选中可以移动它)。注意:矩形边框要比实际字幕稍大,不要为了节省图片尺寸而把区间设置成紧贴字幕,如果字幕周边余量太小,会影响后续百度OCR识别(当然也没必要设置得太大)。
点击Search右边的Settings,出现设置界面,我们只关心左边这块能影响Search字幕图片的参数。
第一个参数‘Text Alignment’默认设置是‘Center’,须点击设置成‘Any’。
其他众多参数中,有一个参数至关重要,就是Use Filter Colors这项,default值是空的,其他参数可以不设,这个一定要设置上,特别是非纯白字幕,例如黄色!如果不设置,有大几率会漏字幕。
我们需要取色字幕文字的骨干颜色(骨干外则是字幕轮廓颜色,不要取偏了),然后将颜色值填入,将有助于VideoSubFinder判断字幕出现和结束的时间,生成正确的时间轴信息,并防止丢时间轴。常见字幕颜色可能有白色的、黄色的,或者其他颜色,本例电影的字幕是白色。如果是多色字幕,可以按VSF要求取色多色填入。
具体的参数设置,可以参考Docs目录下的readme_eng.txt,专业用户精调参数可以提高Search字幕帧的准确率,从而减少丢时间轴(少字幕图片,致命)和假时间轴(空字幕图片,影响不大)的情况,不过据笔者使用经验,如果没弄明白参数含义和作用,随意调整反而适得其反,普通用户还不如不调的好。
在右边界面先点一下Pixel Color
然后点击字幕白色文字中心骨干取色,点不准可以多点几下。
取到了颜色,会显示出来
本例将Lab: l:245 a:127 b:129 拷贝后双击填入Use Filter Coloers,一般做了这步就可以基本保证不会有时间轴丢失的情况,算是完成了Search的设置。
点击Search -> Clear Foders 清空RGBImages目录,
然后点 OCR Search,程序开始扫描视频文件,生成RGBImages。
几分钟后扫描完成,可以关掉VideoSubFinder_5.50_x64,这时工具将显示RGBImages目录下的所有字幕截图:
初次使用我们可以在文件列表区按鼠标右键菜单,选‘Open folder’打开RGBImages目录看一下:
这些是刚才VideoSubFinder_5.50_x64 Search生成的1000多个字幕切片图片文件,说明这个电影有1000多条字幕呢。文件名前段为时间轴信息。
可以打开文件看看,是RGB原色字幕截图切片,很适合AI训练过的OCR引擎做识别。
5、清理空字幕图片
我们可以在‘删合窗’中清除RGBImages目录中的空字幕图片。
由于VideoSubFinder 的Search算法还没做到100%准确,所以会误生成少量无字幕空图片(假时间轴),有时还会把广告也截图下来,我们在‘删合窗’中用鼠标滚轮快速翻页浏览RGBImages目录,把发现的空字幕、广告水印图片打上删除标记,标记完最后统一删除,让后续百度OCR识别不用浪费每月有限额度,同时在校对阶段不用再频繁做删除工作。
一页可以显示20~300张图片(默认90张),浏览、标记、删除非常方便。
翻页:点击<<<、>>>按键,或键盘PgUp/PgDn键、↑/↓键,或将鼠标指针停留在图片区,滚动鼠标滚轮,可以翻页。
标记:鼠标左键点击可以标记选中图片,再次点击可以去选中。Shift+鼠标左键可以连续多选、连续去选(可跨页)。
删除:直到最后一页标记完成,点<<面板上的‘全删合’按键会弹出删除提示,确认后将删除所有标记过的空图片。
更多方便的功能(例如合并重复字幕)可以看“第四节之 视频截图、删合窗(删除合并)”
如下图一处为广告,可以选中标记它:
如下图几处为空字幕图片,可以选中标记它:
一直标记到最后一页:
然后点‘全删’,
确认后将会把刚才标记过的所有空字幕、广告水印图片删除掉(如果发现不能删除,多半是系统权限问题,请不要将本工具安装在C盘或桌面):
清理完空字幕图片后,点击面板上的‘去OCR’按键,将切换到OCR校对窗。
6、运行百度OCR识别
百度高精度每月免费识别额度较低,如不采用叠图技术 --- 将多张字幕图片合成一张大图来识别以节省额度,每月只能识别较少字幕图片,因此,如果用户没有购买额度,应该在面板上勾选‘叠图’。
如果没有注册百度,而是采用离线识别引擎可选tr并去掉勾选叠图。
点击主界面的OCR按键,程序将连接百度OCR服务器,对RGBImages目录中的所有字幕图片从头到尾按顺序做识别,只需等待完成即可。
OCR识别完成了! (细心的用户可能会留意到:在识别过程中有少量图片会有自动标注‘X’,这是因为程序在OCR识别过程中会自动标注空字幕图片,因为上个手动删空步骤遗留了少量空字幕图片,所以呢,如果你额度充足,是可以不用做手动删空步骤的)
这时在RGBImages目录下已经为每个.jpeg文件生成了一个同名的 .txt字幕文件,以及检测框坐标文件_boundingbox.txt,初次使用可以看一下。
7、校对字幕
如果希望在SubtitleEdit等字幕软件中做校对,可以略过这个步骤,直接到下个步骤
校对窗显示一页1~4列、1~10行(默认1列6行)图文。用户可根据需要在系统设置里设置。
编辑:可以用输入法进行常规的输入、删除、鼠标左键/右键插入空格、回车等操作。
查找替换:除了支持简单的批量替换,还支持* ?通配符、反斜杠转义等扩展找替换、正则表达式匹配替换等。
翻页自动保存:点击<<<、>>>按键,或键盘PgUp/PgDn键,或将鼠标指针停留在图片区,滚动鼠标滚轮、或↑/↓键,都可以进行翻页。翻页将自动保存校对修改过的文字。
选中标记:ctrl+鼠标左键 可以标记删除图片,shift+鼠标左键 可以标记合并图片,再次点击可以去选中。
删除合并:如果有选中的图片,这时<<按键盘<Delete>按键会弹出删除合并提示,OK确认或<Enter>将执行删除、合并。
删除合并范围:当前页+后1页=2页内,后向跨页合并是可能的。
校对完成后,按面板上的‘生成SRT’按键,将在RGBImages目录下生成123.srt文件:
可以大概浏览一下,然后关掉。
生成SRT文件后,如时间轴不需要再调整、字幕不需要比对原视频做补漏(要求不高),则至此字幕提取工作完成。
更多方便的功能(例如‘精准对齐’,‘鼠标左右键自定义功能’,‘字体选择’,‘字号调整’,‘每行字号单独调整’)可以看“用户手册之第四章之 校对窗”
生成SRT文件后,如需调整时间轴、比对原视频做补漏,点击面板上的‘SubtitleE’按键,将打开SubtitleEdit工具编辑123.srt字幕文件。
8、用SubtitleEdit编辑字幕文件
之所以前面在校对窗做过校对,这里又用到APP2来做编辑,是因为有些用户(例如字幕组)对字幕要求高,还需要做调轴、补漏等进一步校对工作。
在波形图窗口里,“点击以添加波形”,打开视频文件,本例是‘倚天屠龙记之魔教教主-中字.mp4’,将生成波形数据:
在波形图窗口,勾选‘选择当前播放时刻的字幕’,设定播放速度,例如200%,然后开始播放视频,字幕会同步显示在播放窗口,可随时暂停播放,进行字幕校对、补漏、调轴。
该删除的删除,该修正的修正,该替换的替换,改补漏的补漏、该调轴的调轴,注重细节的用户还是认真过一遍吧。
完成字幕校对后,点击“文件->另存为” 保存校对好的字幕文件,SubtitleEdit会自动将123.srt重命名为跟视频文件同名的srt文件“倚天屠龙记之魔教教主-中字.srt”,并保存在视频文件所在目录下,方便大多数播放软件播放视频文件时自动加载同名字幕文件。
至此,整个硬字幕提取流程就走完了。
标签: 字幕提取