用AI自动做字幕的方式太多了,没有一一严格的测试,仅就使用体验,稍微写点总结,以便选用。
1、Autosub
autosub安装起来有很多坑,需要安装homebrew,ffmpeg等等,一路解决各种坑。我在之前安装的时候,足足折腾了一个下午。
安装好后,使用的时候不是图形界面,需要靠写代码来完成操作,所以需要去学习了解并记忆代码。而且autosub还需要单声道mp3,要单独生成,多了一个步骤的麻烦。
autosub原版调用的是google的api,google在大陆需要添加代理或者科学上网,再则,google的中文识别率似乎比不上国内的讯飞、腾讯、阿里等。
当然,除了原本的库,国内有改进的版本,那就是冰灵的版本。
冰灵autosub冰灵autosub支持讯飞、百度等,因为python版本问题,我没有测试。
所以,喜欢折腾的,推荐使用autosub。代码折腾得666了,可以有一些骚操作,比如可以干湿声分离等等。
autosub是靠auditok 本地离线生成时间轴,调用API进行语音识别。其核心就在调用的API上。
2、字幕组机翻小助手(推荐)

使用机翻小助手,可以自己去申请API,语音识别、翻译等,支持阿里云、腾讯、ibm等家的API,暂时没看到讯飞的支持。
APP本身有每月10小时使用限制,119元升级专业版,终生额度不限制。但是10小时,对于绝大多数人来说,应该是够用了。
至于阿里云等家的API,免费已经完全够用,即使超过额度收费,费用也是相当低廉的。
如果想要免费不花钱,这个就是推荐。
3、网易见外(推荐)
免费,准确,几乎是视频作者的第一选择。
之前通告说将暂时关停,各个自媒体以及官媒都有报道:

但是在5月15日,我登陆网易见外工作台,没有看到相关公告,而且功能正常使用。
4、听见字幕
讯飞的产品,准确率可以,可以过滤语气词,可以线上人工校对,且提供有人工精转(就是人工校对)的增值服务。
价格机翻是0.33/分,人工80/分起。
网易、讯飞,都是自家的语音识别技术,autosub和机翻小助手都是调用的免费API。
下面介绍的方法,就属于二道贩子,有中间商赚差价的了。
5、人人译视界
创始团队是原人人影视创始团队,翻看了一下新闻,曾和网易见外是战略合作,现在和百度翻译是合作关系。估计后台调用的是百度的API。
其客户端底层和arctime一样是ffmpeg,这个客户端我个人觉得很神奇,有很多小工具:

这写小工具如此丰富,还有专门的视频压制界面(arctime的视频压制需要付费开通),以至于这个客户端我觉得可以视作ffmpeg的图形化界面了。字幕编辑页面也很丰富:

简繁转换,还有术语库,甚至还有单位转换工具:

字幕app里,抛开易用度不说,“人人译视界”应该是功能最为丰富的了。不过缺点也很明显:贵。

6、Arctime
状告用户,违反开源协议……这家的开发者不评价,软件本身使用起来虽说有些问题,但是整体上还是比较方便。
语音转文字字幕和自动打轴是需要积分的,靠签到攒的积分不可能够用,价格在0.5/分左右,是可以接受的价格,毕竟需要调用第三方的api,所以收费是可以理解的。
另外,arctime是在mac环境下开发的,对mac比较友好。影视行业,mac应该占了大半吧,同时arctime也支持其他系统。
使用arctime进行自动字幕转换的好处是,可以修改、校对都在软件里完成,图形化界面,使用简单,不需要折腾。
7、在线字幕工具
一些网页版字幕生成工具:
极简字幕(音转文)极简字幕,暂时是我找到的所有收费的字幕服务里,最便宜的,0.1元/分。
网页设计的也很简洁,但是用户中心也太多简洁了,登陆和没登陆一个样,这点要吐槽一下。
突字幕 字幕酱 语音自动生成字幕这些在线字幕生成工具,都是属于二道贩子,调用百度、阿里云等第三方的API,甚至是别家的免费API。
8、YouTube
还有种方法,就是上传到youtube,设为私密,让YouTube生成字幕以后,用字幕下载工具下载下来。
小结:
总结一下,如果是日常视频制作,首推的是网易见外(免费,准确)。
其次讯飞(准确,便宜)。
现在的非编软件,支持srt的编辑,比如DaVinci resolve,srt文件直接往轨道上拖就完事儿。直接在剪辑软件里校对字幕也很方便,关键是如果需要修改时间线,可以顺手就把字幕时间轴改了,不同在专门的字幕软件里去倒腾。
如果本身有写好的文字稿,不想一字字去校对语音识别出来的字幕,可以用arctime的自动打轴功能,不贵,省事。
如果要制作双语字幕,可以试试人人译视界,如果嫌贵不想用它的字幕功能,那就当作ffmpeg的图形化界面使用吧。日常的一些使用,比iffmpeg好用多了,压制,抽取,合并,转码,封装……应有尽有。
请登录以参与评论
现在登录