向安宇知识库 向安宇知识库
  • 读书向
  • 学习向
    • AI工具
    • AI研究
    • 笔记
    • AIP:克丽丝AI日志
  • 创作向
    • 写作
      • 非虚构
      • 剧本
      • 小说
      • 文言
      • 随笔
      • 日记
    • 视听
      • 纪录片
      • 设计
      • 视频
      • 摄影
    • 课程
  • 影视向
    • 创意策划
    • 前期拍摄
    • 后期制作
    • 影像实验
    • 影像设备
    • 大师镜头
    • 电影赏析
    • 视频论文
    • 项目复盘
  • 折腾向
    • 穿越机
    • 户外
    • 代码
    • 手工
    • 书法
    • 篆刻
    • 绘画
首页 › 影视向 › 后期制作 › 都2020年了,还在一行行打字做字幕?

都2020年了,还在一行行打字做字幕?

向安宇
2020-05-14 12:32:07

用AI自动做字幕的方式太多了,没有一一严格的测试,仅就使用体验,稍微写点总结,以便选用。

1、Autosub

autosub安装起来有很多坑,需要安装homebrew,ffmpeg等等,一路解决各种坑。我在之前安装的时候,足足折腾了一个下午。

安装好后,使用的时候不是图形界面,需要靠写代码来完成操作,所以需要去学习了解并记忆代码。而且autosub还需要单声道mp3,要单独生成,多了一个步骤的麻烦。

autosub原版调用的是google的api,google在大陆需要添加代理或者科学上网,再则,google的中文识别率似乎比不上国内的讯飞、腾讯、阿里等。

当然,除了原本的库,国内有改进的版本,那就是冰灵的版本。

冰灵autosub支持讯飞、百度等,因为python版本问题,我没有测试。

所以,喜欢折腾的,推荐使用autosub。代码折腾得666了,可以有一些骚操作,比如可以干湿声分离等等。

autosub是靠auditok 本地离线生成时间轴,调用API进行语音识别。其核心就在调用的API上。

2、字幕组机翻小助手(推荐)

都2020年了,还在一行行打字做字幕?-向安宇知识库

使用机翻小助手,可以自己去申请API,语音识别、翻译等,支持阿里云、腾讯、ibm等家的API,暂时没看到讯飞的支持。

APP本身有每月10小时使用限制,119元升级专业版,终生额度不限制。但是10小时,对于绝大多数人来说,应该是够用了。

至于阿里云等家的API,免费已经完全够用,即使超过额度收费,费用也是相当低廉的。

如果想要免费不花钱,这个就是推荐。

3、网易见外(推荐)

免费,准确,几乎是视频作者的第一选择。

之前通告说将暂时关停,各个自媒体以及官媒都有报道:

都2020年了,还在一行行打字做字幕?-向安宇知识库

但是在5月15日,我登陆网易见外工作台,没有看到相关公告,而且功能正常使用。

4、听见字幕

讯飞的产品,准确率可以,可以过滤语气词,可以线上人工校对,且提供有人工精转(就是人工校对)的增值服务。

价格机翻是0.33/分,人工80/分起。

网易、讯飞,都是自家的语音识别技术,autosub和机翻小助手都是调用的免费API。

下面介绍的方法,就属于二道贩子,有中间商赚差价的了。

5、人人译视界

创始团队是原人人影视创始团队,翻看了一下新闻,曾和网易见外是战略合作,现在和百度翻译是合作关系。估计后台调用的是百度的API。

其客户端底层和arctime一样是ffmpeg,这个客户端我个人觉得很神奇,有很多小工具:

都2020年了,还在一行行打字做字幕?-向安宇知识库

这写小工具如此丰富,还有专门的视频压制界面(arctime的视频压制需要付费开通),以至于这个客户端我觉得可以视作ffmpeg的图形化界面了。字幕编辑页面也很丰富:

都2020年了,还在一行行打字做字幕?-向安宇知识库

简繁转换,还有术语库,甚至还有单位转换工具:

都2020年了,还在一行行打字做字幕?-向安宇知识库

字幕app里,抛开易用度不说,“人人译视界”应该是功能最为丰富的了。不过缺点也很明显:贵。

都2020年了,还在一行行打字做字幕?-向安宇知识库

6、Arctime

状告用户,违反开源协议……这家的开发者不评价,软件本身使用起来虽说有些问题,但是整体上还是比较方便。

语音转文字字幕和自动打轴是需要积分的,靠签到攒的积分不可能够用,价格在0.5/分左右,是可以接受的价格,毕竟需要调用第三方的api,所以收费是可以理解的。

另外,arctime是在mac环境下开发的,对mac比较友好。影视行业,mac应该占了大半吧,同时arctime也支持其他系统。

使用arctime进行自动字幕转换的好处是,可以修改、校对都在软件里完成,图形化界面,使用简单,不需要折腾。

7、在线字幕工具

一些网页版字幕生成工具:

极简字幕,暂时是我找到的所有收费的字幕服务里,最便宜的,0.1元/分。

网页设计的也很简洁,但是用户中心也太多简洁了,登陆和没登陆一个样,这点要吐槽一下。

这些在线字幕生成工具,都是属于二道贩子,调用百度、阿里云等第三方的API,甚至是别家的免费API。

8、YouTube

还有种方法,就是上传到youtube,设为私密,让YouTube生成字幕以后,用字幕下载工具下载下来。

小结:

总结一下,如果是日常视频制作,首推的是网易见外(免费,准确)。

其次讯飞(准确,便宜)。

现在的非编软件,支持srt的编辑,比如DaVinci resolve,srt文件直接往轨道上拖就完事儿。直接在剪辑软件里校对字幕也很方便,关键是如果需要修改时间线,可以顺手就把字幕时间轴改了,不同在专门的字幕软件里去倒腾。

如果本身有写好的文字稿,不想一字字去校对语音识别出来的字幕,可以用arctime的自动打轴功能,不贵,省事。

如果要制作双语字幕,可以试试人人译视界,如果嫌贵不想用它的字幕功能,那就当作ffmpeg的图形化界面使用吧。日常的一些使用,比iffmpeg好用多了,压制,抽取,合并,转码,封装……应有尽有。

0
本文系作者 @向安宇 原创发布在 向安宇知识库。未经许可,禁止转载。
Mac下FFmpeg安装(顺便折腾下autosub)
上一篇
mac 切换phthon版本
下一篇

评论 (0)

登录后可发布~
立即登录
暂无评论

向安宇

痴迷文字,醉心影像
447
文章
5
评论
325
喜欢

聚合文章

1.我将深入研究如何提升学习力,以及如何用AI提升学习效率
克丽丝是谁?(人物设定1.0)
AIP克丽丝的构想
wordpress也要拥抱AI

近期评论

不同意知识过时这么快,数学公式几百年都没变啊
—— Baron von Laughsalot 4 月前 1.我将深入研究如何提升学习力,以及如何用AI提升学习效率
这学习方法太适合我这种记性差的了,必须追更!
—— 狂血战士 4 月前 AIP克丽丝的构想
数字人做语言教学太香了,求Anni快出实操指南!
—— 贪吃小熊 4 月前 Anni搞钱系列:普通人用AI,到底能做起来什么副业?
想问作者会开线下课吗?想带孩子去听听
—— 秋分桂落 4 月前 1.我将深入研究如何提升学习力,以及如何用AI提升学习效率
想问下这个AI工具对服务器配置要求高吗?
—— 狂喜的烟花 4 月前 wordpress也要拥抱AI

猜你喜欢

达芬奇工业级调光:ACES概念详解

达芬奇工业级调光:ACES概念详解

2020-04-05 0:09:54
7,405 0 8
达芬奇工业级调光:一级调光

达芬奇工业级调光:一级调光

2020-03-26 20:59:17
3,409 0 0
达芬奇Fusion里的“仿制图章”

达芬奇Fusion里的“仿制图章”

2020-06-19 18:16:55
2,458 0 2
周新霞老师送给剪辑师的大实话——剪辑直播笔记【中国剪辑师社群】

周新霞老师送给剪辑师的大实话——剪辑直播笔记【中国剪辑师社群】

2020-02-06 23:07:01
2,919 0 2

关于我:

想要读万卷书,行万里路,看万部电影。

推荐栏目:

视频论文 课程 后期制作 非虚构 照片 视频

特色专题:

专题汇总 宜看一侃 帧影帧画 重读文学史 青玉记
Copyright © 2016-2026 向安宇知识库. 鄂ICP备16005400号-1 鄂公网安备42050602000017号
  • 读书向
  • 学习向
    • AI工具
    • AI研究
    • 笔记
    • AIP:克丽丝AI日志
  • 创作向
    • 写作
    • 视听
    • 课程
  • 影视向
    • 创意策划
    • 前期拍摄
    • 后期制作
    • 影像实验
    • 影像设备
    • 大师镜头
    • 电影赏析
    • 视频论文
    • 项目复盘
  • 折腾向
    • 穿越机
    • 户外
    • 代码
    • 手工
    • 书法
    • 篆刻
    • 绘画
  • 剪辑
  • 转场
  • 纪录片

向安宇

痴迷文字,醉心影像
447
文章
5
评论
325
喜欢