讲故事的手艺人 讲故事的手艺人
  • 读书向
  • 创作向
    • 写作
      • 非虚构
      • 剧本
      • 小说
      • 文言
      • 随笔
      • 日记
    • 视听
      • 纪录片
      • 设计
      • 视频
      • 摄影
  • 技术向
    • AI研究
    • 筹备策划
      • 策划资料
      • 创意之道
      • 短视频研究
    • 前期拍摄
    • 后期制作
    • 原创教程
    • 影像实验
    • 影像设备
  • 艺术向
    • 研究学习
    • 大师镜头
    • 电影赏析
    • 视频论文
    • 经验总结
  • 折腾向
    • 穿越机
    • 户外
    • 代码
    • 手工
    • 书法
    • 篆刻
    • 绘画
  • AI工具
首页 › 技术向 › 后期制作 › 都2020年了,还在一行行打字做字幕?

都2020年了,还在一行行打字做字幕?

向安宇
2020-05-14 12:32:07

用AI自动做字幕的方式太多了,没有一一严格的测试,仅就使用体验,稍微写点总结,以便选用。

1、Autosub

autosub安装起来有很多坑,需要安装homebrew,ffmpeg等等,一路解决各种坑。我在之前安装的时候,足足折腾了一个下午。

安装ffmpeg

安装好后,使用的时候不是图形界面,需要靠写代码来完成操作,所以需要去学习了解并记忆代码。而且autosub还需要单声道mp3,要单独生成,多了一个步骤的麻烦。

autosub原版调用的是google的api,google在大陆需要添加代理或者科学上网,再则,google的中文识别率似乎比不上国内的讯飞、腾讯、阿里等。

当然,除了原本的库,国内有改进的版本,那就是冰灵的版本。

冰灵autosub

冰灵autosub支持讯飞、百度等,因为python版本问题,我没有测试。

所以,喜欢折腾的,推荐使用autosub。代码折腾得666了,可以有一些骚操作,比如可以干湿声分离等等。

autosub是靠auditok 本地离线生成时间轴,调用API进行语音识别。其核心就在调用的API上。

2、字幕组机翻小助手(推荐)

都2020年了,还在一行行打字做字幕?-讲故事的手艺人

使用机翻小助手,可以自己去申请API,语音识别、翻译等,支持阿里云、腾讯、ibm等家的API,暂时没看到讯飞的支持。

APP本身有每月10小时使用限制,119元升级专业版,终生额度不限制。但是10小时,对于绝大多数人来说,应该是够用了。

至于阿里云等家的API,免费已经完全够用,即使超过额度收费,费用也是相当低廉的。

如果想要免费不花钱,这个就是推荐。

3、网易见外(推荐)

免费,准确,几乎是视频作者的第一选择。

之前通告说将暂时关停,各个自媒体以及官媒都有报道:

都2020年了,还在一行行打字做字幕?-讲故事的手艺人

但是在5月15日,我登陆网易见外工作台,没有看到相关公告,而且功能正常使用。

4、听见字幕

讯飞的产品,准确率可以,可以过滤语气词,可以线上人工校对,且提供有人工精转(就是人工校对)的增值服务。

价格机翻是0.33/分,人工80/分起。

网易、讯飞,都是自家的语音识别技术,autosub和机翻小助手都是调用的免费API。

下面介绍的方法,就属于二道贩子,有中间商赚差价的了。

5、人人译视界

创始团队是原人人影视创始团队,翻看了一下新闻,曾和网易见外是战略合作,现在和百度翻译是合作关系。估计后台调用的是百度的API。

其客户端底层和arctime一样是ffmpeg,这个客户端我个人觉得很神奇,有很多小工具:

都2020年了,还在一行行打字做字幕?-讲故事的手艺人

这写小工具如此丰富,还有专门的视频压制界面(arctime的视频压制需要付费开通),以至于这个客户端我觉得可以视作ffmpeg的图形化界面了。字幕编辑页面也很丰富:

都2020年了,还在一行行打字做字幕?-讲故事的手艺人

简繁转换,还有术语库,甚至还有单位转换工具:

都2020年了,还在一行行打字做字幕?-讲故事的手艺人

字幕app里,抛开易用度不说,“人人译视界”应该是功能最为丰富的了。不过缺点也很明显:贵。

都2020年了,还在一行行打字做字幕?-讲故事的手艺人

6、Arctime

状告用户,违反开源协议……这家的开发者不评价,软件本身使用起来虽说有些问题,但是整体上还是比较方便。

语音转文字字幕和自动打轴是需要积分的,靠签到攒的积分不可能够用,价格在0.5/分左右,是可以接受的价格,毕竟需要调用第三方的api,所以收费是可以理解的。

另外,arctime是在mac环境下开发的,对mac比较友好。影视行业,mac应该占了大半吧,同时arctime也支持其他系统。

使用arctime进行自动字幕转换的好处是,可以修改、校对都在软件里完成,图形化界面,使用简单,不需要折腾。

7、在线字幕工具

一些网页版字幕生成工具:

极简字幕(音转文)

极简字幕,暂时是我找到的所有收费的字幕服务里,最便宜的,0.1元/分。

网页设计的也很简洁,但是用户中心也太多简洁了,登陆和没登陆一个样,这点要吐槽一下。

突字幕 字幕酱 语音自动生成字幕

这些在线字幕生成工具,都是属于二道贩子,调用百度、阿里云等第三方的API,甚至是别家的免费API。

8、YouTube

还有种方法,就是上传到youtube,设为私密,让YouTube生成字幕以后,用字幕下载工具下载下来。

小结:

总结一下,如果是日常视频制作,首推的是网易见外(免费,准确)。

其次讯飞(准确,便宜)。

现在的非编软件,支持srt的编辑,比如DaVinci resolve,srt文件直接往轨道上拖就完事儿。直接在剪辑软件里校对字幕也很方便,关键是如果需要修改时间线,可以顺手就把字幕时间轴改了,不同在专门的字幕软件里去倒腾。

如果本身有写好的文字稿,不想一字字去校对语音识别出来的字幕,可以用arctime的自动打轴功能,不贵,省事。

如果要制作双语字幕,可以试试人人译视界,如果嫌贵不想用它的字幕功能,那就当作ffmpeg的图形化界面使用吧。日常的一些使用,比iffmpeg好用多了,压制,抽取,合并,转码,封装……应有尽有。

0
本文系作者 @向安宇 原创发布在 讲故事的手艺人。未经许可,禁止转载。
Mac下FFmpeg安装(顺便折腾下autosub)
上一篇
mac 切换phthon版本
下一篇

评论 (0)

登录后可发布~
立即登录
暂无评论

向安宇

痴迷文字,醉心影像
439
文章
5
评论
325
喜欢

聚合文章

AI短剧制作(五、总结)
AI短剧制作(四、AI分镜脚本:Kimi/Deepseek)
AI短剧制作(三、AI剧本:Deepseek)
AI短剧制作(二、故事要素)

近期评论

是的,正在挤时间研究
—— 向安宇 2 年前 网站的初衷
该玩ai啦
—— 偽夜 2 年前 网站的初衷
你好,关于举例的两部电影,快门角度大/小应该写反了,战争应用的更小的角度实现高快门。另想请教一下,已知电影机的ei会影响动态范围,请问民用机的ISO也会吗?还是存在特例?
—— 1656242081437 3 年前 1、快门
太棒啦,终于有地方解释清楚了
—— DZT 4 年前 AE表达式|23、如何用颜色取样制造隐身效果?@sampleImage
谢谢作者的文章~ 学到了,大佬的个人站做的真好!这个夜间模式很耐看,默认字体也是我喜欢的opposans哈哈哈哈
—— charon 4 年前 AE表达式|34、如何制作果冻效果(挤压与伸展)?

猜你喜欢

《回到被爱的每一天》文艺低饱和色调

《回到被爱的每一天》文艺低饱和色调

2020-02-09 12:24:19
907 0 0
《少年派的奇幻漂流》落日灿金色调

《少年派的奇幻漂流》落日灿金色调

2020-02-05 18:44:13
1,499 0 0
《变形金刚3》的青绿色调:冷暖色分别调色

《变形金刚3》的青绿色调:冷暖色分别调色

2020-02-01 19:32:34
2,255 0 0
《被解救的姜戈》胶片兰迪紫色调

《被解救的姜戈》胶片兰迪紫色调

2020-02-06 16:38:29
1,621 0 0

关于我:

想要读万卷书,行万里路,看万部电影。

推荐栏目:

视频论文 原创教程 后期制作 非虚构 照片 视频

特色专题:

专题汇总 宜看一侃 帧影帧画 美食摄影 重读文学史 青玉记
Copyright © 2016-2025 讲故事的手艺人. 鄂ICP备16005400号-1 鄂公网安备42050602000017号
  • 读书向
  • 创作向
    • 写作
    • 视听
  • 技术向
    • AI研究
    • 筹备策划
    • 前期拍摄
    • 后期制作
    • 原创教程
    • 影像实验
    • 影像设备
  • 艺术向
    • 研究学习
    • 大师镜头
    • 电影赏析
    • 视频论文
    • 经验总结
  • 折腾向
    • 穿越机
    • 户外
    • 代码
    • 手工
    • 书法
    • 篆刻
    • 绘画
  • AI工具
  • 剪辑
  • 转场
  • 纪录片

向安宇

痴迷文字,醉心影像
439
文章
5
评论
325
喜欢