我最近在阅读桥水基金创始人瑞·达利欧写的《原则》,闲暇之余,我还访问了桥水的官网,以丰富读书体验。棘手的是,视频没有字幕,又涉及专业术语,我无法流畅观看,更谈不上学习。这个问题,我对若干方案进行了实践和思考,现记录并分享出来。
动手实践
我习惯性去拆解问题,发现至少要分三步。一是从网站下载视频,二是把视频转录成文本,三是翻译转录的文本。问题拆解完之后,第一个方案就出来了,使用三个工具即可:Downie 4、Whisper和翻译工具。Downie 4可以用于在网页快速解析并下载视频。Whisper可以在本地转录文本,细节可参考我之前写的《使用Whisper全自动转录语音备忘录》。至于翻译工具,选择很多,不赘述。
上述方案,我想到之后立刻执行,在短时间内,做好了双语字幕。处理完之后,我开始思考如何优化,使其更加便捷。思考时,我想到了「抽象阶梯」框架,使我有了新启发。在介绍其他方案之前,我先说说抽象阶梯是什么以及怎么用。
抽象阶梯
所谓抽象阶梯,按照我的理解,是一种可以辅助你更精确定义核心问题,并找到解决方案的思考框架。使用步骤简单,只需把遇到的问题,写在纸张或白板中间位置。往上思考「为什么」,用于抽象当前的问题,尝试找到问题的核心或本质。往下思考「怎么办」,用于列举具体的解决方案。这种框架的好处在于,可以让你对定义的问题,既有全面的认知,又有细节的思考。
说回视频处理流程的优化,我发现自己一直沿着「怎么办」的方向着力,并没有想「为什么」。我的问题可以定义为,未来遇到没有字幕的视频,我要怎么获取双语字幕。往「为什么」方向思考,答案显而易见,我想理解和学习更多感兴趣的知识,并克服语言理解的障碍。那怎么克服语言理解的障碍呢?除了提升多语言能力之外,还有就是找到方法,轻松获取双语字幕。这样思考之后,我原先的优化问题,就可变成,是否有良好的解决方案或现成的工具,让我快速获取双语字幕。
需要说明的是,我实际思考的过程,并没有文字表述那么清晰,是模糊且跳跃的。写出来,可以辅助自己,回溯思考活动。抽象阶梯框架,让我意识到,思考问题可以站在两个方向,避免盲目下钻。
寻找捷径
回到解决方案的优化,我明确了找方法快速获取字幕才是重点,优化自己的方案不是首选项。我想到了第二种方式,下载视频,并上传到飞书妙记。飞书妙记可以处理文字的转录,转录成功之后,结合网页翻译,我可以直接高效观看外文视频。这个方案,几乎没有技术门槛,只需要下载视频,登录飞书妙计,就可以搞定。缺点有两点,一是需要上传视频,二是有隐私要求的情况,不建议使用。话说回来,对于大部分学习场景,此方案足够应付。
更进一步
除了飞书妙记的方案,我还找到了隐私友好的选择。凭着印象,我在宝玉老师的分享中,找到了一款支持本地转录的应用——Memo。它支持本地转录和GPU加速,现在尚处于Beta阶段。我找到之后申请了测试,很快拿到了邀请码。接近60分钟的播客,我的电脑转录用Base.en模型转录,用了约4分钟。转录效果和速度我都很满意。Memo同时也支持字幕翻译和双语对照。功能细节有很大打磨空间,不过瑕不掩瑜,在核心功能的实现上,这款软件满足了我眼前的需求,且完成了我在方案一中想优化的流程。
结语
使用抽象阶梯框架思考之后,我慢慢找到了更优秀的选择。我想,工具或者方案本身固然有其价值,而问题的选择和思考的质量,有更大的影响。我喜欢记录思考的原因也在此,如果只是分享工具或结论,就容易跳过了最值得记录的过程。
最后,我还有三个Memo邀请码未用,数量有限,非商业推广,请有需求的朋友自行取用。用上邀请码的朋友,可以在评论区提醒一声。如邀请码失效,可自行去官网Memo AI申请。
uaZZ-rKkq-2gPJ-GdvE
QWK4-3AC4-g8ER-Uw72
cSMD-eZJJ-kC88-Y83w
如果这次分享对你有所帮助和启发,欢迎点赞和评论和我互动,下次见。