公众号关注 “GitHubDaily”
设为 “星标”,每天带你逛 GitHub!
在大语言模型还没开始爆火的时候,GitHub 便已经陆续出现各种各样的 AI 应用,而机器翻译,可谓是其中被应用最为广泛的技术之一。
在 2020 年的时候,我曾给大家推荐过 GitHub 上一款功能超全的 AI 翻译神器:团子翻译器,可直接翻译各种日漫、游戏等内容,帮助不少人打破了语言障碍,实现追番自由。
前阵子我偶然点开了该项目的 GitHub 页面,发现作者在过去几年一直没闲着,在原有基础上新增迭代了不少东西,今天就跟大家重新介绍一下这个项目吧。
简单便捷,OCR 翻译神器
团子翻译器,是由 B 站一个叫胖次の团子的 up 主所制作的 OCR 翻译软件,是一款生肉翻译软件,通过 OCR 识别屏幕特定范围内的文字,然后将识别到的文字调取各种翻译源,并实时输出翻译结果。
GitHub:https://github.com/PantsuDango/Dango-Translator
简单来说,便是能帮你快速翻译出现在电脑屏幕上出现的各种外文(英文、日文、韩文)。
通过这种方式,你可以随意对游戏字幕、番剧字幕、本子、PDF 文献等内容进行快速翻译。
当你用它来翻译漫画时,还可以自动去除气泡对话中的原有语言,并翻译替换为中文。
如果你对翻译的结果不满意,还可以自由替换文本内容和字体风格,主打的就是一个随心所欲。
之前在日漫中,我们经常能看到一种基于轻小说改编的网页小游戏,主角可以通过跟游戏主人公对话的方式,来引导与推进剧情的发展。
不过在这里面,有不少流行的游戏都是日文,现在有了这款翻译工具,便可以一键翻译游戏中的场景对话,让你零门槛感受剧情。就像下面这样:
项目主要有两大常用功能,分别是漫画翻译与游戏界面翻译。
开发者可选择 GPT、百度、腾讯、有道、彩云等 15 种翻译源。以及日语、英语等多个语种。如果有需要,你还可以改动代码,让其支持更多语种。
软件的使用过程也颇为简单,当你完成好基础配置后,只需选中屏幕上的翻译区域,该区域内的外文都会被自动识别并翻译。
一劳永逸,批量化翻译脚本
除了上面介绍的那个开源项目之外,前两天我还在 GitHub 上看到一款与之类似的漫画图片翻译脚本:Image/Manga Translator。
开发者通过 Python 安装配置好项目后,便可批量化对图片进行翻译。
GitHub:https://github.com/zyddnys/manga-image-translator/
在线体验:https://cotrans.touhou.ai/
同样,该项目也可以自动清除与翻译气泡文本,并支持多种语言以及 GPT-4、有道、DeepL 等翻译源。
项目可通过以下命令行快速安装与使用:
# 确认电脑安装了 Python 3.8 及以上版本
$ python --version
Python 3.8.13
# 克隆仓库
$ git clone https://github.com/zyddnys/manga-image-translator.git
# 安装依赖
$ pip install -r requirements.txt
$ pip install git+https://github.com/kodalli/pydensecrf.git
# 指定图片路径并翻译
$ python -m manga_translator --verbose --use-cuda --translator=google --target-lang=CHS -i <path_to_image_file>
作者表示,未来该项目会再持续迭代,实现从视频中自动提取文本并生成 ass 字幕,涂改视频内容,清除已压制的视频字幕,实现自动化字幕替换等功能。
目前这个项目还在持续更新迭代中,大家感兴趣的话,可以试玩一下。
写在最后
可预见的,在各种大语言模型逐渐发展成熟后,机器翻译的流程将会越来越简化。
以视频字幕为例,我们可以基于 Whisper 模型来快速生成视频字幕文本,将字幕文本拆分后,转而提交给 GPT-4 或其他大语言模型进行翻译。
此前我翻译吴恩达老师的《ChatGPT 提示工程》教程时,便是采用的这种方式,唯一美中不足的,就是字幕长度以及翻译结果需要进行二次校对,但即便如此,对比往常的翻译流程,依旧节省了不少时间。
另外,借助一些字幕格式化脚本以及 ffmpeg 工具,我们还可以进一步实现字幕的批量调整、自动化压制,视频压缩等功能。
能够熟练将各种 AI 工具进行配套组合,进而让个人能力发生质变,这是我认为当下人工智能时代,作为普通人最需要掌握的核心技能。
文中所提到的所有开源项目与工具,已收录至 GitHubDaily 的开源项目列表中。
该列表包含了 GitHub 上诸多高质量、有趣实用的开源技术教程、开发者工具、编程网站等内容。
从 2015 年至今,累计分享 3500+ 个开源项目,Star 增长 24000+,有需要的,可访问下方 GitHub 地址自取:
GitHub:https://github.com/GitHubDaily/GitHubDaily
好了,今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!
文章评论