Koharu:机器学习驱动的漫画翻译器
Koharu 引入了一种全新的漫画翻译工作流程,借助机器学习的力量实现流程自动化。它整合了目标检测、光学字符识别(OCR)、图像修复和大语言模型(LLMs)等功能,打造出无缝的翻译体验。
在底层实现上,小晴(Koharu)使用 candle 和 llama.cpp 进行高性能推理,并使用 Tauri 构建图形用户界面(GUI)。所有组件均用Rust编写,以确保安全性和速度。
功能
- 自动检测并分割对话气泡
- 利用OCR识别漫画文字
- 通过图像修复去除图片中的原始文字
- 基于大语言模型(LLM)进行翻译
- 为中文、日文、韩文提供竖排文字排版
- 导出为带可编辑文字的分层PSD文件
- 本地HTTP API和MCP服务器,实现自动化操作

https://github.com/mayocream/koharu