简介
Yaku是作者用600多本轻小说训练了中日翻译模型.
根据作者介绍, 翻译效果比谷歌翻译, 百度翻译有道等机翻效果要好, 比GPT4模型翻译效果差些, GPT4很贵, 而且有某些限制(你懂的), 使用Yaku来看未有翻译版的轻小说是一个不错的选择.
由于使用的台版的轻小说, 所以先会翻译成台版繁体中文, 再转为简体, 有些名词会有台版小说的名名词, 虽然称不上完美,但是整体的效果还是不错的。
作者是B站的UP主CjangCjengh
原贴: 我用600多本轻小说训练了中日翻译模型
https://www.bilibili.com/video/BV1b44y1F7VL/
项目代码
https://github.com/CjangCjengh/YakuYaku
这个项目是可以使用GPU显卡加速进行翻译的, 我试了下翻译450k的物语系列的<死物语>上篇, 笔记本CPU是 i7 11800H 显卡是3070跑了两小时翻译完, CPU占用100%, GPU占用60%左右, 显存占用7.5G左右, 翻译效果还不错。
有兴趣的可以去下载来看下效果
西尾维新《死物语》上+下 日版原文+机翻
链接:https://pan.baidu.com/s/1DLuZxm0-mBIqxMDDByrzYQ?pwd=1111
作者只打包了CPU的运行环境的版本, 但我们可以自己安装环境来使用GPU版本, 以加快翻译速度, 如果没有nvidia显卡, 那么用作者打包的CPU版本即可
使用git拉取项目到本地, 或者下载项目到本地
git clone https://github.com/CjangCjengh/YakuYaku.git
在项目根目录下新建文件夹models, 下载项目介绍上所需的两个模型放入models里
如果访问不了的话, 也可以下载我百度盘打包的
链接: https://pan.baidu.com/s/1Z3IIAyDby2zXHUFSvcLuoA?pwd=a7zp 提取码: a7zp
安装环境
01 安装Python环境
我这里选择python-3.10.8版本, 如果装有可以略过这个步骤, 在03步选择你python对应的pytouch版本
https://www.python.org/ftp/python/3.10.8/python-3.10.8-amd64.exe
安装完成后, 按住windows+r打开命令提示符, 输入python出现python界面后即代表安装成功
02 安装Python依赖环境
输入下面命令, 升级pip版本
python -m pip install --upgrade pip
在项目目录下输入cmd进入命令行, 安装依赖环境
pip install -r .\requirements.txt
03 CUDA环境
首先nvidia升级你的显卡驱动到最新
https://www.nvidia.cn/Download/index.aspx?lang=cn
下载cuda环境包并安装
下载pytouch并安装
按截图选择对应的版本
复制安装参数在命令行输入安装, 如下
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
使用
安装好环境后我们就可以使用了, 在项目目录输入cmd, 在命令行输入
python YakuYaku.py
即可启动, 并且可以使用GPU CUDA进行加速
小提示: 如果选择繁简转换选项会花费更多的时间
评论 (0)