基于AI来汉化Joomla扩展的尝试
之前Joomla中文网的汉化平台使用Goolge翻译API和百度翻译API来实现自动汉化,这种方案存在很大的一个问题就是没有足够的上下文支持使得翻译的结果并不理想,另外,API接口处理包含HTML字符的汉化存在编码的问题,保存后容易出现整个翻译文件不能用的情况。最近在使用Github Coplot进行辅助开发,发现其能够很好的理解上下文,脑中出现了一个想法,能否使用AI来进行Joomla扩展的汉化呢?
汉化的基本原理
对于标准的Joomla扩展,语言文件一般都放在网站根目录下的language目录或者扩展包的安装目录的language子目录里面。语言文件是一个ini文件,以键值对的形式存在。我们需要做的就是复制英文语言文件,将其重命名为对应中文的语言文件。比如 英文文件为 en-GB.com_zmaxshop.ini.则其对应的中文语言文件则是 zh-CN.com_zmaxshop.ini.之后要做的事情就是将原先英文的翻译转为中文即可。
比想象中简单
原本我以为还需要做一些预处理,但实际操作却非常的简单。只需要将文件在编辑器中打开,然后在聊天窗口输入“请将里面的英文翻译成简体中文”,等待片刻,就得到了结果。而且效果还不错。
具体实操
本次需要翻译的Joomla扩展是 autoreadmore插件(可以前往Joomla中文网扩展栏目下载https://www.joomlachina.cn/extension-home),这个插件可以自动从正文中提取简介和缩略图。目前官方是没有简体中文语言包。
使用的AI工具是Curosr.
操作步骤如下:
- 安装插件后,在插件的根目录里面找到英文语言文件,plg_content_autoreadmore.ini
- 将其在cursor编辑器中打开
- 然后在聊天窗口输入“请将里面的英文翻译成简体中文”,等待片刻,就得到了英文结果。第一次看到翻译效果的时候,我都震惊了,居然连HTML标签都自动的帮处理好了。
- 在languages目录下新建一个zh-CN.plg_content_autoreadmore.ini的文件,将翻译的结果复制到文件中。注意需保存为UTF8无bom格式,
- 登陆joomla后台,发现扩展已经顺利汉化
整个的操作截图:

对翻译结果的评估
对于当前这个小插件,词条数只有300行左右,整体来说,这个翻译是非常让我满意的,基本上达到了人工80%的水准。如果能够提供更多的上下文环境,我感觉效果还有往上提升的空间
全自动化
如果将上面手动操作的过程进行API调用,结合之前汉化平台的部分,只需要将核心的翻译模块进行平替,那么理论上Joomla扩展的汉化完全是可以全自动运行的。剩下的只是工程实践问题。
感慨
之前一些感觉很难处理的问题,现在借助于AI技术一下子就变得简单了。AI给我们提供了解决问题的另外一种思路。对于一些旧的项目进行AI重构也许会是一个不错的卖点。
基于AI来汉化Joomla扩展的尝试的更多相关文章
- 基于AOP的插件化(扩展)方案
在项目迭代开发中经常会遇到对已有功能的改造需求,尽管我们可能已经预留了扩展点,并且尝试通过接口或扩展类完成此类任务.可是,仍然有很多难以预料的场景无法通过上述方式解决.修改原有代码当然能够做到,但是这 ...
- Joomla插件汉化小程序
这两天在搞joomla插件,在看peter的视频,在此谢过他了.看到它汉化插件那个视频.反正闲着无聊,就写了一个Java小程序,方便使用joomla的人汉化插件.这个程序的方法很简单,你只要先运行ou ...
- recovery 界面汉化过程详解
一. 主要是针对recovery汉化,主要汉化对象是界面显示为中文. 二. 基于中文的汉化,有两种方式,一种是基于GB2312的编码格式汉化,另外一种是基于unicode编码格式汉化.下面介绍unic ...
- WTL汉化版
基于 WTL90_4060 仅汉化了Windows部分,CE和Mobile未汉化 AppWizard和rc文件已全部汉化 如果不需要汉化则将所有的2052目录删除即可 如有问题可以给我留言 点我下载
- android studio的汉化 教程 及解析
android studio的汉化 教程 及解析 作者:韩梦飞沙 Author:han_meng_fei_sha 邮箱:313134555@qq.com E-mail: 313134555 @qq.c ...
- foobox,基于foobar2000汉化版的CUI配置整合版
名 称:foobox 作 者:dreamawake 发布博客:https://www.cnblogs.com/foobox/ GitHub: https://github.com/dream7180/ ...
- 最新版本 Stable Diffusion 开源 AI 绘画工具之汉化篇
目录 汉化预览 下载汉化插件一 下载汉化插件二 下载汉化插件三 开启汉化 汉化预览 在上一篇文章中,我们安装好了 Stable Diffusion 开源 AI 绘画工具 但是整个页面都是英文版的,对于 ...
- 【推荐】桌面版AI伴侣 含2.47 2.49 2.51汉化版
桌面版AI伴侣,无需安装aiStarter,直接运行bat就能在电脑上启动AI伴侣,启动速度比虚拟机快很多.缺点是对硬件的要求比较高. 文件来自 https://mp.weixin.qq.com/s/ ...
- 基于bootstrap的时间选择插件daterangepicker以及汉化方法
双日历时间段选择插件 — daterangepicker是bootstrap框架后期的一个时间控件: 可以设定多个时间段选项:也可以自定义时间段:由用户自己选择起始时间和终止时间:时间段的最大跨度可以 ...
- 基于CentOS7.x gitlab环境搭建,卸载,汉化 --汉化篇
gitlab环境搭建,卸载,汉化--汉化篇 注意gitlab的版本需和汉化版本一致 安装git yum install -y git 下载最新的汉化包 cd git clone https://git ...
随机推荐
- 【Python自动化测试环境管理】tox
1. tox基本介绍 1.1 tox是什么? tox 是一个用于管理 Python 项目的自动化测试和环境管理工具.它的主要功能是创建虚拟环境并运行项目的测试套件,tox能够让我们在同一个Host上自 ...
- BUUCTF---keyboard
题目 ooo yyy ii w uuu ee uuuu yyy uuuu y w uuu i i rr w i i rr rrr uuuu rrr uuuu t ii uuuu i w u rrr e ...
- 《机器人SLAM导航核心技术与实战》第1季:第11章_自主导航中的数学基础
<机器人SLAM导航核心技术与实战>第1季:第11章_自主导航中的数学基础 视频讲解 [第1季]11.第11章_自主导航中的数学基础-视频讲解 [第1季]11.1.第11章_自主导航中的数 ...
- study Rust-2【环境与配置,随机数】
Rust教程资料很多.但是,这是教程学习资料感觉挺好!推荐给你https://doc.rust-lang.org/stable/book/ (简体中文译本)在线阅读 学习rust开始有点感觉了.美好的 ...
- shell子字符串截取
http://c.biancheng.net/view/1120.html Shell 截取字符串通常有两种方式:从指定位置开始截取和从指定字符(子字符串)开始截取. 从指定位置开始截取 这种方式需要 ...
- EvoSuite使用总结
1.安装EvoSuite插件 以IDEA为例,在Plugins栏搜索EvoSuite后点击install,安装完成后重启IDEA 2.使用EvoSuite 选中文件右键选择Run EvoSuite 生 ...
- JMeter提取多个变量值总结
- Visual Studio 2022 v17.13新版发布:强化稳定性和安全,助力 .NET 开发提效!
前言 今天大姚带领大家一起来看看 Visual Studio 2022 v17.13 新版发布都更新了哪些新功能,为我们开发工作带来了哪些便利,是否真的值得我们花费时间把 Visual Studio ...
- jmeter返回值作为参数传给后面的步骤使用的方法
如,系统返回data 通过正则获取data后的数据,且名称定义为id 然后通过${id}的方式传参给需要使用的地方
- Sentinel源码—3.ProcessorSlot的执行过程
大纲 1.NodeSelectorSlot构建资源调用树 2.LogSlot和StatisticSlot采集资源的数据 3.Sentinel监听器模式的规则对象与规则管理 4.AuthoritySlo ...