基于AI来汉化Joomla扩展的尝试
之前Joomla中文网的汉化平台使用Goolge翻译API和百度翻译API来实现自动汉化,这种方案存在很大的一个问题就是没有足够的上下文支持使得翻译的结果并不理想,另外,API接口处理包含HTML字符的汉化存在编码的问题,保存后容易出现整个翻译文件不能用的情况。最近在使用Github Coplot进行辅助开发,发现其能够很好的理解上下文,脑中出现了一个想法,能否使用AI来进行Joomla扩展的汉化呢?
汉化的基本原理
对于标准的Joomla扩展,语言文件一般都放在网站根目录下的language目录或者扩展包的安装目录的language子目录里面。语言文件是一个ini文件,以键值对的形式存在。我们需要做的就是复制英文语言文件,将其重命名为对应中文的语言文件。比如 英文文件为 en-GB.com_zmaxshop.ini.则其对应的中文语言文件则是 zh-CN.com_zmaxshop.ini.之后要做的事情就是将原先英文的翻译转为中文即可。
比想象中简单
原本我以为还需要做一些预处理,但实际操作却非常的简单。只需要将文件在编辑器中打开,然后在聊天窗口输入“请将里面的英文翻译成简体中文”,等待片刻,就得到了结果。而且效果还不错。
具体实操
本次需要翻译的Joomla扩展是 autoreadmore插件(可以前往Joomla中文网扩展栏目下载https://www.joomlachina.cn/extension-home),这个插件可以自动从正文中提取简介和缩略图。目前官方是没有简体中文语言包。
使用的AI工具是Curosr.
操作步骤如下:
- 安装插件后,在插件的根目录里面找到英文语言文件,plg_content_autoreadmore.ini
- 将其在cursor编辑器中打开
- 然后在聊天窗口输入“请将里面的英文翻译成简体中文”,等待片刻,就得到了英文结果。第一次看到翻译效果的时候,我都震惊了,居然连HTML标签都自动的帮处理好了。
- 在languages目录下新建一个zh-CN.plg_content_autoreadmore.ini的文件,将翻译的结果复制到文件中。注意需保存为UTF8无bom格式,
- 登陆joomla后台,发现扩展已经顺利汉化
整个的操作截图:

对翻译结果的评估
对于当前这个小插件,词条数只有300行左右,整体来说,这个翻译是非常让我满意的,基本上达到了人工80%的水准。如果能够提供更多的上下文环境,我感觉效果还有往上提升的空间
全自动化
如果将上面手动操作的过程进行API调用,结合之前汉化平台的部分,只需要将核心的翻译模块进行平替,那么理论上Joomla扩展的汉化完全是可以全自动运行的。剩下的只是工程实践问题。
感慨
之前一些感觉很难处理的问题,现在借助于AI技术一下子就变得简单了。AI给我们提供了解决问题的另外一种思路。对于一些旧的项目进行AI重构也许会是一个不错的卖点。
基于AI来汉化Joomla扩展的尝试的更多相关文章
- 基于AOP的插件化(扩展)方案
在项目迭代开发中经常会遇到对已有功能的改造需求,尽管我们可能已经预留了扩展点,并且尝试通过接口或扩展类完成此类任务.可是,仍然有很多难以预料的场景无法通过上述方式解决.修改原有代码当然能够做到,但是这 ...
- Joomla插件汉化小程序
这两天在搞joomla插件,在看peter的视频,在此谢过他了.看到它汉化插件那个视频.反正闲着无聊,就写了一个Java小程序,方便使用joomla的人汉化插件.这个程序的方法很简单,你只要先运行ou ...
- recovery 界面汉化过程详解
一. 主要是针对recovery汉化,主要汉化对象是界面显示为中文. 二. 基于中文的汉化,有两种方式,一种是基于GB2312的编码格式汉化,另外一种是基于unicode编码格式汉化.下面介绍unic ...
- WTL汉化版
基于 WTL90_4060 仅汉化了Windows部分,CE和Mobile未汉化 AppWizard和rc文件已全部汉化 如果不需要汉化则将所有的2052目录删除即可 如有问题可以给我留言 点我下载
- android studio的汉化 教程 及解析
android studio的汉化 教程 及解析 作者:韩梦飞沙 Author:han_meng_fei_sha 邮箱:313134555@qq.com E-mail: 313134555 @qq.c ...
- foobox,基于foobar2000汉化版的CUI配置整合版
名 称:foobox 作 者:dreamawake 发布博客:https://www.cnblogs.com/foobox/ GitHub: https://github.com/dream7180/ ...
- 最新版本 Stable Diffusion 开源 AI 绘画工具之汉化篇
目录 汉化预览 下载汉化插件一 下载汉化插件二 下载汉化插件三 开启汉化 汉化预览 在上一篇文章中,我们安装好了 Stable Diffusion 开源 AI 绘画工具 但是整个页面都是英文版的,对于 ...
- 【推荐】桌面版AI伴侣 含2.47 2.49 2.51汉化版
桌面版AI伴侣,无需安装aiStarter,直接运行bat就能在电脑上启动AI伴侣,启动速度比虚拟机快很多.缺点是对硬件的要求比较高. 文件来自 https://mp.weixin.qq.com/s/ ...
- 基于bootstrap的时间选择插件daterangepicker以及汉化方法
双日历时间段选择插件 — daterangepicker是bootstrap框架后期的一个时间控件: 可以设定多个时间段选项:也可以自定义时间段:由用户自己选择起始时间和终止时间:时间段的最大跨度可以 ...
- 基于CentOS7.x gitlab环境搭建,卸载,汉化 --汉化篇
gitlab环境搭建,卸载,汉化--汉化篇 注意gitlab的版本需和汉化版本一致 安装git yum install -y git 下载最新的汉化包 cd git clone https://git ...
随机推荐
- Web前端入门第 10 问:HTML 段落标签( <p> )嵌套段落标签( <p> )的渲染结果会怎样?
HELLO,这里是大熊学习前端开发的入门笔记. 本系列笔记基于 windows 系统. 曾经有一个神奇的 bug 摆在我面前,为什么套娃一样的 HTML 语法,在段落标签 <p> 身上不生 ...
- 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
FRP 是 Github 上开源的一款内网穿透工具,点击前往项目地址,该项目分为 frps 服务端和 frpc 客户端,通过在拥有公网 IP 的服务器上搭建服务端,然后在被穿透的机器上安装客户端,配置 ...
- PHP Fatal error: Uncaught RedisException: Redis server went away in
PHP Fatal error: Uncaught RedisException: Redis server went away in 导致这个问题的原因可能有 1.redis未安装,php没有开启r ...
- MUX-VLAN
MUX VLAN(Multiplex VLAN)是一种高级的VLAN技术,它通过在交换机上实现二层流量隔离和灵活的网络资源控制,提供了一种更为细致的网络管理方式. 一.基本概念 MUX VLAN分为主 ...
- oracle服务 linux启动命令
一.Linux下启动Oracle Linux下启动Oracle分为两步: 1)启动监听: 2)启动数据库实例: 1.登录服务器,切换到oracle用户,或者以oracle用户登录 [admin@dat ...
- BUUCTF---basic RSA
题目 给出一个RSA加密的密文,阐述了RSA,主要就是代码实现解密 代码 点击查看代码 import gmpy2 from Crypto.Util.number import * from binas ...
- [每日算法 - 阿里机试] leetcode19. 删除链表的倒数第 N 个结点 「 详细图释一看就懂!」
入口 力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台备战技术面试?力扣提供海量技术面试资源,帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer.https://le ...
- ANSYS 命令流导航
常见书籍 ANSYS 命令流导航 GitHub 项目:ANSYS_Code Gitee 镜像:ANSYS_Code 欢迎补充~ 文件说明 doc 中包括 ANSYS, ABAQUS, LS-DYNA ...
- RocketMQ学习与总结
一.基本介绍 1.应用场景 消息队列是一种先进先出的数据结构,常见的应用场景: 应用解耦:系统的耦合性越高,容错性就越低 实例:用户创建订单后,耦合调用库存系统.物流系统.支付系统,任何一个子系统出了 ...
- idea 导入类时报红
在idea打开新项目的时候发现有的类不能通过import进行导入,删除target目录,重新编译也无济于事. 解决办法: 在idea中选择File-->Invalidate Caches/Res ...