paip.输入法编程---词库多意义条目分割 python实现.



==========子标题

python mysql 数据库操作

多字符分隔,字符串分割

字符列表循环



 作者 老哇的爪子 Attilax 艾龙,  EMAIL:1466519819@qq.com

来源: http://blog.csdn.net/attilax



===================主要的流程

词库原来格式

carp      n.鲤鱼;v.吹毛求疵    813



需要意义分割..



主要的流程如下:



for   sqlQuery

{

    #多分隔符转换为一个..

    clearFmt(row)

    clearBrakets

    split(",")  //

    for insert into grejx_def (en,cn)values('@en','@cn')"

}



----------------------实际代码如下

from db import *

#多分隔符转换为一个..

def clearFmt(Ss):

    Spos="prep.,pron.,n.,v.,conj.,s.,sc.,o.,oc.,vi.,vt.,aux.v.,a.,ad.,art.,num.,int.,u.,c.,pl.,adj."

    print(Spos)



    pos_a=Spos.split(",")

    for index,v in enumerate(pos_a):

        Ss=Ss.replace(v, ",")



    Ss=Ss.replace(";", ",")

    Ss=Ss.replace(",", ",")  

    Ss=Ss.replace(" ", "")  

    Ss=Ss.replace(",,", ",")  

    Ss=Ss.replace(",,", ",")  

    Ss=trim(Ss, ",")  

    print(Ss)

    return Ss

""""

Ssx="v.支持,赞成;容忍;n.表情"

clearFmt(Ssx)

"""





def splitInsert(id, cnstr, en):

    cnstr=clearFmt(cnstr)

    cnstr_a=cnstr.split(",")

 

    for index,v in enumerate(cnstr_a):

 

        sql=" insert into grejx_def (en,cn)values('@en','@cn')"

        sql=sql.replace("@en", trim(en)).replace("@cn", v.strip())

        print(sql)

        reslt= execute(sql)

        print("---insert resl:")

        print(reslt)

        

from pkg import *

from pkg.strUtil import *





Sql="SELECT * FROM `grejx_def` where 1=1 and  ( nAdjV like '%;%'   or nAdjV like  '%,%'   or nAdjV like  '%...%'   or nAdjV like  '%,%'   or nAdjV like  '%;%'    or LENGTH(nAdjV)>5 ) limit 10000"

print(Sql)

fdata=rs(Sql, conn)

for row in fdata:

    

    print(row)

    splitInsert(row['id'], row['nAdjV'], row['en'])

    

    

""""

for (en, cn, id) in cursor:

  print(cn)

"""

paip.输入法编程---词库多意义条目分割 python实现.的更多相关文章

  1. paip.输入法英文词库的处理 python 代码 o4

    paip.输入法英文词库的处理 python 代码 o4 目标是eng>>>中文>>atian 当输入非atian词的时候儿,能打印出 atian pinyin > ...

  2. paip.输入法编程----删除双字词简拼

    paip.输入法编程----删除双字词简拼 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn.net/at ...

  3. paip.输入法编程--英文ati化By音标原理与中文atiEn处理流程 python 代码为例

    paip.输入法编程--英文ati化By音标原理与中文atiEn处理流程 python 代码为例 #---目标 1. en vs enPHati 2.en vs enPhAtiSmp 3.cn vs ...

  4. paip.输入法编程---输入法ATIaN历史记录 c823

    paip.输入法编程---输入法ATIaN历史记录 c823 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csd ...

  5. paip.输入法编程---智能动态上屏码儿长调整--.txt

    paip.输入法编程---智能动态上屏码儿长调整--.txt 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csd ...

  6. paip.数据挖掘--导出词库 清理太长的iptcode

    paip.数据挖掘--导出词库 清理太长的iptcode 原来eng2atian的时候儿,有些cnchar无对眼的atian,走临时使用nonex代替... 而个,要不个那清理给挂了.. #keywo ...

  7. paip.输入法编程---词频顺序order by py

    paip.输入法编程---词频顺序order by py 作者Attilax ,  EMAIL:1466519819@qq.com  来源:attilax的专栏 地址:http://blog.csdn ...

  8. paip.输入法编程---带ord gudin去重复-

    paip.输入法编程---带ord gudin去重复- 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.n ...

  9. paip.输入法编程---增加码表类型

    paip.输入法编程---增加码表类型 作者Attilax ,  EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attil ...

随机推荐

  1. 行锁sqlserver

    SELECT COUNT(1) FROM BLBQ_Sys_TableId With (RowLock,UpdLock) WHERE Table_Name = @Table_Name commit   ...

  2. 对需要聚类的数据使用canopy做初步的计算

    K值聚类的时候,需要自己指定cluster的数目. 这个cluster数目一般是通过canopy算法进行预处理来确定的. canopy具体描述可以参考这里. 下面是 golang语言的一个实现(对经纬 ...

  3. Java获取服务器网址

    StringBuffer url1 = request.getRequestURL(); String tempContextUrl1 = url1.delete(url1.length() - re ...

  4. css颜色表示

    CSS1&CSS2的颜色方式 Color Name方式 用颜色关键字表示对应的颜色. 例如:red(红色).blue(蓝色).pink(粉色) 优点:方便快捷而且特定颜色比较准确 缺点:英文记 ...

  5. css3新属性@ text-shadow

    text-shodow是css3的新属性,可以利用这个属性使字体更有立体感,还可以创造有趣的效果. 1.语法形式:text-shadow : x-offset(x轴偏移量) y-offset(y轴偏移 ...

  6. javascript 高级程序设计 十二

    1.组合使用原型模式和构造函数模式: 由于原型模式创建对象也有它的局限性------有智慧的人就把原型模式和构造函数模式进行了组合. function Person(name, age, job){/ ...

  7. [转载] 散列表(Hash Table) 从理论到实用(下)

    转载自: 白话算法(6) 散列表(Hash Table) 从理论到实用(下) [澈丹,我想要个钻戒.][小北,等等吧,等我再修行两年,你把我烧了,舍利子比钻戒值钱.] ——自扯自蛋 无论开发一个程序还 ...

  8. MongoDB数据库简介及安装

    一.MongoDB数据库简介 简介 MongoDB是一个高性能,开源,无模式的,基于分布式文件存储的文档型数据库,由C++语言编写,其名称来源取自"humongous",是一种开源 ...

  9. [ERROR] Fatal error: Can't open and lock privilege tables: Table 'mysql.host' doesn't exist

    mysql 启动总是报错: 错误日志中显示: [ERROR] Fatal error: Can't open and lock privilege tables: Table 'mysql.host' ...

  10. Git常用命令(自己总是忘记,整理在这里)

    1.git init    初始化一个空的git仓库 2.git clone +SSH地址    clone新的项目到本地 3.git add     git add file 4.git commi ...