哈工大同义词词林 python 使用范例

哈工大的同义词词林，应该是上个世纪的产物，里面的词比较老旧，但好歹也能用

同义词词林的作用，跟word2vec的获取相近词函数比较类似，这两者发挥的功效比较，看具体的应用吧

1. 首先下载包含同义词的txt，CSDN上有链接：http://download.csdn.net/download/answerme11/7307771

2. 得到txt的内容如下：

每一行由一系列的词条构成

每一行的行头的字母及数字编码表示类别

“=”代表“相等”、“同义”；

“#”代表“不等”、“同类”，属于相关词语；

“@”代表“自我封闭”、“独立”，它在词典中既没有同义词，也没有相关词。

3. python调用同义词词林的代码

def get_sym(w,word_set):
    # w:  input word
    # word_set: 同义词词集或相关词词集
    results=[]
    if(len(w)==1):
        for each in word_set:
            for word in each:
                if w == word:
                    results.append(each)
                    break
    else:
        for each in word_set:
            for word in each:
                if w in word:
                    results.append(each)
                    break
    return results

f=open('同义词.txt','r')
lines=f.readlines()
sym_words=[]
sym_class_words=[]
# 从txt中获取词条，构建同义词词集sym_words和相关词词集sym_class_words
for line in lines:
    line=line.replace('\n','')
    items=line.split(' ')
    index=items[0]
    if(index[-1]=='='):
        sym_words.append(items[1:])

    if (index[-1] == '#'):
        sym_class_words.append(items[1:])

print(sym_words)
print(64*'*')
print(sym_class_words)

while True:
    w=input()
    print('同义词',66*'*')
    print(get_sym(w, sym_words))
    print('同类词', 66 * '*')
    print(get_sym(w, sym_class_words))

运行结果：

null

附件列表

哈工大同义词词林 python 使用范例的更多相关文章

原创：centos7.1下 ZooKeeper 集群安装配置+Python实战范例
centos7.1下 ZooKeeper 集群安装配置+Python实战范例下载:http://apache.fayea.com/zookeeper/zookeeper-3.4.9/zookeepe ...
解析搜狗词库(python)
#!/usr/bin/python # -*- coding: utf-8 -*- import struct import sys import binascii import pdb #搜狗的sc ...
从CentOS安装完成到生成词云python学习日记
欢迎访问我的个人博客:原文链接前言人生苦短,我用python.学习python怎么能不搞一下词云呢是不是(ง •̀_•́)ง 于是便有了这篇边实践边记录的笔记. 环境:VMware 12pro + ...
redis集群配置及运行命令(windows和centos)附Python测试范例代码
表示配置主服务器器的IP和端口 slaveof <masterip> <masterport> # 设置slave是否是只读的.从2.6版起,slave默认是只读的. slav ...
Word Cloud (词云) - Python
>>What's Word Cloud 词云 (Word Cloud)是对文本中出现频率较高的词语给予视觉化展示的图形, 是一种常见的文本挖掘的方法.目前已有多种数据分析工具支持这种图形, ...
Leetcode 242.有效的字母异位词 By Python
给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的一个字母异位词. 示例 1: 输入: s = "anagram", t = "nagaram" ...
python --subprocess 范例
范例1:查看ipconfig -all命令的输出,并将将输出保存到文件tmp.log中: import subprocess handle = open(r'd:\tmp.log','w') p=su ...
根据词频生成词云(Python wordcloud实现)
网上大多数词云的代码都是基于原始文本生成,这里写一个根据词频生成词云的小例子,都是基于现成的函数. 另外有个在线制作词云的网站也很不错,推荐使用:WordArt 安装词云与画图包 pip3 insta ...
LeetCode--139--单词拆分(python)
给定一个非空字符串 s 和一个包含非空单词列表的字典 wordDict,判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词. 说明: 拆分时可以重复使用字典中的单词.你可以假设字典中没有重复的 ...

随机推荐

Java Web专题
Kotlin学习记录3
参考我的博客:http://www.isedwardtang.com/2017/09/04/kotlin-primer-3/
Linux Shell编程 exit、break、continue
exit语句在系统中exit 命令用于退出当前用户的登录状态.在 Shell 脚本中exit 语句是用来退出当前脚本. exit 的语法如下: exit [返回值] 如果在 exit 之后定义了返回 ...
官方online ddl
一.5.6版本online DDL 操作 In Place Rebuilds Table Concurrent DML Only Modifies Metadata 说明 add/create sec ...
jQuery鼠标滑动切换焦点图
在线演示本地下载
20145222 黄亚奇《网络对抗》Exp8 Web基础
20145222 黄亚奇 <网络对抗>Exp8 Web基础实践具体要求 (1).Web前端HTML(1分) 能正常安装.启停Apache.理解HTML,理解表单,理解GET与POST方法 ...
bzoj 1623: [Usaco2008 Open]Cow Cars 奶牛飞车
1623: [Usaco2008 Open]Cow Cars 奶牛飞车 Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 325 Solved: 223[S ...
初识 Zookeeper
云计算越来越流行的今天,单一机器处理能力已经不能满足我们的需求,不得不采用大量的服务集群.服务集群对外提供服务的过程中,有很多的配置需要随时更新,服务间需要协调工作,这些信息如何推送到各个节点?并且保 ...
APIGateway网关安全设计
Spring Cloud里面有个组件 Zuul网关网关和过滤器拦截器很相似网关可以实现过滤器拦截器的功能而且可以实现Nginx的基本功能反向代理负载均衡ribbon Nginx是软负载 ...
handle 机制的原理是什么
作者:milter链接:https://www.zhihu.com/question/19703357/answer/107984017来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转 ...

哈工大同义词词林 python 使用范例

附件列表

哈工大同义词词林 python 使用范例的更多相关文章

随机推荐

热门专题