python 绘制三国人物关系图

author:weizhendong

data：2019.12.19

func:绘制三国演义人物关系图

"""

import codecs

import jieba.posseg as pseg

import xlwt

def excel_write(names,workbook):

# 创建一个worksheet

worksheet = workbook.add_sheet('node')

worksheet.write(0, 0, label='ID')

worksheet.write(0, 1, label='Label')

worksheet.write(0, 2, label='Weight')

i=1

for name, times in names.items():

if times > 10:

worksheet.write(i, 0, label=str(name))

worksheet.write(i, 1, label=str(name))

worksheet.write(i, 2, label=str(times))

i = i+1

# 创建一个worksheet

worksheet1 = workbook.add_sheet('edge')

worksheet1.write(0, 0, label='Source')

worksheet1.write(0, 1, label='Target')

worksheet1.write(0, 2, label='Weight')

i=1

for name, edges in relationships.items():

for v, w in edges.items():

if w > 10:

worksheet1.write(i, 0, label=name)

worksheet1.write(i, 1, label=v)

worksheet1.write(i, 2, label=str(w))

i = i+1

workbook.save('People_node.xls')

names = {}# 保存人物，键为人物名称，值为该人物在全文中出现的次数

relationships = {}#保存人物关系的有向边，键为有向边的起点，值为一个字典 edge ，edge 的键为有向边的终点，值是有向边的权值

lineNames = []# 缓存变量，保存对每一段分词得到当前段中出现的人物名称

excludes = {'将军', '却说', '令人', '赶来', '徐州', '不见', '下马', '喊声', '因此', '未知', '大败', '百姓', '大事', '一军', '之后', '接应', '起兵',

'成都', '原来', '江东', '正是', '忽然', '原来', '大叫', '上马', '天子', '一面', '太守', '不如', '忽报', '后人', '背后', '先主', '此人',

'城中', '然后', '大军', '何不', '先生', '何故', '夫人', '不如', '先锋', '二人', '不可', '如何', '荆州', '不能', '如此', '主公', '军士',

'商议', '引兵', '次日', '大喜', '魏兵', '军马', '于是', '东吴', '今日', '左右', '天下', '不敢', '陛下', '人马', '不知', '都督', '汉中',

'一人', '众将', '后主', '只见', '蜀兵','马军','黄巾','立功','白发','大吉','红旗','士卒','钱粮','于汉','郎舅', '龙凤', '古之', '白虎',

'古人云', '尔乃', '马飞报', '轩昂', '史官', '侍臣', '列阵','玉玺','车驾','老夫','伏兵','都尉','侍中','西凉','安民','张曰','文武','白旗',

'祖宗','寻思'} # 排除的词汇

with codecs.open("111111.txt",'r',encoding='utf-8',errors='ignore') as f:

for line in f.readlines():

poss = pseg.cut(line) # 分词，返回词性

lineNames.append([]) # 为本段增加一个人物列表

for w in poss:

if w.flag != 'nr' or len(w.word) < 2 or w.word in excludes:

或该词词性不为nr（人名）时认为该词不为人名

elif w.word == '孔明' or w.word == '孔明曰' or w.word == '卧龙先生':

real_word = '诸葛亮'

elif w.word == '云长' or w.word == '关公曰' or w.word == '关公':

real_word = '关羽'

elif w.word == '玄德' or w.word == '玄德曰' or w.word == '玄德甚' or w.word == '玄德遂' or w.word == '玄德兵' or w.word == '玄德领' \

or w.word == '玄德同' or w.word == '刘豫州' or w.word == '刘玄德':

real_word = '刘备'

elif w.word == '孟德' or w.word == '丞相' or w.word == '曹贼' or w.word == '阿瞒' or w.word == '曹丞相' or w.word == '曹将军':

real_word = '曹操'

elif w.word == '高祖':

real_word = '刘邦'

elif w.word == '光武':

real_word = '刘秀'

elif w.word == '桓帝':

real_word = '刘志'

elif w.word == '灵帝':

real_word = '刘宏'

elif w.word == '公瑾':

real_word = '周瑜'

elif w.word == '伯符':

real_word = '孙策'

elif w.word == '吕奉先' or w.word == '布乃' or w.word == '布大怒' or w.word == '吕布之':

real_word = '吕布'

elif w.word == '赵子龙' or w.word == '子龙':

real_word = '赵云'

elif w.word == '卓大喜' or w.word == '卓大怒':

real_word = '董卓'

else:

real_word = w.word

lineNames[-1].append(real_word) # 为当前段的环境增加一个人物

if names.get(real_word) is None: # 如果某人物（w.word）不在人物字典中

names[real_word] = 0

relationships[real_word] = {}

names[real_word] += 1

# 输出人物出现次数统计结果

# for name, times in names.items():

# print(name, times)

，

。这种方法将产生很多的冗余边，这些冗余边将在最后处理。

for line in lineNames:

for name1 in line:

for name2 in line:

if name1 == name2:

continue

if relationships[name1].get(name2) is None:

relationships[name1][name2] = 1

else:

relationships[name1][name2] = relationships[name1][name2] + 1

# 由于分词的不准确会出现很多不是人名的“人名”，从而导致出现很多外汇返佣冗余边，

，即当边出现10次以上则认为不是冗余

# 创建一个workbook 设置编码

workbook = xlwt.Workbook(encoding = 'utf-8')

# 数据存储

excel_write(names,workbook)

原文链接：https://blog.csdn.net/wei_zhen_dong/article/details/103586780

python 绘制三国人物关系图的更多相关文章

java+数据库+D3.js 实时查询人物关系图
先看下效果某个用户,邀请了自己的朋友 ,自己的朋友邀请了其他朋友,1 展示邀请关系,2 点击头像显示邀请人和被邀请人的关系.(网上这种资料很少, 另外很多都是从JSON文件取数据, 这里是从数据 ...
红楼梦人物关系图，一代大师成绝响，下回分解待何人，kindle读书摘要
人物关系图: https://www.cnblogs.com/images/cnblogs_com/elesos/1120632/o_2033091006.jpg 红楼梦 (古典名著普及文库) ( ...
【 D3.js 高级系列 — 2.0 】机械图 + 人物关系图
机械图(力路线图)结合老百姓的关系图中的生活,这是更有趣. 本文将以此为证据,所列的如何图插入外部的图像和文字的力学. 在[第 9.2 章]中制作了一个最简单的力学图.其后有非常多朋友有疑问,基本的问 ...
Python绘制wav文件音频图(静态)[matplotlib/wave]
#!/usr/bin/env python # -*- coding: utf-8 -*- """ 绘制波形图 plottingWaveform.py "&qu ...
react中使用echarts（人物关系图）
项目中有时会用到echarts,可能不同的框架中语法稍有变通,前几天在react项目中遇到,写此篇以作记录. 不同的charts语法跟支持不同,本篇"echarts": " ...
D3.js+Es6+webpack构建人物关系图(力导向图)
功能列表:1. 增加下载SVG转PNG功能,图片尺寸超出可视区域也能够下载全部显示出来2. 增加图谱放大缩小平移功能3. 增加图谱初始化加载时自动缩放功能4. 增加导出excel功能,配合后台工具类达 ...
D3.js+Es6+webpack构建人物关系图(力导向图)，动态更新数据，点击增加节点，拖拽增加连线...
觉得不错的麻烦加个Star:https://github.com/zhangzn3/D3-Es6 在线预览地址:https://zhangzn3.github.io/D3-Es6 功能列表:1. 增加 ...
[wx]雪落香杉树人物关系图
雪落香杉树开始的时候场面比较宏大,出场的人比较多.加上外国人名字没辨识度,所以容易乱被告人: 宫本天道 9 10 11 12月被关77天(谋杀罪,9.16日早谋杀卡尔.海因)--妻子:初枝白色衬 ...
python实例三国人物出场次序 jieba库
#Cal3kingdoms.py import jieba txt = open("threekingdoms.txt", "r", encoding=&quo ...

随机推荐

纯CSS实现项目展示遮罩详情效果
本实例主要用于项目展示时鼠标hover后显示一个遮罩显示项目详情的效果,遮罩采用CSS的绝对定位以及CSS3盒子模型. 本实例应用广泛,很多品牌官方网站均有采用. hover: <!DOCTYP ...
Codeforces 86D Powerful array （莫队）
D. Powerful array time limit per test 5 seconds memory limit per test 256 megabytes input standard i ...
组件Component详解
[转]https://www.cnblogs.com/moqiutao/p/8328931.html
pve之daemon
pmxcfs The Proxmox Cluster file system (“pmxcfs”) is a database-driven file system for storing confi ...
Memecached 服务器安装（一）
Memecached 服务器安装(一) 前提:首先您的php环境已经安装完成,如若没有则参考 http://www.cnblogs.com/xulele/p/5264781.html 安装环境链接:h ...
MSSQL sql常用判断语句
.判断数据库是否存在 if exists (select * from sys.databases where name = '数据库名') drop database [数据库名] 2 判断 ...
VS代码自动补全功能
VS代码自动补全功能新建工程后,依次打开工具>>代码段管理器>>选择C++>>点击添加(A)...按钮 ,设置你的代码块的目录复制以下代码并存为note.s ...
001---mysql分库分表
mysql分库分表一.整体的切分方式 1.分库分表:即数据的切分就是通过某种特定的条件,将我们存放在同一个数据库中的数据分散存放到多个数据库(主机)中,以达到分散单台设备负载的效果 2.数据的切分根 ...
php编程怎么和mysql连接
php连接mysql的方法: MySQLi - 面向对象 MySQLi - 面向过程关闭连接连接在脚本执行完后会自动关闭.你也可以使用以下代码来关闭连接: (MySQLi - 面向对象 MySQL ...
python之字符串的切片
切片操作(slice)可以从一个字符串中获取子字符串(字符串的一部分).我们使用一对方括号.起始偏移量start.终止偏移量end 以及可选的步长step 来定义一个分片. 格式: [start:en ...

python 绘制三国人物关系图

python 绘制三国人物关系图的更多相关文章

随机推荐

热门专题