利用python将二值csv格式转换为矩阵
#!/usr/bin/env python
# coding:utf-8
#import pandas as pd, numpy as np;
'''
将csv文件转换为对应的邻接矩阵mat
'''
from numpy import *;
def protein_complexes_trans():
file = open('protein_complexes.csv');
filePro = open('complexes', 'a');
fileTarget = open('targets(complexes)','a');
fileInter = open('protein_complexes_interaction_matrix', 'a');
proteins = [];
targets = [];
while 1:
line = file.readline();
if not line:
break;
token = line.split(';');
targ = token[1].split(',');
for i in range(0,len(targ)):
targets.append(targ[i]);
proteins.append(token[0]);
file.seek(0); #将指针重置回第一行
proArr = unique(array(proteins)).tolist(); #去重,并删去最后一项(标题)
tarArr = unique(array(targets)).tolist(); #删去最后
#mat为邻接矩阵
mat = zeros((len(proArr),len(tarArr)), dtype = int16);
while 1:
line = file.readline();
if not line:
break;
token = line.split(';');
targ = token[1].split(',');
row = proArr.index(token[0]);
for i in range(0, len(targ)):
col = tarArr.index(targ[i]);
mat[row][col] = 1;
#输出药物和靶向的列表
for i in proArr:
filePro.write('%s\n' % i);
for i in tarArr:
fileTarget.write('%s\n' % i);
print "%d&%d" % (len(proArr), len(tarArr));
interMat = mat.tolist();
#将矩阵写入文件
for i in range(0, len(proArr)):
fileInter.write('%s\n' % (str(interMat[i])));
return 0;
def drugs_targets_trans():
#print 'hello world';
file = open('drugs_targets_sum');
fileDrug = open('drugs', 'a');
fileTarget = open('targets','a');
fileInter = open('drugs_targets_interaction_matrix', 'a');
drugs = [];
targets = [];
while 1:
line = file.readline();
if not line:
break;
token = line.split(';');
targ = token[1].split(',');
for i in range(0,len(targ)):
targets.append(targ[i]);
drugs.append(token[0]);
file.seek(0); #将指针重置回第一行
drugArr = unique(array(drugs)).tolist(); #去重,并删去最后一项(标题)
tarArr = unique(array(targets)).tolist(); #删去最后
#mat为邻接矩阵
mat = zeros((len(drugArr),len(tarArr)), dtype = int16);
while 1:
line = file.readline();
if not line:
break;
token = line.split(';');
targ = token[1].split(',');
row = drugArr.index(token[0]);
for i in range(0, len(targ)):
col = tarArr.index(targ[i]);
mat[row][col] = 1;
#输出药物和靶向的列表
for i in drugArr:
fileDrug.write('%s\n' % i);
for i in tarArr:
fileTarget.write('%s\n' % i);
interMat = mat.tolist();
for i in range(0, len(drugArr)):
fileInter.write('%s\n' % (str(interMat[i])));
#protein_complexes_trans();
drugs_targets_trans();
利用python将二值csv格式转换为矩阵的更多相关文章
- python 爬虫数据存入csv格式方法
python 爬虫数据存入csv格式方法 命令存储方式:scrapy crawl ju -o ju.csv 第一种方法:with open("F:/book_top250.csv" ...
- 利用Python计算π的值,并显示进度条
利用Python计算π的值,并显示进度条 第一步:下载tqdm 第二步;编写代码 from math import * from tqdm import tqdm from time import ...
- Mac OS X将CSV格式转换为Excel文档格式,Excel转CSV中文乱码问题
一:在Mac上假设你使用Excel打开windows导出的CSV格式文档.你会发现表格中全部的的内容都显示在A列. 那么,怎样恢复正常呢,你能够将CSV格式的文档导入到Excel文档中,这样就正常显示 ...
- 10、OpenCV Python 图像二值化
__author__ = "WSX" import cv2 as cv import numpy as np #-----------二值化(黑0和白 255)---------- ...
- python图片二值化提高识别率
import cv2from PIL import Imagefrom pytesseract import pytesseractfrom PIL import ImageEnhanceimport ...
- opencv python 图像二值化/简单阈值化/大津阈值法
pip install matplotlib 1简单的阈值化 cv2.threshold第一个参数是源图像,它应该是灰度图像. 第二个参数是用于对像素值进行分类的阈值, 第三个参数是maxVal,它表 ...
- 利用Python制作二维码
利用简单的Python代码制作二维码 一.制作工具 安装Python环境 + PyCharm编译器. 二.电脑系统 本人win10 + Python3.7.0 + PyCharm. 三.写代码前先下载 ...
- 利用mysqldump命令导出为csv格式文件
解决方法: 先导出为txt文件,其内容是以逗号“,”分隔的,得到txt文件后,再自行处理为.csv或者.xls文件. 参数说明: -t, --no-create-info Don't write ...
- python习题_读写csv格式的文件
1.读写TXT文件 # *_* coding : UTF-8 *_* # 开发人员 : zfy # 开发时间 :2019/7/7 16:26 # 文件名 : lemon_10_file.PY # 开发 ...
随机推荐
- 这个jQuery导航菜单怎么样
效果体验:http://keleyi.com/keleyi/phtml/jqtexiao/39.htm HTML文件代码: <!DOCTYPE html> <html xmlns=& ...
- iOS AutoLayout的用法
添加约束 代码实现Autolayout的步骤 利用NSLayoutConstraint类创建具体的约束对象 添加约束对象到相应的view上 - (void)addConstraint:(NSLayou ...
- sharepoint2013爬xls文件:Error initializing IFilter for extension的解决方案
最近sharepoint2013爬网出现: error initializing IFilter for extension '.xls' (Error code is 0x80030002). Th ...
- 转一篇简洁的UIView动画编程方法
iOS 中的 UIView 动画编程其实还是很简单的,像 CSS3 一样,在给定的时间内完成状态连续性的变化呈现.比如背景色,Frame 大小,位移.翻转,特明度等. 以前我使用的编程方式都是用下面 ...
- APP上架证书无效:解决
转发:http://www.cnblogs.com/pruple/p/5523767.html 转发:http://blog.csdn.net/sunnyboy9/article/details/50 ...
- Blogging with github Pages
参考: 阮大大:搭建一个免费的,无限流量的Blog----github Pages和Jekyll入门 使用BitBucket和FTPloy私有Jekyll源码 http://www.pchou.inf ...
- Play Framework 完整实现一个APP(十二)
1.定制CRUD管理页面 > play crud:ov --layout 替换生成文件内容 app/views/CRUD/layout.html #{extends 'admin.html' / ...
- vim linux下查找显示^M并且删除
linux下 ^M的输入方法是ctrl+v然后再ctrl+m vim下在文件中显示^M:e ++ff=unix % 在文件中删除^M:%s/^M$//g 在linux下查找^Mfind ./ | xa ...
- 十几张表的join(千万级/百万级表) 7hours-->5mins
================START============================== 来了一个mail说是job跑得很慢,调查下原因 先来看下sql: SELECT h.order_ ...
- [转载]java之yield(),sleep(),wait()区别详解
原文地址:http://dylanxu.iteye.com/blog/1322066 1.sleep() 使当前线程(即调用该方法的线程)暂停执行一段时间,让其他线程有机会继续执行,但它并不释放对象锁 ...