批量更改变量名,就在该变量名上shift+f6

../data

两个点,就是上一级目录,一个点就是当前目录

unhashable type: 'list'

使用set进行去重

a = [1,2,2,3,4]

set(a)是可以的

可是如果a = [[1,2],2,2]就不行,set 进行哈希的时候,需要每个元素都是可哈希的,

可变类型的数据不可哈希,如list,字典:同值不同址,不同值同址

数值、字母、字符串、数字、元组不可变:同值同址,不同值不同址

类变量的值将在这个类的所有实例之间共享

类的方法与普通的函数只有一个特别的区别——它们必须有一个额外的第一个参数名称, 按照惯例它的名称是 self

q = [(1,2),(2,3)]
df = pd.DataFrame(q,columns=['id','question']) # data = DataFrame(np.arange(16).reshape(4,4), index=['Ohio', 'Colorado', 'Utah', 'New York'], columns=['one', 'two', 'three', 'four']) print(df.loc[:1])
df = pd.DataFrame([[1,2,3,4,5]], columns=['标准问题id','标准问题','相似问题','答案','相似问题ID'])
df1 = pd.DataFrame([[1,2,3,4,6]], columns=['标准问题id','标准问题','相似问题','答案','相似问题ID'])
df.append(df1)
print(df.append(df1)) df.append之后,不会像list一样直接加进去,必须使用
df = df.append()
import numpy as np
vec = np.zeros(10) import random
random_list = np.random.randint(0,10,4)
print(random_list)
vec[random_list] = 1
print(vec) 生成一个随机位置为1,其他位置为0的矩阵
def contrast_enhance(vec1,vec2):

    vec1[1]= 1
vec2[1] = 3 arr1 = [1,2,3,4]
arr2 = [2,2,2]
contrast_enhance(arr1,arr2) print(arr1)
print(arr2) 如何得到np.array里非0元素个数?
使用
count1 = np.sum(vec1!=0)
count2 = np.sum(vec2!=0)
count = count1+count2
print(count)
dist = count**0.5
sim = 1.0 / (1.0 + dist)
return sim 如果要使用array.nonzero(),这个函数是返回下标的,不能用sum,应该用array.size
vec1_temp = np.array([1,2,3,4,5,6])
print(np.sum(vec1_temp!=0))
vec = vec1_temp.nonzero() #会返回一个tuple tuple[0]是array, tuple[1]是类型
print(vec)
print(vec[0].size) 如果用len(array),返回的是行数 交集
a = set(['我','爱','北','京'])
b = set(['爱','北','京'])
c = a&b
print(c) 判断集合为空
if {}:
print(1)
else:
print(0) select * from pospal_kf.similarquestion where questionid in(1820,1531)
time8 = time.time()
print('time8-time7')
print(time8-time7)
result = list(set(result))
simi_q_list = sorted(result, key=lambda tup: tup[3], reverse=True)
time9 = time.time()
print('time9-time8')
print(time9-time8) python 中,sorted函数的速度非常非常快,具体原因要问一下。
a = np.random.randint(1,100,10000000)
time1 = time.time()
count = np.sum(a!=0)
time2 = time.time()
print(time2-time1)
len(a.nonzero()[0])
time3 = time.time()
print(time3-time2)

0.014009952545166016
0.04614996910095215

事实证明,使用np.sum的方法比较快

pandas  去除空行

df = pd.read_excel('答案书写.xlsx', sheet_name = 'Sheet1')

print(df.dropna(subset=['答案']))

阈值thres =

维度 axis,

subset 是一个list,如果按行去除,这个list的元素就是非空的column

pycharm tips的更多相关文章

  1. PHPStorm/webstorm/PyCharm tips

    phpstorm对于使用PHP开发web的人员来说,是一个非常不错的编辑开发IDE,以前用过sublime,但是相比于storm,sublime在浏览legacy代码,类代码编辑方面明显要逊色不少.同 ...

  2. PyCharm Tips 常用操作帮助

    以下内容转自 http://www.2cto.com/os/201410/341542.html --------------------------------------------------- ...

  3. PHPStorm/webstorm tips

    phpstorm对于使用PHP开发web的人员来说,是一个非常不错的编辑开发IDE,以前用过sublime,但是相比于storm,sublime在浏览legacy代码,类代码编辑方面明显要逊色不少.同 ...

  4. pycharm快捷键、常用设置、配置管理

    http://blog.csdn.net/pipisorry/article/details/39909057 pycharm学习技巧 Learning tips /pythoncharm/help/ ...

  5. PyCharm 2017 官网 下载 安装 设置 配置 (主题 字体 字号) 使用 入门 教程

    一.安装 Python 3.6 首先,要安装好 Python 3.6.如果你还没有安装,可以参考咪博士之前的教程 Python 3.6.3 官网 下载 安装 测试 入门教程 (windows) 二.官 ...

  6. 在Pycharm中运行Scrapy爬虫项目的基本操作

    目标在Win7上建立一个Scrapy爬虫项目,以及对其进行基本操作.运行环境:电脑上已经安装了python(环境变量path已经设置好), 以及scrapy模块,IDE为Pycharm .操作如下: ...

  7. PyCharm 专题

    pycharm常用设置 pycharm中的设置是可以导入和导出的,file>export settings可以保存当前pycharm中的设置为jar文件,重装时可以直接import settin ...

  8. pycharm同步代码到coding

    代码同步coding三步曲: 1.pycharm的tips---vcs---checkout from version control---git 选择git后会弹出clone repository弹 ...

  9. (转)pycharm快捷键、常用设置、配置管理

    原文: http://blog.csdn.net/pipisorry/article/details/39909057 本博客一直在同步更新中! 内容包含:pycharm学习技巧 Learning t ...

随机推荐

  1. 正则表达式/(^\s*)|(\s*$)/g意思

    包含以空格.回车符等字符开头 或者 空格.回车符等字符结尾 的字符串,可过滤出所有空格.回车符的字符

  2. 7.5爬取猫眼Top100电影名单

    2018-7-5 20:22:57 还有有一丢丢成就感!以后可以爬取简单网站了!比如妹子图片,只是现在不知道咋下载! 正则还是刚看,要多去用正则!正则很强大的东西! #!/usr/bin/env py ...

  3. J - Intersection

    来源poj 1410 You are to write a program that has to decide whether a given line segment intersects a g ...

  4. A - ACM Rank Table

    ACM contests, like the one you are participating in, are hosted by the special software. That softwa ...

  5. .NET Core开发日志——依赖注入

    依赖注入(DI)不是一个新的话题,它的出现是伴随着系统解耦的需要而几乎必然产生的. 在SOLID设计原则中,DIP(Dependency inversion principle)--依赖倒置,规定了& ...

  6. Codeforces 1108D - Diverse Garland - [简单DP]

    题目链接:http://codeforces.com/problemset/problem/1108/D time limit per test 1 secondmemory limit per te ...

  7. [No000014F]计算机编程语言家族史

    https://www.levenez.com/lang/

  8. [No000010C]Git5/9-远程仓库

    到目前为止,我们已经掌握了如何在Git仓库里对一个文件进行时光穿梭,你再也不用担心文件备份或者丢失的问题了. 可是有用过集中式版本控制系统SVN的童鞋会站出来说,这些功能在SVN里早就有了,没看出Gi ...

  9. 1.7Oob 成员变量可以不初始化 但局部变量必须初始化

    成员变量有默认的初始值 像int a; a默认为0:而局部变量没有初始值

  10. SQL之层次查询

    层次查询是一种确定数据行间关系的一种操作手段.层次查询遍历的是一个树形结构.基本语法如下,以下语法嵌入到标准SQL中即可达到层次查询的目的: level,... ...[注释:伪列,用于select子 ...