批量更改变量名,就在该变量名上shift+f6

../data

两个点,就是上一级目录,一个点就是当前目录

unhashable type: 'list'

使用set进行去重

a = [1,2,2,3,4]

set(a)是可以的

可是如果a = [[1,2],2,2]就不行,set 进行哈希的时候,需要每个元素都是可哈希的,

可变类型的数据不可哈希,如list,字典:同值不同址,不同值同址

数值、字母、字符串、数字、元组不可变:同值同址,不同值不同址

类变量的值将在这个类的所有实例之间共享

类的方法与普通的函数只有一个特别的区别——它们必须有一个额外的第一个参数名称, 按照惯例它的名称是 self

q = [(1,2),(2,3)]
df = pd.DataFrame(q,columns=['id','question']) # data = DataFrame(np.arange(16).reshape(4,4), index=['Ohio', 'Colorado', 'Utah', 'New York'], columns=['one', 'two', 'three', 'four']) print(df.loc[:1])
df = pd.DataFrame([[1,2,3,4,5]], columns=['标准问题id','标准问题','相似问题','答案','相似问题ID'])
df1 = pd.DataFrame([[1,2,3,4,6]], columns=['标准问题id','标准问题','相似问题','答案','相似问题ID'])
df.append(df1)
print(df.append(df1)) df.append之后,不会像list一样直接加进去,必须使用
df = df.append()
import numpy as np
vec = np.zeros(10) import random
random_list = np.random.randint(0,10,4)
print(random_list)
vec[random_list] = 1
print(vec) 生成一个随机位置为1,其他位置为0的矩阵
def contrast_enhance(vec1,vec2):

    vec1[1]= 1
vec2[1] = 3 arr1 = [1,2,3,4]
arr2 = [2,2,2]
contrast_enhance(arr1,arr2) print(arr1)
print(arr2) 如何得到np.array里非0元素个数?
使用
count1 = np.sum(vec1!=0)
count2 = np.sum(vec2!=0)
count = count1+count2
print(count)
dist = count**0.5
sim = 1.0 / (1.0 + dist)
return sim 如果要使用array.nonzero(),这个函数是返回下标的,不能用sum,应该用array.size
vec1_temp = np.array([1,2,3,4,5,6])
print(np.sum(vec1_temp!=0))
vec = vec1_temp.nonzero() #会返回一个tuple tuple[0]是array, tuple[1]是类型
print(vec)
print(vec[0].size) 如果用len(array),返回的是行数 交集
a = set(['我','爱','北','京'])
b = set(['爱','北','京'])
c = a&b
print(c) 判断集合为空
if {}:
print(1)
else:
print(0) select * from pospal_kf.similarquestion where questionid in(1820,1531)
time8 = time.time()
print('time8-time7')
print(time8-time7)
result = list(set(result))
simi_q_list = sorted(result, key=lambda tup: tup[3], reverse=True)
time9 = time.time()
print('time9-time8')
print(time9-time8) python 中,sorted函数的速度非常非常快,具体原因要问一下。
a = np.random.randint(1,100,10000000)
time1 = time.time()
count = np.sum(a!=0)
time2 = time.time()
print(time2-time1)
len(a.nonzero()[0])
time3 = time.time()
print(time3-time2)

0.014009952545166016
0.04614996910095215

事实证明,使用np.sum的方法比较快

pandas  去除空行

df = pd.read_excel('答案书写.xlsx', sheet_name = 'Sheet1')

print(df.dropna(subset=['答案']))

阈值thres =

维度 axis,

subset 是一个list,如果按行去除,这个list的元素就是非空的column

pycharm tips的更多相关文章

  1. PHPStorm/webstorm/PyCharm tips

    phpstorm对于使用PHP开发web的人员来说,是一个非常不错的编辑开发IDE,以前用过sublime,但是相比于storm,sublime在浏览legacy代码,类代码编辑方面明显要逊色不少.同 ...

  2. PyCharm Tips 常用操作帮助

    以下内容转自 http://www.2cto.com/os/201410/341542.html --------------------------------------------------- ...

  3. PHPStorm/webstorm tips

    phpstorm对于使用PHP开发web的人员来说,是一个非常不错的编辑开发IDE,以前用过sublime,但是相比于storm,sublime在浏览legacy代码,类代码编辑方面明显要逊色不少.同 ...

  4. pycharm快捷键、常用设置、配置管理

    http://blog.csdn.net/pipisorry/article/details/39909057 pycharm学习技巧 Learning tips /pythoncharm/help/ ...

  5. PyCharm 2017 官网 下载 安装 设置 配置 (主题 字体 字号) 使用 入门 教程

    一.安装 Python 3.6 首先,要安装好 Python 3.6.如果你还没有安装,可以参考咪博士之前的教程 Python 3.6.3 官网 下载 安装 测试 入门教程 (windows) 二.官 ...

  6. 在Pycharm中运行Scrapy爬虫项目的基本操作

    目标在Win7上建立一个Scrapy爬虫项目,以及对其进行基本操作.运行环境:电脑上已经安装了python(环境变量path已经设置好), 以及scrapy模块,IDE为Pycharm .操作如下: ...

  7. PyCharm 专题

    pycharm常用设置 pycharm中的设置是可以导入和导出的,file>export settings可以保存当前pycharm中的设置为jar文件,重装时可以直接import settin ...

  8. pycharm同步代码到coding

    代码同步coding三步曲: 1.pycharm的tips---vcs---checkout from version control---git 选择git后会弹出clone repository弹 ...

  9. (转)pycharm快捷键、常用设置、配置管理

    原文: http://blog.csdn.net/pipisorry/article/details/39909057 本博客一直在同步更新中! 内容包含:pycharm学习技巧 Learning t ...

随机推荐

  1. J - Romantic

    The Sky is Sprite. The Birds is Fly in the Sky. The Wind is Wonderful. Blew Throw the Trees Trees ar ...

  2. c++中map按key和value排序

    ``` #include<iostream> #include<algorithm> #include<vector> #include<map> #i ...

  3. 微信小程序:bindtap等事件传参

    事件是视图层到逻辑层的通讯方式. 事件可以将用户的行为反馈到逻辑层进行处理. 事件可以绑定在组件上,当达到触发事件,就会执行逻辑层中对应的事件处理函数. 事件对象可以携带额外信息,如 id, data ...

  4. 洛谷P1219 八皇后【dfs】

    题目描述 检查一个如下的6 x 6的跳棋棋盘,有六个棋子被放置在棋盘上,使得每行.每列有且只有一个,每条对角线(包括两条主对角线的所有平行线)上至多有一个棋子. 上面的布局可以用序列2 4 6 1 3 ...

  5. 将 django部署到 heroku上

    为什么要这样做,因为我并没有弄懂,使用传统和推荐的方法来部署django.刚好我手里有这么一份教程我就按照这么做了. 1. 访问 http://heroku.com/ 完成一个注册,注册需要一个国外的 ...

  6. python-----多线程、线程池、进程池

    import threadingimport time ###############################多线程################################------ ...

  7. ionic中执行pop返回上一个页面,还需要执行操作

    <ion-navbar> </ion-navbar> 从A页面push到B页面拿到数据以后,从B页面pop到A页面,在A页面展示刚刚拿到的数据,用 ionViewDidEnte ...

  8. Window ferformance toolkit 学习

    1.环境配置 2.内存泄露 a. 编写自己的wprp文件: http://msdn.microsoft.com/en-us/library/hh448223.aspx b.启动 @echo off s ...

  9. visual stodio 编译前后动作定制总结

    copy "$(TargetDir)$(TargetName).lib" ..\lib\deploy\$(TargetName).lib 编译完成后将一个.lib 文件拷贝到指定目 ...

  10. python中dict的fromkeys用法

    fromkeys是创造一个新的字典.就是事先造好一个空字典和一个列表,fromkeys会接收两个参数,第一个参数为从外部传入的可迭代对象,会将循环取出元素作为字典的key值,另外一个参数是字典的val ...