数字、字符串、列表、字典,jieba库,wordcloud词云
一、基本数据类型
什么是数据类型
变量:描述世间万物的事物的属性状态
为了描述世间万物的状态,所以有了数据类型,对数据分类
为什么要对数据分类
针对不同的状态需要不同的数据类型标识
数据类型的分类
二、数字类型
整型(int)
作用
表示人的年龄 / 身份证号
定义
age = 21
pringt(age, type(age))
# 打印结果:21 <class 'int'>
# 或者:
age = int(21)
print(age, type(age))
# 打印结果:21 <class 'int'>
使用方法
x = 1
y = 2
print(x + y) # 加
print(x - y) # 减
print(x * y) # 乘
print(x / y) # 除
print(x % y) # 取余
print(x // y) # 取整
print(x ** y) # 幂
浮点型(float)
作用
用来描述(身高/体重/薪资)
定义
salary = 3.1
print(salary) # 3.1
salary1 = float(3) # 强制类型转换(动态语言),静态语言不能改变
print(salary1) # 3.0
height = int(180.5)
print(height) # 180
使用方法
与整形类似
+ - * / % // **
三、字符串类型
作用
字符串:字符用引号串起来
描述姓名/性别
定义方式
name = 'setcreed'
name2 = "setcreed"
gender = 'male'
height1 = 'setcreed"s height' # 读取第一个单引号的时候,字符串开始;第二引号结束
height2 = "setcreed's height" # 读取第一个双引号的时候,字符串开始;第二引号结束
用三单引号/三双引号
poem = '''孩儿立志出湘关,学不成名誓不还;
埋骨何须桑梓地,人生无处不青山。'''
使用方法
内置方法
- startswith() 以。。。开始
s = 'hello world'
print(s.startswith('hello')) # 打印True
- endswith() 以。。。结束
s = 'hello world'
print(s.startswith('d')) # 打印True
索引取值
poem1 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem1[0]) # 孩
print(poem1[-1]) # 。
索引切片
poem2 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem2[0:7]) # 取0-6个 孩儿立志出湘关
步长
poem3 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem3[0:7:3]) # 孩志关
四、列表
作用
列表可以存储多个值,如存放 爱好
定义方式
用[]存储,用逗号隔开多个元素(可以是任意数据类型)
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
使用方法
- 索引取值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[6][0])
# 打印结果:
666
- 切片
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[:5]) # 前面默认为0
print(my_list[:]) # 没写,默认全部
- 索引修改值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list[0] = 'hello'
print(my_list)
# 打印结果:
['hello', 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
- 内置方法
append方法: 追加
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list.append('999999999')
print(my_list)
# 打进结果:
[1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9, '999999999']
split 方法
s = 'a+b+c+d'
print(s.split('+')) # 按照+把字符串切开,然后把切开的元素放入列表内
# 打印结果:
['a', 'b', 'c', 'd']
join 方法
lis = ['a','b','c','d']
res = ' '.join(lis) # 按照字符串把列表里的每一个元素取出来拼接
print(res)
# 打印结果:
a b c d
五、字典
作用
用来存取多个值,按照key: value键值对的方式存值,取的时候可以通过key而非索引去取值,key对value具有描述性的作用。存放数据的种类各种各样并且数据较多的时候可以使用字典。
定义方式
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
使用方法
- 取值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
print(my_info_dict['name'])
# 打印结果:
setcreed
- del删除值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
del my_info_dict['height']
print(my_info_dict)
# 打印结果:
{'name': 'setcreed', 'age': 20, 'weight': 150}
六、jieba库
jieba库一般用于分词
import jieba
res = jieba.lcut('中华人民共和国是一个伟大的国家') # 精确模式,返回一个列表类型的分词结果
print(res)
# 打印结果:
['中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba
res = jieba.lcut_for_search('中华人民共和国是一个伟大的国家') # 搜索引擎模式,返回一个列表类型的分词结果,存在冗余
print(res)
# 打印结果:
['中华', '华人', '人民', '共和', '共和国', '中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba
res = jieba.lcut('中华人民共和国是一个伟大的国家',cut_all=True) # 把所有的可能全部切出来
print(res)
# 打印结果:
['中华', '中华人民', '中华人民共和国', '华人', '人民', '人民共和国', '共和', '共和国', '国是', '一个', '伟大', '的', '国家']
七、wordcloud词云
import wordcloud
import jieba
from imageio import imread
mk = imread('test.png') # 把图片读入内存
s = '''当其他人盲目的追寻真相和真实的时候,记住。万物皆虚。
当其他人受到法律和道德的束缚的时候,记住。万事皆允。
我们服侍光明却耕耘于黑暗。
真正睿智的人不会向你指明真相,而是教导你去发现真相。
世界上明明有一万种宗教,人们却用一种方式祈祷。这里没有上帝,只有属于我们自己的信条。
我们在黑暗中工作,为光明服务,我们,是刺客。'''
s_list = jieba.lcut(s) # 把字符串切成列表
s = ' '.join(s_list) # 把列表拼接成字符串
w = wordcloud.WordCloud(font_path='C:\Windows\Fonts\simkai.ttf', background_color='white', mask=mk)
w.generate(s)
w.to_file('set.png')

数字、字符串、列表、字典,jieba库,wordcloud词云的更多相关文章
- jieba分词wordcloud词云
1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...
- jieba库与词云的使用——以孙子兵法为例
1.打开cmd安装jieba库和 matplotlib. 2.打开python,输入代码.代码如下: from wordcloud import WordCloud import matplotlib ...
- 利用jieba库画词云
from wordcloud import WordCloud import matplotlib.pyplot as plt import jieba # 生成词云 def create_word_ ...
- python爬虫——京东评论、jieba分词、wordcloud词云统计
接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...
- python字符串/列表/字典互相转换
python字符串/列表/字典互相转换 目录 字符串与列表 字符串与字典 列表与字典 字符串与列表 字符串转列表 1.整体转换 str1 = 'hello world' print(str1.spli ...
- wordcloud词云模块
wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...
- python3 wordcloud词云
wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距 ...
- python 基于 wordcloud + jieba + matplotlib 生成词云
词云 词云是啥?词云突出一个数据可视化,酷炫.以前以为很复杂,不想python已经有成熟的工具来做词云.而我们要做的就是准备关键词数据,挑一款字体,挑一张模板图片,非常非常无脑.准备好了吗,快跟我一起 ...
- 初识python 字符串 列表 字典相关操作
python基础(一): 运算符: 算术运算: 除了基本的+ - * / 以外,还需要知道 : // 为取整除 返回的市商的整数部分 例如: 9 // 2 ---> 4 , 9.0 // ...
随机推荐
- ssh-agent,ssh-add 命令
centos 6.9 下测试: ssh-agent是一个密钥管理器,运行ssh-agent以后,使用ssh-add将私钥交给ssh-agent保管. eval `ssh-agent -s` ssh-a ...
- 【PAT甲级】1008 Elevator (20分)
1008 Elevator 题目: The highest building in our city has only one elevator. A request list is made up ...
- 9.Java基础_for/while/do-while循环
/* for循环(同C++) 初始化变量的作用域为循环体 出了循环体,初始化的局部变量消失 for(初始化;条件判断;条件控制){ 循环体; } while循环 while(条件判断){ 循环体; } ...
- 4. Vue - 指令(Add)
一.指令系统 1. v-text v-text主要用来更新textContent,可以等同于JS的text属性. <span v-text="msg"></s ...
- 好用的代码统计小工具SourceCounter(下载)
SourceCounter下载链接 https://pan.baidu.com/s/12Cg51L0hRn5w-m1NQJ-Xlg 提取码:i1cd 很多时候我们需要统计自己所写的代码的数量.举个栗子 ...
- 剑指Offer-22.从上往下打印二叉树(C++/Java)
题目: 从上往下打印出二叉树的每个节点,同层节点从左至右打印. 分析: 按层次打印二叉树的节点,重点就是我们在打印一层节点的时候,同时按顺序保存好当前节点的下一层节点,也就是左节点和右节点,当此层节点 ...
- ini_set()
ini_set ( string $varname , string $newvalue ) : string 设置指定配置选项的值.这个选项会在脚本运行时保持新的值,并在脚本结束时恢复. 参数 va ...
- 【正则】day01
正则表达式一.概述 验证 网络爬虫. 概念: 具有语法格式的字符串. 函数 PCRE 1.perl语言正则语法兼容.(java c) 2.速度快,效率高. P ...
- CSP-S 2019 AFO记
DAY -1 上午并没有改出题,然而调出了动态$dp$,于是顺便$AC$了保卫王国,于是就很愉悦. 下午考前自闭赛,把会的题和原题写了出来,然后就$rank1$了,感觉自己$rp--$. 晚上发现$T ...
- JVM-基本操作
1.我们为什么要对jvm做优化?在本地开发环境中我们很少会遇到需要对jvm进行优化的需求,但是到了生产环境,我们可能将有下面的需求: 运行的应用“卡住了”,日志不输出,程序没有反应服务器的CPU负载突 ...