数字、字符串、列表、字典,jieba库,wordcloud词云
一、基本数据类型
什么是数据类型
变量:描述世间万物的事物的属性状态
为了描述世间万物的状态,所以有了数据类型,对数据分类
为什么要对数据分类
针对不同的状态需要不同的数据类型标识
数据类型的分类
二、数字类型
整型(int)
作用
表示人的年龄 / 身份证号
定义
age = 21
pringt(age, type(age))
# 打印结果:21 <class 'int'>
# 或者:
age = int(21)
print(age, type(age))
# 打印结果:21 <class 'int'>
使用方法
x = 1
y = 2
print(x + y) # 加
print(x - y) # 减
print(x * y) # 乘
print(x / y) # 除
print(x % y) # 取余
print(x // y) # 取整
print(x ** y) # 幂
浮点型(float)
作用
用来描述(身高/体重/薪资)
定义
salary = 3.1
print(salary) # 3.1
salary1 = float(3) # 强制类型转换(动态语言),静态语言不能改变
print(salary1) # 3.0
height = int(180.5)
print(height) # 180
使用方法
与整形类似
+ - * / % // **
三、字符串类型
作用
字符串:字符用引号串起来
描述姓名/性别
定义方式
name = 'setcreed'
name2 = "setcreed"
gender = 'male'
height1 = 'setcreed"s height' # 读取第一个单引号的时候,字符串开始;第二引号结束
height2 = "setcreed's height" # 读取第一个双引号的时候,字符串开始;第二引号结束
用三单引号/三双引号
poem = '''孩儿立志出湘关,学不成名誓不还;
埋骨何须桑梓地,人生无处不青山。'''
使用方法
内置方法
- startswith() 以。。。开始
s = 'hello world'
print(s.startswith('hello')) # 打印True
- endswith() 以。。。结束
s = 'hello world'
print(s.startswith('d')) # 打印True
索引取值
poem1 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem1[0]) # 孩
print(poem1[-1]) # 。
索引切片
poem2 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem2[0:7]) # 取0-6个 孩儿立志出湘关
步长
poem3 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem3[0:7:3]) # 孩志关
四、列表
作用
列表可以存储多个值,如存放 爱好
定义方式
用[]存储,用逗号隔开多个元素(可以是任意数据类型)
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
使用方法
- 索引取值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[6][0])
# 打印结果:
666
- 切片
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[:5]) # 前面默认为0
print(my_list[:]) # 没写,默认全部
- 索引修改值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list[0] = 'hello'
print(my_list)
# 打印结果:
['hello', 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
- 内置方法
append方法: 追加
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list.append('999999999')
print(my_list)
# 打进结果:
[1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9, '999999999']
split 方法
s = 'a+b+c+d'
print(s.split('+')) # 按照+把字符串切开,然后把切开的元素放入列表内
# 打印结果:
['a', 'b', 'c', 'd']
join 方法
lis = ['a','b','c','d']
res = ' '.join(lis) # 按照字符串把列表里的每一个元素取出来拼接
print(res)
# 打印结果:
a b c d
五、字典
作用
用来存取多个值,按照key: value键值对的方式存值,取的时候可以通过key而非索引去取值,key对value具有描述性的作用。存放数据的种类各种各样并且数据较多的时候可以使用字典。
定义方式
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
使用方法
- 取值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
print(my_info_dict['name'])
# 打印结果:
setcreed
- del删除值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
del my_info_dict['height']
print(my_info_dict)
# 打印结果:
{'name': 'setcreed', 'age': 20, 'weight': 150}
六、jieba库
jieba库一般用于分词
import jieba
res = jieba.lcut('中华人民共和国是一个伟大的国家') # 精确模式,返回一个列表类型的分词结果
print(res)
# 打印结果:
['中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba
res = jieba.lcut_for_search('中华人民共和国是一个伟大的国家') # 搜索引擎模式,返回一个列表类型的分词结果,存在冗余
print(res)
# 打印结果:
['中华', '华人', '人民', '共和', '共和国', '中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba
res = jieba.lcut('中华人民共和国是一个伟大的国家',cut_all=True) # 把所有的可能全部切出来
print(res)
# 打印结果:
['中华', '中华人民', '中华人民共和国', '华人', '人民', '人民共和国', '共和', '共和国', '国是', '一个', '伟大', '的', '国家']
七、wordcloud词云
import wordcloud
import jieba
from imageio import imread
mk = imread('test.png') # 把图片读入内存
s = '''当其他人盲目的追寻真相和真实的时候,记住。万物皆虚。
当其他人受到法律和道德的束缚的时候,记住。万事皆允。
我们服侍光明却耕耘于黑暗。
真正睿智的人不会向你指明真相,而是教导你去发现真相。
世界上明明有一万种宗教,人们却用一种方式祈祷。这里没有上帝,只有属于我们自己的信条。
我们在黑暗中工作,为光明服务,我们,是刺客。'''
s_list = jieba.lcut(s) # 把字符串切成列表
s = ' '.join(s_list) # 把列表拼接成字符串
w = wordcloud.WordCloud(font_path='C:\Windows\Fonts\simkai.ttf', background_color='white', mask=mk)
w.generate(s)
w.to_file('set.png')

数字、字符串、列表、字典,jieba库,wordcloud词云的更多相关文章
- jieba分词wordcloud词云
1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...
- jieba库与词云的使用——以孙子兵法为例
1.打开cmd安装jieba库和 matplotlib. 2.打开python,输入代码.代码如下: from wordcloud import WordCloud import matplotlib ...
- 利用jieba库画词云
from wordcloud import WordCloud import matplotlib.pyplot as plt import jieba # 生成词云 def create_word_ ...
- python爬虫——京东评论、jieba分词、wordcloud词云统计
接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...
- python字符串/列表/字典互相转换
python字符串/列表/字典互相转换 目录 字符串与列表 字符串与字典 列表与字典 字符串与列表 字符串转列表 1.整体转换 str1 = 'hello world' print(str1.spli ...
- wordcloud词云模块
wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...
- python3 wordcloud词云
wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距 ...
- python 基于 wordcloud + jieba + matplotlib 生成词云
词云 词云是啥?词云突出一个数据可视化,酷炫.以前以为很复杂,不想python已经有成熟的工具来做词云.而我们要做的就是准备关键词数据,挑一款字体,挑一张模板图片,非常非常无脑.准备好了吗,快跟我一起 ...
- 初识python 字符串 列表 字典相关操作
python基础(一): 运算符: 算术运算: 除了基本的+ - * / 以外,还需要知道 : // 为取整除 返回的市商的整数部分 例如: 9 // 2 ---> 4 , 9.0 // ...
随机推荐
- Python函数基础和函数参数
函数的定义和函数的调用 return的作用 三种参数的定义 常用的内置函数 len() 函数基础 函数的定义 def 函数名(参数): pass return 表达式 pass在这里表示什么都没有,不 ...
- [Linux] 纯净ubuntu快速搭建宝塔面板
宝塔官方建议是纯净的系统,我使用docker运行一个ubuntu容器,模拟一个纯净的系统,这样也不会影响到我的其他服务. docker run --name baota -id -p 8888:888 ...
- C学习笔记(3)---作用域,数组, (少量指针入门)
1. 作用域(scope):任何一种编程中,作用域是程序中定义的变量所存在的区域,超过该区域变量就不能被访问.C 语言中有三个地方可以声明变量. a. 在函数或块内部的局部变量 - 在某个函数或块的内 ...
- vlmcsd
scp ./vlmcsd-x64-musl-static xxx@host.ip:/opt/kms/ chmod u+x /opt/kms/vlmcsd-x64-musl-static ./vlmcs ...
- zz《百度地图商业选址》
作者 | 阚长城 编辑 | 张慧芳 题图 | 站酷海阔 人类几千年的文明催生了城市的发展,计算机与复杂科学带给我们新的资源——大数据.罗马非一日建成,人力和时间成本极大,但试想一下,如果有了大数据,罗 ...
- CentOS7 中创建 Django 项目
1. (新建文件夹用于存放项目)进入指定文件夹,创建Django项目 django-admin.py startproject mysite mysite 为项目名称 2. 进入项目文件夹,新建app ...
- Django views 中的装饰器
关于装饰器 示例: 有返回值的装饰器:判断用户是否登录,如果登录继续执行函数,否则跳回登录界面 def auth(func): def inner(request, *args, **kwargs): ...
- 自定义安装office
自定义安装office 1.下载office安装包:https://msdn.itellyou.cn 2.下载offiice部署工具:https://www.microsoft.com/en-us/d ...
- 手把手教你使用gogs搭建git私有仓库
本来想在 Github 上建一个私仓,但是发现只能设置 3 个贡献者. 国内的码云也只能设置 5 个. 无意间看到了使用 gogs 可以搭建私服,正好手头有空闲的服务器,于是开干! https://g ...
- HTML连载17-id选择器&类选择器
一.问题:我们前面讲了标签选择器有一个缺陷就是它不加选择的把所有相同的标签全都变成统一样式,这对于我们个性化定制产生了阻碍,因此我们便引出了id选择器,来进行特别指定进行配置样式 二.id选择器 1. ...