数字、字符串、列表、字典,jieba库,wordcloud词云
一、基本数据类型
什么是数据类型
变量:描述世间万物的事物的属性状态
为了描述世间万物的状态,所以有了数据类型,对数据分类
为什么要对数据分类
针对不同的状态需要不同的数据类型标识
数据类型的分类
二、数字类型
整型(int)
作用
表示人的年龄 / 身份证号
定义
age = 21
pringt(age, type(age))
# 打印结果:21 <class 'int'>
# 或者:
age = int(21)
print(age, type(age))
# 打印结果:21 <class 'int'>
使用方法
x = 1
y = 2
print(x + y) # 加
print(x - y) # 减
print(x * y) # 乘
print(x / y) # 除
print(x % y) # 取余
print(x // y) # 取整
print(x ** y) # 幂
浮点型(float)
作用
用来描述(身高/体重/薪资)
定义
salary = 3.1
print(salary) # 3.1
salary1 = float(3) # 强制类型转换(动态语言),静态语言不能改变
print(salary1) # 3.0
height = int(180.5)
print(height) # 180
使用方法
与整形类似
+ - * / % // **
三、字符串类型
作用
字符串:字符用引号串起来
描述姓名/性别
定义方式
name = 'setcreed'
name2 = "setcreed"
gender = 'male'
height1 = 'setcreed"s height' # 读取第一个单引号的时候,字符串开始;第二引号结束
height2 = "setcreed's height" # 读取第一个双引号的时候,字符串开始;第二引号结束
用三单引号/三双引号
poem = '''孩儿立志出湘关,学不成名誓不还;
埋骨何须桑梓地,人生无处不青山。'''
使用方法
内置方法
- startswith() 以。。。开始
s = 'hello world'
print(s.startswith('hello')) # 打印True
- endswith() 以。。。结束
s = 'hello world'
print(s.startswith('d')) # 打印True
索引取值
poem1 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem1[0]) # 孩
print(poem1[-1]) # 。
索引切片
poem2 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem2[0:7]) # 取0-6个 孩儿立志出湘关
步长
poem3 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem3[0:7:3]) # 孩志关
四、列表
作用
列表可以存储多个值,如存放 爱好
定义方式
用[]存储,用逗号隔开多个元素(可以是任意数据类型)
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
使用方法
- 索引取值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[6][0])
# 打印结果:
666
- 切片
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[:5]) # 前面默认为0
print(my_list[:]) # 没写,默认全部
- 索引修改值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list[0] = 'hello'
print(my_list)
# 打印结果:
['hello', 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
- 内置方法
append方法: 追加
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list.append('999999999')
print(my_list)
# 打进结果:
[1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9, '999999999']
split 方法
s = 'a+b+c+d'
print(s.split('+')) # 按照+把字符串切开,然后把切开的元素放入列表内
# 打印结果:
['a', 'b', 'c', 'd']
join 方法
lis = ['a','b','c','d']
res = ' '.join(lis) # 按照字符串把列表里的每一个元素取出来拼接
print(res)
# 打印结果:
a b c d
五、字典
作用
用来存取多个值,按照key: value键值对的方式存值,取的时候可以通过key而非索引去取值,key对value具有描述性的作用。存放数据的种类各种各样并且数据较多的时候可以使用字典。
定义方式
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
使用方法
- 取值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
print(my_info_dict['name'])
# 打印结果:
setcreed
- del删除值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
del my_info_dict['height']
print(my_info_dict)
# 打印结果:
{'name': 'setcreed', 'age': 20, 'weight': 150}
六、jieba库
jieba库一般用于分词
import jieba
res = jieba.lcut('中华人民共和国是一个伟大的国家') # 精确模式,返回一个列表类型的分词结果
print(res)
# 打印结果:
['中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba
res = jieba.lcut_for_search('中华人民共和国是一个伟大的国家') # 搜索引擎模式,返回一个列表类型的分词结果,存在冗余
print(res)
# 打印结果:
['中华', '华人', '人民', '共和', '共和国', '中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba
res = jieba.lcut('中华人民共和国是一个伟大的国家',cut_all=True) # 把所有的可能全部切出来
print(res)
# 打印结果:
['中华', '中华人民', '中华人民共和国', '华人', '人民', '人民共和国', '共和', '共和国', '国是', '一个', '伟大', '的', '国家']
七、wordcloud词云
import wordcloud
import jieba
from imageio import imread
mk = imread('test.png') # 把图片读入内存
s = '''当其他人盲目的追寻真相和真实的时候,记住。万物皆虚。
当其他人受到法律和道德的束缚的时候,记住。万事皆允。
我们服侍光明却耕耘于黑暗。
真正睿智的人不会向你指明真相,而是教导你去发现真相。
世界上明明有一万种宗教,人们却用一种方式祈祷。这里没有上帝,只有属于我们自己的信条。
我们在黑暗中工作,为光明服务,我们,是刺客。'''
s_list = jieba.lcut(s) # 把字符串切成列表
s = ' '.join(s_list) # 把列表拼接成字符串
w = wordcloud.WordCloud(font_path='C:\Windows\Fonts\simkai.ttf', background_color='white', mask=mk)
w.generate(s)
w.to_file('set.png')

数字、字符串、列表、字典,jieba库,wordcloud词云的更多相关文章
- jieba分词wordcloud词云
1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...
- jieba库与词云的使用——以孙子兵法为例
1.打开cmd安装jieba库和 matplotlib. 2.打开python,输入代码.代码如下: from wordcloud import WordCloud import matplotlib ...
- 利用jieba库画词云
from wordcloud import WordCloud import matplotlib.pyplot as plt import jieba # 生成词云 def create_word_ ...
- python爬虫——京东评论、jieba分词、wordcloud词云统计
接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...
- python字符串/列表/字典互相转换
python字符串/列表/字典互相转换 目录 字符串与列表 字符串与字典 列表与字典 字符串与列表 字符串转列表 1.整体转换 str1 = 'hello world' print(str1.spli ...
- wordcloud词云模块
wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...
- python3 wordcloud词云
wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距 ...
- python 基于 wordcloud + jieba + matplotlib 生成词云
词云 词云是啥?词云突出一个数据可视化,酷炫.以前以为很复杂,不想python已经有成熟的工具来做词云.而我们要做的就是准备关键词数据,挑一款字体,挑一张模板图片,非常非常无脑.准备好了吗,快跟我一起 ...
- 初识python 字符串 列表 字典相关操作
python基础(一): 运算符: 算术运算: 除了基本的+ - * / 以外,还需要知道 : // 为取整除 返回的市商的整数部分 例如: 9 // 2 ---> 4 , 9.0 // ...
随机推荐
- ue4 FString 中文乱码问题
使用FString出现乱码,最简单的情况,FString Str = "你好"; 这时候就会出现乱码,解决方法是改成这样 FString Str = TEXT("你好&q ...
- c# 第20节 一维数据的冒泡排序
本节内容: 1:冒泡排序说明: 2:冒泡排序实现: 3:冒泡排序的时间复杂度 1:冒泡排序说明: 冒泡排序也是最简单最基本的排序方法之一.冒泡排序的思想很简单,就是以此比较相邻的元素大小,将小的前移, ...
- fiddler面试题
1.什么叫断点? Break Point:进行接口测试时,为了测试后端功能而设置的. 2.断点有哪些方式? Before Requests:在请求时,没有达到服务器之前设置断点. -- 全局断 ...
- 2019.6.11_MySQL进阶一:索引
所谓索引就是为特定的mysql字段进行一些特定的算法排序,比如二叉树的算法和哈希算法,哈希算法是通过建立特征值,然后根据特征值来快速查找.MySQL索引的建立对于MySQL的高效运行是很重要的,索引可 ...
- 【转】UML之类图和对象图
思路呈现 什么是类图? 描述类.接口.协作及他们之间的关系的图.显示系统中类的静态结构. 有什么作用? 描述软件系统的静态结构 ①对系统的词汇建模 ②对简单协作建模 ③对逻辑数据库模式建模 什么是对象 ...
- 基于web公交查询系统----管理员公交站点管理页面实现
主要用到内容:vue,coreui bootstrap框架,Ajax,springmvc搭建的接口,css之类的都是顺手拈来的简单的界面设计 网页代码: <!DOCTYPE html> & ...
- git 邮箱错误-git log 中发现 XXX@163.com邮箱不符合要求,请务必使用公司邮箱。
场景描述: 重新配置电脑之后,提交了git,邮箱发生错误. git log # 查看日志git reset 版本 # 回到之前的版本,版本回退git config --global user.name ...
- 大话设计模式Python实现-观察者模式
观察者模式(发布-订阅模式 Publish Subscribe Pattern):定义了一种一对多的关系,让多个观察对象同时监听一个主题对象,当主题对象状态发生变化时会通知所有观察者,是它们能够自动更 ...
- TP框架where条件和whereOr条件同时使用
前言:where里面的条件是 && 的关系,whereOr里面的条件是 | | 的关系, 想要得到的效果: 1.筛选出is_deleted字段为0(未删除)的公告 2.筛选出全部状态为 ...
- 第二十二节:Asp.Net Core中使用托管服务实现后台任务
1. 说明 BackgroundService 是用于实现长时间运行的 IHostedService 的基类,使用程序集:Microsoft.Extensions.Hosting. 2. 实现方式 继 ...