python爬取信息到数据库与mysql简单的表操作

python 爬取豆瓣top250并导入到mysql数据库中

import pymysql

import requests

import re

url='https://movie.douban.com/top250'

headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:94.0) Gecko/20100101 Firefox/94.0'}

proxies={

    'http':'http://232.139.33.51:80'

}

list=[]

for word in range(0,250,25):

    p={'start':word}

    req=requests.get(url,headers=headers,proxies=proxies,params=p)

    text=req.text

    pattern=re.compile('<em class="">(.*?)</em>.*?<span class="title">(.*?)</span>.*?<p class="">.*?'

                    '导演: (.*?) .*?<br>.*?/&nbsp;(.*?)&nbsp;/&nbsp;(.*?)\n  .*?<span class="inq">(.*?)</span>',re.S) #根据html页面写正则表达式来提取需要的信息

    te=pattern.findall(text)   

    for i in te:

        print(i)

        list.append(i)

#print(list)

db=pymysql.connect(host='localhost',user='root',password='1234',charset='utf8')          #passwd根据自己的数据库修改

cursor=db.cursor()          #创建游标

cursor.execute('create database movie_data')   #使用游标执行创建数据库

cursor.execute('use movie_data')        #使用数据库

sql = '''create table movie(

id char(10) primary key,

name char(255),

director char(255),

country  char(200),

type     varchar(255),

brief varchar(255)

)default charset=utf8;

'''                   #创建表语句

cursor.execute(sql)

for i in list:

    insert_sql = "insert into movie values('%s','%s','%s','%s','%s','%s');" % (i[0], i[1], i[2], i[3], i[4],i[5])  #将变量值转入到sql语句。

    cursor.execute(insert_sql)

    db.commit()         #提交insert的数据信息

# #cursor.execute('drop database movie_data')

简单的mysql表操作

连接本地数据库

mysql -h localhost -u root -p

库操作

show databases;

create database 数据库名

drop database 数据库名

show create database 数据库

查看单个数据库信息

表操作

创建表

create table t1（

id int(4) not null,

name varchar(14) default 'allen'

);

约束条件

用于保证数据的完整性和一致性

PRIMARY KEY (PK)    标识该字段为该表的主键，可以唯一的标识记录

FOREIGN KEY (FK)    标识该字段为该表的外键

NOT NULL    标识该字段不能为空

UNIQUE KEY (UK)    标识该字段的值是唯一的

AUTO_INCREMENT    标识该字段的值自动增长（整数类型，而且为主键）

DEFAULT    为该字段设置默认值

UNSIGNED 无符号

ZEROFILL 使用0填充

查看表结构

desc 表名;

修改表名

alter table sc rename score;

插入数据

insert into student values

(1,'egon','male',18),

(2,'alex','female',81);

更新数据

UPDATE student set ssex='女'

where sname='张丽';

删除数据

DELETE FROM student

WHERE sno='2005030301';

详情mysql操作参考

这是一条超链接点击链接到mysql数据库总结笔记

python爬取信息到数据库与mysql简单的表操作的更多相关文章

Python 爬取热词并进行分类数据分析-[简单准备] （2020年寒假小目标05）
日期:2020.01.27 博客期:135 星期一 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备](本期博客) b.[云图制作+数据导入] ...
Python爬取网站上面的数据很简单，但是如何爬取APP上面的数据呢
数据库之 MySQL --- 数据处理之表操作、CRUD（六）
个人博客网:https://wushaopei.github.io/ (你想要这里多有) 一. 表操作创建数据库CREATE DATABASE demo-- 删除数据库DROP DATABAS ...
python爬取信息并保存至csv
import csv import requests from bs4 import BeautifulSoup res=requests.get('http://books.toscrape.com ...
Python爬取招聘信息，并且存储到MySQL数据库中
前面一篇文章主要讲述,如何通过Python爬取招聘信息,且爬取的日期为前一天的,同时将爬取的内容保存到数据库中:这篇文章主要讲述如何将python文件压缩成exe可执行文件,供后面的操作. 这系列文章 ...
pymysql 使用twisted异步插入数据库：基于crawlspider爬取内容保存到本地mysql数据库
本文的前提是实现了整站内容的抓取,然后把抓取的内容保存到数据库. 可以参考另一篇已经实现整站抓取的文章:Scrapy 使用CrawlSpider整站抓取文章内容实现本文也是基于这篇文章代码基础上实现 ...
steam夏日促销悄然开始，用Python爬取排行榜上的游戏打折信息
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 不知不觉,一年一度如火如荼的steam夏日促销悄然开始了.每年通过大大小小 ...
使用python爬取MedSci上的期刊信息
使用python爬取medsci上的期刊信息,通过设定条件,然后获取相应的期刊的的影响因子排名,期刊名称,英文全称和影响因子.主要过程如下: 首先,通过分析网站http://www.medsci.cn ...
写一个python 爬虫爬取百度电影并存入mysql中
目标是利用python爬取百度搜索的电影在类型地区年代各个标签下电影的名字评分和图片连接以及电影连接首先我们先在mysql中建表 create table liubo4( id in ...

随机推荐

Date相关类
Date相关类 SimpleDateFormat类中format()和parse()方法 parse 字符串 --> 日期 format 日期 --> 字符串 Date类中getTime( ...
PHP 日期详细介绍
简介你可以使用这些函数获取运行 PHP 的服务器的日期和时间, 也可以使用这些函数把日期和时间格式化成不同格式的字符串. 日期和时间信息在 PHP 内部是以 64 位数字存储的, 它可以覆盖当前时 ...
[ARC098B] Xor Sum 2
关于异或运算和代数和运算有很不错的性质: $xor_{i = 1} ^ {n}a_i \leq \sum_{i = 1} ^ n a_i$ 所以我们考虑一段区间按题目来说是合法的,即 \(xor_ ...
调用clapack库注意事项
寒假期间在自己开发的模型DGOM里成功的用clapack替换了MKL,这里就介绍下遇到的几个坑,希望能够帮助别人少走弯路. 1. 调用clapack函数时注意整数类型为integer. 虽然clapa ...
Nginx nginx: [emerg] using regex "\.php$" requires PCRE library 或编译nginx错误：make[1]: *** [/pcre//Makefile] Error 127
nginx: [emerg] using regex "\.php$" requires PCRE library 或编译nginx错误:make[1]: *** [/pcre ...
getdelim函数
利用getdelim函数分割读取字段,将文件制表符替换为空格符 1 #include <stdio.h> 2 #include <stdlib.h> 3 4 int main( ...
idea中如何找到重写
Ctrl+O 为了避免写错重写类和快速重写.
shell 除法和格式化输出printf
相关知识的补充: printf命令模仿C程序库里的printf()程序.printf由POSIX标准所定义,因此使用printf的脚本比使用echo有着更好的移植性. printf使用引用文本或者空格 ...
简单mvc框架核心笔记
简单mvc框架核心笔记看了thinkphp5的源码,模仿写了一个简单的框架,有一些心得笔记,记录一下 1.目录结构比较简单,没有tp那么复杂,只是把需要的核心类写了一些. 核心类库放在mykj里, ...
cvc-complex-type.2.3: Element 'servlet' cannot have character [children], because the type's content
错误原因:粘贴代码 <servlet> <servlet-name>barServlet</servlet-name> <servlet-class>S ...