Python爬取金山词霸每日一句，存储到MySQL中

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# @Time    : 2018/7/3 20:25

# @Author  : baoshan

# @Site    :

# @File    : iciba.py.py

# @Software: PyCharm Community Edition

# 爬取金山词霸每日一句放到数据库中存储

import json

import requests

import pymysql

host = '10.10.1.10'

port = 3306

user = 'root'

passwd = 'root'

dbme = 'information_storage'

table = 'iciba_daily_sentence'

conn = pymysql.connect(host=host, user=user, passwd=passwd, db=dbme, port=port, charset="utf8")

cur = conn.cursor()

data = requests.get("http://open.iciba.com/dsapi/").text

jdata = json.loads(data)

dateline = jdata.get("dateline")

caption = jdata.get("caption")

content = jdata.get("content")

fenxiang_img = jdata.get("fenxiang_img")

note = jdata.get("note")

picture = jdata.get("picture")

picture2 = jdata.get("picture2")

translation = jdata.get("translation")

tts = jdata.get("tts")

sql = 'insert into %s (dateline,caption,content,fenxiang_img,note,picture,picture2,translation,tts) ' \

      'values ("%s", "%s", "%s", "%s", "%s", "%s", "%s", "%s","%s")' \

      % (table, dateline,caption,content,fenxiang_img,note,picture,picture2,translation,tts)

print(sql)

try:

    cur.execute(sql)

except:

    print("error")

print(json.dumps(jdata, ensure_ascii=False))

conn.commit()

conn.close()

数据库表结构如下

CREATE TABLE `iciba_daily_sentence` (

  `id` int(11) unsigned NOT NULL AUTO_INCREMENT,

  `dateline` char(10) DEFAULT NULL,

  `caption` varchar(20) DEFAULT NULL,

  `content` varchar(255) DEFAULT NULL,

  `fenxiang_img` varchar(255) DEFAULT NULL,

  `note` varchar(255) DEFAULT NULL,

  `picture` varchar(255) DEFAULT NULL,

  `picture2` varchar(255) DEFAULT NULL,

  `translation` varchar(255) DEFAULT NULL,

  `tts` varchar(255) DEFAULT NULL,

  `gmt_create` timestamp NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,

  PRIMARY KEY (`id`),

  UNIQUE KEY `uniq_dateline` (`dateline`)

) ENGINE=InnoDB AUTO_INCREMENT=16 DEFAULT CHARSET=utf8mb4;

谢谢！

Python爬取金山词霸每日一句，存储到MySQL中的更多相关文章

Python爬取招聘信息，并且存储到MySQL数据库中
前面一篇文章主要讲述,如何通过Python爬取招聘信息,且爬取的日期为前一天的,同时将爬取的内容保存到数据库中:这篇文章主要讲述如何将python文件压缩成exe可执行文件,供后面的操作. 这系列文章 ...
Python爬取新浪微博评论数据，写入csv文件中
因为新浪微博网页版爬虫比较困难,故采取用手机网页端爬取的方式操作步骤如下: 1. 网页版登陆新浪微博 2.打开m.weibo.cn 3.查找自己感兴趣的话题,获取对应的数据接口链接 4.获取cook ...
爬取豆瓣电影top250并存储到mysql数据库
import requests from lxml import etree import re import pymysql import time conn= pymysql.connect(ho ...
Python3爬取前程无忧数据分析工作并存储到MySQL
1.导入包import requests #取数from lxml import etree #用xpath解析import pymysql #连接数据库import chardet #自动获取编码2 ...
Python3.5爬取豆瓣电视剧数据并且同步到mysql中
#!/usr/local/bin/python # -*- coding: utf-8 -*- # Python: 3.5 # Author: zhenghai.zhang@xxx.com # Pro ...
Python3.5爬取cbooo.cn数据并且同步到mysql中
#!/usr/local/bin/python # -*- coding: utf-8 -*- # Python: 3.5 # Author: wucl(),zhenghai.zhang # Prog ...
利用python爬取海量疾病名称百度搜索词条目数的爬虫实现
实验原因: 目前有一个医疗百科检索项目,该项目中对关键词进行检索后,返回的结果很多,可惜结果的排序很不好,影响用户体验.简单来说,搜索出来的所有符合疾病中,有可能是最不常见的疾病是排在第一个的,而最有 ...
python爬取网站数据
开学前接了一个任务,内容是从网上爬取特定属性的数据.正好之前学了python,练练手. 编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了. 问题要从文字的编码讲 ...
python爬取网站数据保存使用的方法
这篇文章主要介绍了使用Python从网上爬取特定属性数据保存的方法,其中解决了编码问题和如何使用正则匹配数据的方法,详情看下文编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这 ...

随机推荐

Python常用模块--base64
作用:对一些保密性不强的信息进行加密,变为人类不能直接理解的字符串,但是可以反向解密,是一种‘防君子,不防小人’的措施. 例如:在一些项目中,接口的报文是通过base64加密传输的,所以在进行接口自动 ...
CentOS 7.1系统自动重启的Bug定位过程
[问题] 有同事反应最近有多台MongoDB的服务器CentOS 7.1系统会自动重启,分析了下问题原因. [排查过程] 1. 检查系统日志/var/log/message,并没有记录异常信息,jou ...
C#多线程编程实战（二）：线程同步
2.1 简介竞争条件:多个线程同时使用共享对象.需要同步这些线程使得共享对象的操作能够以正确的顺序执行线程同步问题:多线程的执行并没有正确的同步,当一个线程执行递增和递减操作时,其他线程需要依次等 ...
vue+vue-cli+vuex+vrouter 开发学习和总结
1.项目目录结构 1.components------------------------->页面中所用的公共组件: 2.router index.js -------------------- ...
BZOJ2366 : 多重历史
建立AC自动机,因为不存在某个串是另一个串的后缀,因此匹配到任意位置都只可能匹配一个串. 预处理出每个串出现的所有位置,总的出现次数为$O(m)$. 设$f[i][j]$表示考虑了前$i$个串,最后一 ...
Assigning to 'id<UINavigationControllerDelegate,UIImagePickerControllerDelegate> _Nullable' from incompatible type 'InfchangeVC *const __strong'
出现 Assigning to 'id<UINavigationControllerDelegate,UIImagePickerControllerDelegate>' from inco ...
java内部类（三）
内部类之方法内部类方法内部类就是内部类定义在外部类方法中,方法内部类只在该方法内部可见,即只在该方法内部使用. 注意:由于方法内部类不能在外部类的方法以外的地方使用,因此方法内部类不能使用访问控制符 ...
Python 库/模块/工具收集
1 算法 1.1 字符串处理 re 正则表达式的标准库. StringIO / cStringIO 以读写文件的方式来操作字符串(有点类似于内存文件). cStringIO 是 C 语言实现的,提供高 ...
Java虚拟机的最大内存是多少
天分析了当前比较流行的几个不同公司不同版本JVM的最大内存,得出来的结果如下: 公司 JVM版本最大内存(兆)client 最大内存(兆)server SUN 1.5.x 1492 1520 SUN ...
（转）Java atomic原子类的使用方法和原理（一）
在讲atomic原子类之前先看一个小例子: public class UseAtomic { public static void main(String[] args) { AtomicIntege ...

Python爬取金山词霸每日一句，存储到MySQL中

Python爬取金山词霸每日一句，存储到MySQL中的更多相关文章

随机推荐

热门专题