爬取腾讯课堂IT-互联网分类的的课程信息存入csv文件

标签（空格分隔）： python

from urllib.request import urlopen

from bs4 import BeautifulSoup

#获取IT-互联网分类每页的课程的链接

for i in range(1,35):

    url = 'https://ke.qq.com/course/list?mt=1001&page='+str(i)

    html = urlopen(url)

    bs_obj = BeautifulSoup(html,'html.parser')

    bs_obj = bs_obj.find('ul',{'class':'course-card-list'})

    links = bs_obj.find_all('a',{'class':'item-tt-link'})

    #准备一个文件，先将标题写入的文件中

    with open('./tengxu.csv','w',encoding='utf8') as f:

        f.write('课程名称,链接地址,购买人数,好评度,价格\n')

    #获取每个课程的名称、链接、报名人数、好评度、价格

    for link in links:

        course_name = link.get_text()

        course_link = 'https:' + link.attrs.get('href')

        course_html = urlopen(course_link)

        bs_objec = BeautifulSoup(course_html,'html.parser')

        number_buyer_bs = bs_objec.find('span',{'class':'apply-num js-apply-num'})

        number_buyer = number_buyer_bs.get_text()

        good_evaluate_bs = bs_objec.find('span',{'class','rate-num'})

        good_evaluate = good_evaluate_bs.get_text()

        price_bs = bs_objec.find('span',{'class':'price'})

        price = price_bs.get_text()

        #将信息写入到文件中

        with open('./tengxu.csv','a',encoding='utf8') as f:

            f.write(course_name)

            f.write(',')

            f.write(course_link)

            f.write(',')

            f.write(number_buyer)

            f.write(',')

            f.write(good_evaluate)

            f.write(',')

            f.write(price)

            f.write('\n')

爬取腾讯课堂IT-互联网分类的的课程信息存入csv文件的更多相关文章

教你爬取腾讯课堂、网易云课堂、mooc等所有课程信息
本文的所有代码都在GitHub上托管,想要代码的同学请点击这里
简单的scrapy实战:爬取腾讯招聘北京地区的相关招聘信息
简单的scrapy实战:爬取腾讯招聘北京地区的相关招聘信息简单的scrapy实战:爬取腾讯招聘北京地区的相关招聘信息系统环境:Fedora22(昨天已安装scrapy环境) 爬取的开始URL:ht ...
Python爬取腾讯新闻首页所有新闻及评论
前言这篇博客写的是实现的一个爬取腾讯新闻首页所有的新闻及其所有评论的爬虫.选用Python的Scrapy框架.这篇文章主要讨论使用Chrome浏览器的开发者工具获取新闻及评论的来源地址. Chrom ...
【转】爬取豆瓣电影top250提取电影分类进行数据分析
一.爬取网页,获取需要内容我们今天要爬取的是豆瓣电影top250页面如下所示: 我们需要的是里面的电影分类,通过查看源代码观察可以分析出我们需要的东西.直接进入主题吧! 知道我们需要的内容在哪里了, ...
Python爬虫实战：爬取腾讯视频的评论
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 易某某 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...
（java）selenium webdriver爬虫学习--爬取阿里指数网站的每个分类的top50 相关数据；
主题:java 爬虫--爬取'阿里指数'网站的每个分类的top50 相关数据: 网站网址为:http://index.1688.com/alizs/top.htm?curType=offer& ...
使用Scrapy框架爬取腾讯新闻
昨晚没事写的爬取腾讯新闻代码,在此贴出,可以参考完善. # -*- coding: utf-8 -*- import json from scrapy import Spider from scrap ...
python 爬取腾讯视频的全部评论
一.网址分析查阅了网上的大部分资料,大概都是通过抓包获取.但是抓包有点麻烦,尝试了F12,也可以获取到评论.以电视剧<在一起>为例子.评论最底端有个查看更多评论猜测过去应该是 Ajax ...
python 爬取腾讯微博并生成词云
本文以延参法师的腾讯微博为例进行爬取并分析 ,话不多说直接附上源代码.其中有比较详细的注释. 需要用到的包有 BeautifulSoup WordCloud jieba # coding:utf-8 ...

随机推荐

POJ1020(小正方形铺大正方形)
Anniversary Cake Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 16579 Accepted: 5403 ...
DotNetBar笔记
1.TextBoxDropDown 这是一个绝对TMD坑爹的狗屁玩意儿.键盘的四个事件全部不好使.但是这个玩意儿有个好处就是他的DropDownControl属性可以用来制作ComboGrid. 然 ...
Day1--Python基础1--下半部分
一..pyc是什么 1. Python是一门解释型语言? 我初学Python时,听到的关于Python的第一句话就是,Python是一门解释性语言,我就这样一直相信下去,直到发现了*.pyc文件的存在 ...
SQL 从身份证号得到出生日期、年龄、男女
), CONVERT(smalldatetime, SUBSTRING(b.IDCard, , )), ) AS BrithDate_Name, DATEDIFF(year, CONVERT(smal ...
vue-cli脚手架build目录中的webpack.dev.conf.js配置文件
此文章用来解释vue-cli脚手架build目录中的webpack.dev.conf.js配置文件此配置文件是vue开发环境的wepack相关配置文件关于注释当涉及到较复杂的解释我将通过标识的方 ...
oracle sql 函数
(7)查询日期之间的数据例如查询student表中出生日期(birthday)在’2016-01-01’ 和’2017-01-01’之间的数据: select * from student wher ...
C# 正规表达式
在C#中怎么用正则表达式限制文本框内不能输入数字?只能输入数字:"^[0-9]*$".只能输入n位的数字:"^\d{n}$".只能输入至少n位的数字:" ...
LAMP 2.4 Apache访问控制
通过查看日志发现有个IP 恶意攻击你的网址,可以控制这个IP的访问. 打开主配置文件复制模板. vim /usr/local/apache2/conf/httpd.conf 搜索 /Order 复制 ...
JS中，关于数组的练习题
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...
spring整合mybatis的事物管理配置
一.基本配置 <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http:/ ...

爬取腾讯课堂IT-互联网分类的的课程信息存入csv文件

爬取腾讯课堂IT-互联网分类的的课程信息存入csv文件的更多相关文章

随机推荐

热门专题