我们来获取这里的title和url然后再获取这里面url的编辑作者

可以看到右边的几个就对应的左边不同的div

.m-p1-mb2-list.m-list-container ul li a
import requests
from bs4 import BeautifulSoup html = requests.get('https://finance.sina.com.cn/')
html.encoding='utf-8' soup = BeautifulSoup(html.text,'lxml')
zq = soup.select('.m-p1-mb2-list.m-list-container ul li a')
for z in zq:
print('title:',z.text)
print('url:',z['href'])
Innerhtml = requests.get(z['href'])
Innerhtml.encoding='utf-8'
soup2 = BeautifulSoup(Innerhtml.text,'lxml')
writers = soup2.select('.article-editor')
for w in writers:
print(w.text)
print('*'*50)

结果

G:\python3.8\python.exe "F:/python post/code/实战/新浪财经.py"
title: 创业板现场督导来了:有投行已接通知 监管带着问题来
url: https://finance.sina.com.cn/stock/zqgd/2020-09-14/doc-iivhuipp4150274.shtml
责任编辑:常福强
**************************************************
title: 2020金牌董秘评选开启 寻上市公司资本品牌最佳代言人
url: http://finance.sina.com.cn/zt_d/2020jinpaidongmi/
title: 直播|
url: http://finance.sina.com.cn/zt_d/jjzbj/
title: 陈果、华夏嘉实长盛长安富国大通等直播解盘
url: https://finance.sina.com.cn/money/fund/original/2020-09-12/doc-iivhvpwy6361399.shtml?cref=cj
责任编辑:常福强
**************************************************
title: 研报|
url: http://finance.sina.com.cn/stock/reportch/jinqilin.shtml
title: 内部经济复苏仍是主线 关注政府性投资需求带动
url: https://finance.sina.com.cn/stock/marketresearch/2020-09-13/doc-iivhvpwy6487946.shtml
责任编辑:陈志杰
**************************************************
title:
url: https://finance.sina.com.cn/stock/s/2019-07-09/doc-ihytcitm0843478.shtml
责任编辑:陈志杰
**************************************************
title: 公司
url: http://finance.sina.com.cn/roll/index.d.html?cid=56592&page=1
title: 业绩亏损套现不断 朗姿股份实控人的资产腾挪术
url: https://finance.sina.com.cn/roll/2020-09-14/doc-iivhuipp4201666.shtml
责任编辑:张熠
**************************************************
title: 老大哥燕京啤酒危险时刻:营收净利降 增长率十年新低
url: https://finance.sina.com.cn/stock/t/2020-09-14/doc-iivhuipp4175419.shtml
责任编辑:常福强
**************************************************
title:
url: https://finance.sina.com.cn/wm/2020-07-12/doc-iivhuipn2580833.shtml
责任编辑:逯文云
**************************************************
title: 违规代客炒股 万和、新时代、民生等多券商密集受罚
url: https://finance.sina.com.cn/stock/zqgd/2020-09-14/doc-iivhvpwy6527324.shtml
责任编辑:常福强
**************************************************
title: 超级打新周:19只新股 火箭、美妆、医美…全是热点
url: https://finance.sina.com.cn/stock/zqgd/2020-09-14/doc-iivhvpwy6557166.shtml Process finished with exit code -1

python爬取新浪财经的更多相关文章

  1. Python 爬取所有51VOA网站的Learn a words文本及mp3音频

    Python 爬取所有51VOA网站的Learn a words文本及mp3音频 #!/usr/bin/env python # -*- coding: utf-8 -*- #Python 爬取所有5 ...

  2. python爬取网站数据

    开学前接了一个任务,内容是从网上爬取特定属性的数据.正好之前学了python,练练手. 编码问题 因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了. 问题要从文字的编码讲 ...

  3. python爬取某个网页的图片-如百度贴吧

    python爬取某个网页的图片-如百度贴吧 作者:vpoet mail:vpoet_sir@163.com 注:随意copy,不用告诉我 #coding:utf-8 import urllib imp ...

  4. Python:爬取乌云厂商列表,使用BeautifulSoup解析

    在SSS论坛看到有人写的Python爬取乌云厂商,想练一下手,就照着重新写了一遍 原帖:http://bbs.sssie.com/thread-965-1-1.html #coding:utf- im ...

  5. 使用python爬取MedSci上的期刊信息

    使用python爬取medsci上的期刊信息,通过设定条件,然后获取相应的期刊的的影响因子排名,期刊名称,英文全称和影响因子.主要过程如下: 首先,通过分析网站http://www.medsci.cn ...

  6. python爬取免费优质IP归属地查询接口

    python爬取免费优质IP归属地查询接口 具体不表,我今天要做的工作就是: 需要将数据库中大量ip查询出起归属地 刚开始感觉好简单啊,毕竟只需要从百度找个免费接口然后来个python脚本跑一晚上就o ...

  7. Python爬取豆瓣指定书籍的短评

    Python爬取豆瓣指定书籍的短评 #!/usr/bin/python # coding=utf-8 import re import sys import time import random im ...

  8. python爬取网页的通用代码框架

    python爬取网页的通用代码框架: def getHTMLText(url):#参数code缺省值为‘utf-8’(编码方式) try: r=requests.get(url,timeout=30) ...

  9. 没有内涵段子可以刷了,利用Python爬取段友之家贴吧图片和小视频(含源码)

    由于最新的视频整顿风波,内涵段子APP被迫关闭,广大段友无家可归,但是最近发现了一个"段友"的app,版本更新也挺快,正在号召广大段友回家,如下图,有兴趣的可以下载看看(ps:我不 ...

随机推荐

  1. go module 获取码云私有仓库代码

    因为码云免费组织有5人限制,其他人想获得代码 只能通过别的方式 go mod 底层使用的git 获取代码, 所以首先解决如何通过git clone代码 思路为通过ssh密钥的方式获取 首先在码云仓库部 ...

  2. 直播报名 | 8.29 Kylin Meetup – 来聊聊云原生

    云原生的巨浪正在席卷全球的软件产业,包括开源和商业软件.Apache Kylin 正在为此而积极准备着:基于新的计算和存储引擎,即将发布的 Kylin 4.0 将实现真正的计算和存储分离,减小运维难度 ...

  3. Magento1.9 add attribute to catalog product & assign to all attribute set general group

    $installer = $this; $attributes = array( 'region' => array( 'type' => 'int', 'input' => 'se ...

  4. hdu.2042 超级楼梯

    这种递归来写,除了递归我也想不到怎么写了 AC代码: #include<iostream>using namespace std;int x[41];//打表,不打表我不用想就知道过不了, ...

  5. 第一篇Scrum冲刺博客

    目录 一.Alpha 阶段认领的任务 二.明日成员的任务安排 三.整个项目预期的任务量 四.敏捷开发前的感想 五.团队期望 一.Alpha 阶段认领的任务 陈起廷 任务 预计时间 日记天气.心情选择 ...

  6. vscode 安装go插件失败后,最简单的方法

    vscode 安装go插件 参考: https://github.com/goproxy/goproxy.cn/blob/master/README.zh-CN.md https://goproxy. ...

  7. C#.WinForm 拖动文件到PictrueBox(支持跨UAC拖动)

    如程序以普通方式打开,那么DragDrop DragEnter 事件是可以正常使用的.但以管理员身份运行时,这两个方法将失效. 原因是 Windows机制(用户界面特权隔离). UIPI:用户界面特权 ...

  8. 一次完整的JVM堆外内存泄漏故障排查记录

    前言 记录一次线上JVM堆外内存泄漏问题的排查过程与思路,其中夹带一些JVM内存分配机制以及常用的JVM问题排查指令和工具分享,希望对大家有所帮助. 在整个排查过程中,我也走了不少弯路,但是在文章中我 ...

  9. 数据处理 | pandas入门专题——离散化与one-hot

    今天是pandas数据处理专题第7篇文章,可以点击上方专辑查看往期文章. 在上一篇文章当中我们介绍了对dataframe进行排序以及计算排名的一些方法,在今天的文章当中我们来了解一下dataframe ...

  10. vue前端工程化

    今日目标 1.能够了解模块化的相关规范 2.了解webpack3.了解使用Vue单文件组件4.能够搭建Vue脚手架 5.掌握Element-UI的使用 1.模块化的分类 A.浏览器端的模块化   1) ...