提取网页的markdown表格利器
在线Markdown表格转换器
markdown表格转换器,蛮好用的。偶然发现的开源工具,推荐一波。
这是待提取table项
尝试1,直接通过html导入的功能
导入方法
import→URL→贴入复制的url→点击parse→往下拖动点击import data→把结果栏生成的结果copy到markdown
具体可见下面的GIF图嘞
得到结果如下
尝试2:通过源码导入
导入方法
首先点击目标网页,右键→检查→选择页面中的元素(选择到table对应的元素)→复制table对应的html内容
import→HTML→贴入上一步复制的→import data→把结果栏生成的结果copy到markdown
具体可见下面的GIF图嘞
、
得到结果如下
Command line | Environment | Config file | Description |
---|---|---|---|
-f, --locustfile | LOCUST_LOCUSTFILE | locustfile | Python module file to import, e.g. ‘../other.py’. Default: locustfile |
-H, --host | LOCUST_HOST | host | Host to load test in the following format: http://10.21.32.33 |
-u, --users | LOCUST_USERS | users | Number of concurrent Locust users. Primarily used together with –headless. Can be changed during a test by inputs w, W(spawn 1, 10 users) and s, S(stop 1, 10 users) |
-r, --spawn-rate | LOCUST_SPAWN_RATE | spawn-rate | The rate per second in which users are spawned. Primarily used together with –headless |
--hatch-rate | LOCUST_HATCH_RATE | hatch-rate | ==SUPPRESS== |
-t, --run-time | LOCUST_RUN_TIME | run-time | Stop after the specified amount of time, e.g. (300s, 20m, 3h, 1h30m, etc.). Only used together with –headless. Defaults to run forever. |
--web-host | LOCUST_WEB_HOST | web-host | Host to bind the web interface to. Defaults to ‘*’ (all interfaces) |
--web-port, -P | LOCUST_WEB_PORT | web-port | Port on which to run web host |
--headless | LOCUST_HEADLESS | headless | Disable the web interface, and instead start the load test immediately. Requires -u and -t to be specified. |
--headful | LOCUST_HEADFUL | headful | ==SUPPRESS== |
--web-auth | LOCUST_WEB_AUTH | web-auth | Turn on Basic Auth for the web interface. Should be supplied in the following format: username:password |
--tls-cert | LOCUST_TLS_CERT | tls-cert | Optional path to TLS certificate to use to serve over HTTPS |
--tls-key | LOCUST_TLS_KEY | tls-key | Optional path to TLS private key to use to serve over HTTPS |
--master | LOCUST_MODE_MASTER | master | Set locust to run in distributed mode with this process as master |
--master-bind-host | LOCUST_MASTER_BIND_HOST | master-bind-host | Interfaces (hostname, ip) that locust master should bind to. Only used when running with –master. Defaults to * (all available interfaces). |
--master-bind-port | LOCUST_MASTER_BIND_PORT | master-bind-port | Port that locust master should bind to. Only used when running with –master. Defaults to 5557. |
--expect-workers | LOCUST_EXPECT_WORKERS | expect-workers | How many workers master should expect to connect before starting the test (only when –headless used). |
--worker | LOCUST_MODE_WORKER | worker | Set locust to run in distributed mode with this process as worker |
--master-host | LOCUST_MASTER_NODE_HOST | master-host | Host or IP address of locust master for distributed load testing. Only used when running with –worker. Defaults to 127.0.0.1. |
--master-port | LOCUST_MASTER_NODE_PORT | master-port | The port to connect to that is used by the locust master for distributed load testing. Only used when running with –worker. Defaults to 5557. |
-T, --tags | LOCUST_TAGS | tags | List of tags to include in the test, so only tasks with any matching tags will be executed |
-E, --exclude-tags | LOCUST_EXCLUDE_TAGS | exclude-tags | List of tags to exclude from the test, so only tasks with no matching tags will be executed |
--csv | LOCUST_CSV | csv | Store current request stats to files in CSV format. Setting this option will generate three files: [CSV_PREFIX]stats.csv, [CSV_PREFIX]stats_history.csv and [CSV_PREFIX]_failures.csv |
--csv-full-history | LOCUST_CSV_FULL_HISTORY | csv-full-history | Store each stats entry in CSV format to _stats_history.csv file. You must also specify the ‘–csv’ argument to enable this. |
--print-stats | LOCUST_PRINT_STATS | print-stats | Print stats in the console |
--only-summary | LOCUST_ONLY_SUMMARY | only-summary | Only print the summary stats |
--reset-stats | LOCUST_RESET_STATS | reset-stats | Reset statistics once spawning has been completed. Should be set on both master and workers when running in distributed mode |
--html | LOCUST_HTML | html | Store HTML report file |
--skip-log-setup | LOCUST_SKIP_LOG_SETUP | skip-log-setup | Disable Locust’s logging setup. Instead, the configuration is provided by the Locust test or Python defaults. |
--loglevel, -L | LOCUST_LOGLEVEL | loglevel | Choose between DEBUG/INFO/WARNING/ERROR/CRITICAL. Default is INFO. |
--logfile | LOCUST_LOGFILE | logfile | Path to log file. If not set, log will go to stdout/stderr |
--exit-code-on-error | LOCUST_EXIT_CODE_ON_ERROR | exit-code-on-error | Sets the process exit code to use when a test result contain any failure or error |
-s, --stop-timeout | LOCUST_STOP_TIMEOUT | stop-timeout | Number of seconds to wait for a simulated user to complete any executing task before exiting. Default is to terminate immediately. This parameter only needs to be specified for the master process when running Locust distributed. |
提取网页的markdown表格利器的更多相关文章
- 如何将Excel转换成Markdown表格[转]
在这篇文章中,我将告诉你如何快速的将Excel转换为markdown表格,以及如何将Google Docs,Numbers,网页中的表格或其他类似Excel的程序数据转换为Markdown表格 你可能 ...
- python笔记之提取网页中的超链接
python笔记之提取网页中的超链接 对于提取网页中的超链接,先把网页内容读取出来,然后用beautifulsoup来解析是比较方便的.但是我发现一个问题,如果直接提取a标签的href,就会包含jav ...
- markdown表格
markdown制作表格 一. 使用原生html表格标签制作 <table> <tr> <td>表头</td> </tr> <tr&g ...
- vim格式化markdown表格
title: vim格式化markdown表格 date: 2017-11-23 15:23:25 tags: vim categories: 开发工具 安装插件 https://github.com ...
- python学习笔记——爬虫中提取网页中的信息
1 数据类型 网页中的数据类型可分为结构化数据.半结构化数据.非结构化数据三种 1.1 结构化数据 常见的是MySQL,表现为二维形式的数据 1.2 半结构化数据 是结构化数据的一种形式,并不符合关系 ...
- 用 Excel 生成和管理 Markdown 表格--转载
Markdown 作为一种轻量级的标记语言,用来进行简单的文本排版,确实方便快捷.但 Markdown 标记语言的属性,也使得其在表格处理上略显繁琐且不直观.而 Excel 几乎就是表格的代名词,借助 ...
- chrome浏览器提取网页视频
http://blog.csdn.net/pipisorry/article/details/37728839 在我们平时上网看视频听音乐时都会产生缓存,可是我们非常难通过一些软件把当中的视频和音乐文 ...
- excel批量提取网页标题
最近时间比较忙,有时候很多网页需要临时保存,以便空闲的时候查看.单纯的保存网页链接会让人很枯燥,所以需要自动批量提取标题. 为了这个小功能去写个小程序有点不划算,所以就利用excel实现了这个功能. ...
- Markdown表格宽度调整
Markdown 表格默认宽度是根据内容来的,如果某一列内容很长的话会将其他列的宽度占用导致显示样式很丑.我们可以在表格前增加 CSS 样式来限制列的宽度: <style> table t ...
随机推荐
- 在CentOS7上面部署项目,报出找不到表的错误
最近在linux服务器上面部署一个javaweb的项目,报出一些奇怪的错误,拉到报错信息的最下面显示mysql数据库的某个表找不到,可以在windows上面是能正常运行的. 最后发现原来是linux服 ...
- Archive for required library:’ WebRoot/WEB-INF/Mytag.tld’in project ‘TagTest’ cannot be read or is not a valid ZIP file
Description::部署tld文件时报错 我的解决方法: 右击(当前项目)->Build Path->Java Build Path ( Configure Build Path.. ...
- 循序渐进BootstrapVue,开发公司门户网站(6)--- 门户网站后端内容管理
我们在做门户网站的时候,如果网站的内容可以动态从后端进行管理,那么调整网站内容就非常方便,有时候如一些公司新闻.产品信息.轮播广告信息等都需要动态调整的,有一个方便的后端内容管理是非常方便的.本篇随笔 ...
- [转载]实现DDOS攻击自动封禁IP
1 #!/bin/bash 2 ############################################################# 3 # File Name: ddos_ch ...
- STP、生成树的算法
STP.生成树的算法 一.STP 1)STP概述 2)交换网络环路的产生 3)STP简介 4)STP的工作原理 5)S ...
- File类与常用IO流第三章IO流概述
一:以内存为基准,按照数据的流动方向,流向内存为输入(读取数据),流出内存为输出.IO流有四大顶级父类: IO流四大顶级父类 输入流 输出流 字节流 字节输入流 InputStream 字节输出流 ...
- mybatis-3-核心配置文件
全局配置文件:mybatis-config.xml 1.引入外部配置文件(properties) date.properties外部配置文件 driver = com.mysql.cj.jdbc.Dr ...
- 【贪心+排序】排队接水 luogu-1223
题目描述 有n个人在一个水龙头前排队接水,假如每个人接水的时间为Ti,请编程找出这n个人排队的一种顺序,使得n个人的平均等待时间最小. 分析 注意要开longlong AC代码 #include &l ...
- SAML 2.0简介(1)
1.什么是SAML: SAML是Web浏览器用来通过安全令牌启用单点登录(SSO)的标准协议 2.优点: 跨多个应用程序管理用户身份和授权. 3.单点登录(SSO)是什么: 它使用户仅使用一组凭据(用 ...
- 第十九篇 -- QTableWidget的使用
QTableWidget的一些常用方法 下面两个类可以根据自己的情况自定义. 单元格类型的类: class CellType(Enum): ctKey = 1000 ctPath = 1001 ctI ...