提取网页的markdown表格利器
在线Markdown表格转换器
markdown表格转换器,蛮好用的。偶然发现的开源工具,推荐一波。
这是待提取table项

尝试1,直接通过html导入的功能
导入方法
import→URL→贴入复制的url→点击parse→往下拖动点击import data→把结果栏生成的结果copy到markdown
具体可见下面的GIF图嘞

得到结果如下

尝试2:通过源码导入
导入方法
首先点击目标网页,右键→检查→选择页面中的元素(选择到table对应的元素)→复制table对应的html内容
import→HTML→贴入上一步复制的→import data→把结果栏生成的结果copy到markdown
具体可见下面的GIF图嘞
、
得到结果如下
| Command line | Environment | Config file | Description |
|---|---|---|---|
| -f, --locustfile | LOCUST_LOCUSTFILE | locustfile | Python module file to import, e.g. ‘../other.py’. Default: locustfile |
| -H, --host | LOCUST_HOST | host | Host to load test in the following format: http://10.21.32.33 |
| -u, --users | LOCUST_USERS | users | Number of concurrent Locust users. Primarily used together with –headless. Can be changed during a test by inputs w, W(spawn 1, 10 users) and s, S(stop 1, 10 users) |
| -r, --spawn-rate | LOCUST_SPAWN_RATE | spawn-rate | The rate per second in which users are spawned. Primarily used together with –headless |
| --hatch-rate | LOCUST_HATCH_RATE | hatch-rate | ==SUPPRESS== |
| -t, --run-time | LOCUST_RUN_TIME | run-time | Stop after the specified amount of time, e.g. (300s, 20m, 3h, 1h30m, etc.). Only used together with –headless. Defaults to run forever. |
| --web-host | LOCUST_WEB_HOST | web-host | Host to bind the web interface to. Defaults to ‘*’ (all interfaces) |
| --web-port, -P | LOCUST_WEB_PORT | web-port | Port on which to run web host |
| --headless | LOCUST_HEADLESS | headless | Disable the web interface, and instead start the load test immediately. Requires -u and -t to be specified. |
| --headful | LOCUST_HEADFUL | headful | ==SUPPRESS== |
| --web-auth | LOCUST_WEB_AUTH | web-auth | Turn on Basic Auth for the web interface. Should be supplied in the following format: username:password |
| --tls-cert | LOCUST_TLS_CERT | tls-cert | Optional path to TLS certificate to use to serve over HTTPS |
| --tls-key | LOCUST_TLS_KEY | tls-key | Optional path to TLS private key to use to serve over HTTPS |
| --master | LOCUST_MODE_MASTER | master | Set locust to run in distributed mode with this process as master |
| --master-bind-host | LOCUST_MASTER_BIND_HOST | master-bind-host | Interfaces (hostname, ip) that locust master should bind to. Only used when running with –master. Defaults to * (all available interfaces). |
| --master-bind-port | LOCUST_MASTER_BIND_PORT | master-bind-port | Port that locust master should bind to. Only used when running with –master. Defaults to 5557. |
| --expect-workers | LOCUST_EXPECT_WORKERS | expect-workers | How many workers master should expect to connect before starting the test (only when –headless used). |
| --worker | LOCUST_MODE_WORKER | worker | Set locust to run in distributed mode with this process as worker |
| --master-host | LOCUST_MASTER_NODE_HOST | master-host | Host or IP address of locust master for distributed load testing. Only used when running with –worker. Defaults to 127.0.0.1. |
| --master-port | LOCUST_MASTER_NODE_PORT | master-port | The port to connect to that is used by the locust master for distributed load testing. Only used when running with –worker. Defaults to 5557. |
| -T, --tags | LOCUST_TAGS | tags | List of tags to include in the test, so only tasks with any matching tags will be executed |
| -E, --exclude-tags | LOCUST_EXCLUDE_TAGS | exclude-tags | List of tags to exclude from the test, so only tasks with no matching tags will be executed |
| --csv | LOCUST_CSV | csv | Store current request stats to files in CSV format. Setting this option will generate three files: [CSV_PREFIX]stats.csv, [CSV_PREFIX]stats_history.csv and [CSV_PREFIX]_failures.csv |
| --csv-full-history | LOCUST_CSV_FULL_HISTORY | csv-full-history | Store each stats entry in CSV format to _stats_history.csv file. You must also specify the ‘–csv’ argument to enable this. |
| --print-stats | LOCUST_PRINT_STATS | print-stats | Print stats in the console |
| --only-summary | LOCUST_ONLY_SUMMARY | only-summary | Only print the summary stats |
| --reset-stats | LOCUST_RESET_STATS | reset-stats | Reset statistics once spawning has been completed. Should be set on both master and workers when running in distributed mode |
| --html | LOCUST_HTML | html | Store HTML report file |
| --skip-log-setup | LOCUST_SKIP_LOG_SETUP | skip-log-setup | Disable Locust’s logging setup. Instead, the configuration is provided by the Locust test or Python defaults. |
| --loglevel, -L | LOCUST_LOGLEVEL | loglevel | Choose between DEBUG/INFO/WARNING/ERROR/CRITICAL. Default is INFO. |
| --logfile | LOCUST_LOGFILE | logfile | Path to log file. If not set, log will go to stdout/stderr |
| --exit-code-on-error | LOCUST_EXIT_CODE_ON_ERROR | exit-code-on-error | Sets the process exit code to use when a test result contain any failure or error |
| -s, --stop-timeout | LOCUST_STOP_TIMEOUT | stop-timeout | Number of seconds to wait for a simulated user to complete any executing task before exiting. Default is to terminate immediately. This parameter only needs to be specified for the master process when running Locust distributed. |
提取网页的markdown表格利器的更多相关文章
- 如何将Excel转换成Markdown表格[转]
在这篇文章中,我将告诉你如何快速的将Excel转换为markdown表格,以及如何将Google Docs,Numbers,网页中的表格或其他类似Excel的程序数据转换为Markdown表格 你可能 ...
- python笔记之提取网页中的超链接
python笔记之提取网页中的超链接 对于提取网页中的超链接,先把网页内容读取出来,然后用beautifulsoup来解析是比较方便的.但是我发现一个问题,如果直接提取a标签的href,就会包含jav ...
- markdown表格
markdown制作表格 一. 使用原生html表格标签制作 <table> <tr> <td>表头</td> </tr> <tr&g ...
- vim格式化markdown表格
title: vim格式化markdown表格 date: 2017-11-23 15:23:25 tags: vim categories: 开发工具 安装插件 https://github.com ...
- python学习笔记——爬虫中提取网页中的信息
1 数据类型 网页中的数据类型可分为结构化数据.半结构化数据.非结构化数据三种 1.1 结构化数据 常见的是MySQL,表现为二维形式的数据 1.2 半结构化数据 是结构化数据的一种形式,并不符合关系 ...
- 用 Excel 生成和管理 Markdown 表格--转载
Markdown 作为一种轻量级的标记语言,用来进行简单的文本排版,确实方便快捷.但 Markdown 标记语言的属性,也使得其在表格处理上略显繁琐且不直观.而 Excel 几乎就是表格的代名词,借助 ...
- chrome浏览器提取网页视频
http://blog.csdn.net/pipisorry/article/details/37728839 在我们平时上网看视频听音乐时都会产生缓存,可是我们非常难通过一些软件把当中的视频和音乐文 ...
- excel批量提取网页标题
最近时间比较忙,有时候很多网页需要临时保存,以便空闲的时候查看.单纯的保存网页链接会让人很枯燥,所以需要自动批量提取标题. 为了这个小功能去写个小程序有点不划算,所以就利用excel实现了这个功能. ...
- Markdown表格宽度调整
Markdown 表格默认宽度是根据内容来的,如果某一列内容很长的话会将其他列的宽度占用导致显示样式很丑.我们可以在表格前增加 CSS 样式来限制列的宽度: <style> table t ...
随机推荐
- ROS2学习之旅(15)——编写简单的服务和客户节点(C++)
当节点使用服务进行通信时,发送数据请求的节点称为客户节点,响应请求的节点称为服务节点.请求和响应的结构由.srv文件决定. 本文的例子是一个简单的整数加法系统:一个节点请求两个整数的和,另一个节点响应 ...
- ESXi 切换直通导致无法识别硬盘解决
在解决虚机挂载U盘的过程中(已经处理了:VMware中的虚机如何挂载U盘),怎么样都无法加载U盘,故进行了一次操作直通操作的过程中,不小心把所有的存储和控制器全部直通了,导致Esxi主机无法识别到自己 ...
- 分享一份550多个Linux命令的文档,按照命令首字母索引排序
输入一个命令,让我给你一个关于它的完美解释! 众所周知,Linux命令是IT人必须掌握的一个技能,有了它,我们可以部署和维护各种各样的服务和应用.但是,大部分的Linux命令我们不一定记得住,而别是各 ...
- Django基础06篇 分页
1.导入Django自带的分页类 from django.core.paginator import Paginator 2.分页类的使用 def index(request): # return H ...
- python 操作word
pip install python.docx from docx import DocumentDoc = Document() 解释:from 从 docx这个文件中,导入一个叫Document的 ...
- 得力e+考勤机更新网络连接
1.进入APP,"企业信息"最下面"设备" 2.显示对应的设备的在线或离线 3.点击 >>>,点击"离线",连接蓝牙(手机 ...
- Java基础之反射生成JDK动态代理
在Java的java.lang.reflect包下提供了一个Proxy类和一个InvocationHandler接口.通过这个类和接口可以生成JDK动态代理类或动态代理对象. JDK动态代理例子: / ...
- 【分布式锁】通过MySQL数据库的表来实现-V1
一.来源 之所以要写这篇文章是因为想对自己当前的分布式知识做一个归纳.今天就先推出一篇MySQL实现的分布式锁,后续会继续推出其他版本的分布式锁,比如通过Zookeeper.Redis实现等. 二.正 ...
- SQL慢查询排查思路
前言 平时在工作中每天都会做巡检,将前一天所有超过500ms的慢SQL排查出来 查找原因,是否能进行优化.慢慢中,在形成了一套思路方法论. 我个人认为对于排查慢SQL还是有一定的帮助 (一).是否是S ...
- NOI2021游记
NOI2021游记 前言 写于 2021.7.28,成绩榜刚出后几个小时.总分 345 拿到银牌 183 名. 我的高中 OI 生活在这里画上句号.结局对我而言虽然不够完美,但是无论怎样都是我人生道路 ...