如何批量采集网页表格数据?

本文的视频讲解已经上传到千聊平台 凡购买199元系列课的童鞋可直接免费观看学习

Comming Soon! Python&Stata数据分析课寒假工作坊

我们最想要的数据格式就是表数据,但这表格并不是excel文件,而是存在于网页上的表数据。比如本教程实验网站

http://s.askci.com/stock/a

一般遇到这种数据,最简单的方法就是复制粘贴,但是当

  • 复制粘贴格式混乱

  • 粘贴工作量太多 就需要写爬虫帮我们处理这件事情。但是常见的爬虫教程没有详细教大家怎么处理这种网址,今天我就简单说下办法。

审查网页

我们可以发现