Skip to content

Latest commit

 

History

History
2 lines (2 loc) · 327 Bytes

README.md

File metadata and controls

2 lines (2 loc) · 327 Bytes

Mini_spider

在调研过程中,经常需要对一些网站进行定向抓取。由于python包含各种强大的库,使用python做定向抓取比较简单。所以使用python开发一个迷你定向抓取器mini_spider.py,实现对种子链接的抓取,并把URL长相符合特定pattern的网页保存到磁盘上