Python抓取京东商城的所有笔记本电脑的参数
最近洪爷要写数据挖掘的论文需要些数据,于是俺又有机会做苦力了。昨天刚刚回到学校,晚上就帮洪爷写了个爬虫来爬数据京东商城的笔记本的参数。
为了快速完成,基本原理就是人工找到笔记本的页面。
然后他有22页(Page),编号规则如下:
http://www.360buy.com/products/670-671-672-0-0-0-0-0-0-0-1-1-1.html
http://www.360buy.com/products/670-671-672-0-0-0-0-0-0-0-1-1-%d.html
http://www.360buy.com/products/670-671-672-0-0-0-0-0-0-0-1-1-22.html
