前端er 想爬数据 从什么入门好?

本人前端一枚

想做一个demo练手,需要得到爬取数据的本领,请问从哪里开始学习呢?

场景:爬取商品价格的数据,得到双十一前后的价格趋势变化,我可以如何入手呢?

我是JavaScript使用者,尽量使用node,如果Python学习成本比较高,求推荐教程和爬取数据的方法

阅读 5.8k
9 个回答

爬虫工具链:

使用superagent发起一个http请求,拿到response之后使用cheerio解析text文本,之后可以使用类似jQuery语法操作Dom。

数据存贮可以使用Mongodb,对应的orm工具可以使用mongoose。

代码示例
https://github.com/zhanyouwei...

Python的学习成本不是号称最低吗??Python爬虫入门的话也是很容易得,网上教程教程很多

scrapy 绝对排在第一名!!!

Python的学习成本不是很高,我说说我的经历吧
最开始我用urllib,或者urllib2,发现能够爬到数据很兴奋
接下来我见识到了Connection是Closed的网页,我知道了httplib2
然后又看到了requests
现在在看scrapy

爬虫是个玄学,我觉得题主的目标不错查询价格变化趋势,但是我觉得可以先定个小目标,爬百度百科~

node爬虫就20来行

nodejs superagent + cheerio

nodejs request + cheerio也不错的。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题