回答了问题2017-11-02
找到原因了。因为这段代码是在js脚本里面的,浏览器在加载的时候能编译成功。如果单独把这段代码发到Chrome的console中执行的话是会报错的。
提出了问题2017-11-01
提出了问题2017-05-29
回答了问题2016-12-18
其实可以直接去找出下一页请求的接口,然后模拟请求就可以,不需要用phantomjs,毕竟会有phantomjs假死的问题。
关注了问题2016-12-18
回答了问题2016-12-18
处理成了瓶颈可以在一台子或者多台机子上开启多个processor。 这是我在一台机子上开启的
关注了问题2016-12-18
回答了问题2016-12-18
一般来说,一个任务失败了三次,就会显示failed。这个时候在数据表里面的status是3。status这个字段具体含义如下:1: 任务失败,需要重新执行的2: 任务执行成功的3: 任务失败,并且已经达到最大重试次数的。所以,可以在爬虫脚本里面手动的从数据库里面把status=3...
关注了问题2016-12-18
回答了问题2016-11-19
爬虫脚本是默认存放在数据库的,也不支持直接脚本调用。另外,UnicodeError明显就是编码错误,可以把报错的具体信息贴上来
关注了问题2016-11-19
提出了问题2016-09-09
提出了问题2016-09-07
提出了问题2016-05-23
提出了问题2016-02-26
提出了问题2015-12-23
回答了问题2015-12-23
scheduler 组件没有成功启动。你是不是以 all 模式启动的pyspider?