xiong1000

回答了问题2018-02-02
python 如何调用遨游浏览器并且selenium 打开网址
 xiong1000
现在必须用MAXTHON啊
提出了问题2018-02-01
python 如何调用遨游浏览器并且selenium 打开网址
提出了问题2017-06-04
centos python 安装lxml 报错阿里云ECS
回答了问题2017-05-06
Python爬虫如何爬取span和span中间的内容并分别存入字典里？
xiong1000
其实还是很有简单的，你看这个还是有规律的，规律在于有分隔符|，我写了个DEMO {代码...} 通过get_text()得到内在所有内容，然后去除空格。后面你就用split进行分割吧，后面的不写了。如果有问题再交流。
提出了问题2017-04-26
python re 找不到任何的内容非常奇怪
回答了问题2017-04-26
我写了个简单亚马逊爬虫，匹配字符串速度慢如何解决？
xiong1000
我看你里面已经使用了lxml你的选择器，应该采用css selector，css selector比bs 内置或者正则效率更高。
回答了问题2017-04-24
关于使用beatifulsoup4解析html卡死的问题
 xiong1000
我估摸着同JS加载有关系，不过这种类型一般你试验下selenium + PhantomJS()进行浏览器模拟,这组合的好处非常多，比如延迟加载的js,比如需要点击后产生的数据内容，总之模拟浏览器操作，坏处就是处理速度慢，哈哈。我是MAC 安装办法如下,windows 自己百度吧，先安装se...
回答了问题2017-04-05
Scrapy+phantonjs 爬去速度过慢？
xiong1000
@FreeLoop 写的极是！具体dcap的加法，请参看下面的链接设置PHANTOMJS的USER-AGENT
回答了问题2017-01-20
python3收到的数据是b'\x81\x84t\xdeL\x16\x00\xbb?b'如何转化啊
 xiong1000
其实你应该使用pycharm IDE，我之前用过sublime 同你一样崩溃的不行不行的，调试了一堆东西发现结果有限。所以建议你IDE使用pycharm
关注了问题2017-01-20
python3收到的数据是b'\x81\x84t\xdeL\x16\x00\xbb?b'如何转化啊
回答了问题2017-01-13
python爬虫获取页面，发现页面上的表格的数据获取不了？
xiong1000
建议采用 selenium + PhantomJS 进行
关注了问题2017-01-13
python爬虫获取页面，发现页面上的表格的数据获取不了？
回答了问题2016-03-21
用scrpay写爬虫，同样的代码-o保存成CSV时一切正常，但同时写入Mysql数据库时很多数据重复且不齐全
 xiong1000
请问下，我写入csv都是乱码，你这个中文怎么都是正确的？
赞了文章2016-03-18
PyTips 0x08 - Python 字节与字节数组
 Cyberdog
0x07 中介绍了 Python 中的字符串类型，字符串类型是对人类友好的符号，但计算机只认识一种符号，那就是二进制（binary）数，或者说是数字：
赞了回答2016-03-17
BeautifulSoup 采集后写入CSV 乱码
 SolomonXie
你导入的好几个模块我都没用过....不过能看出来是跳进了python2的encoding大坑了-_-总之,研究了近百篇文章后我才意识到,破解encoding问题不用那么复杂.不用''.encode().decode(),也不用sys.setdefaultencode之类只要你在全文里除了最后输出部分,保证其余每一个字符串...
赞了回答2016-03-17
BeautifulSoup 采集后写入CSV 乱码
 xu_zhoufeng
另外，urllib在Python 3.x 中已经全部改由Bytes 类型传输数据，所以在Python 3.x 中，如果doc已经解码，后面程序的encode是不需要的。
赞了回答2016-03-17
BeautifulSoup 采集后写入CSV 乱码
 Cyberdog
从你截图可以看出 csv 里面存储的是 b'\x00' 这样的是 Python 字节类型，应该进行 decode() 才会变成字符串类型。可以参考我昨天写的：Python 字节与字节数组
关注了问题2016-03-16
BeautifulSoup 采集后写入CSV 乱码
提出了问题2016-03-16
BeautifulSoup 采集后写入CSV 乱码
回答了问题2016-03-14
python3输出中文报错，代码应该没问题，感觉是cmd编码的问题，但是百度了好久还是无法解决
 xiong1000
print的问题直接给出方案不解释了 {代码...}

加载更多