【Python3爬虫】爬取糗事百科段子

2015年10月22日3,3039

教程:http://cuiqingcai.com/990.html

原帖 用python2写的

urllib2在python3中变成了urllib.request,一些函数也不太一样

大概意会一下写了个0.0

正则表达式是乱来的。。。

听从学长的建议用了format()来限制了字符串格式

 

  • sxb_2012015年10月24日 下午4:59 回复

    学长 写篇NOIp考前指导文吧
    快考试了 不知道干什么啊
    漫无目的刷题。。。

    #1  
    • hzwer2015年10月24日 下午7:55 回复

      准备省选 做cf,bzoj呗

      #11
  • Wycer_2015年10月25日 下午2:20 回复

    膜拜黄学长

    #2  
  • De℃,.: )2015年10月26日 下午11:26 回复

    抛弃了pep8的黄学长!

    #3  
    • hzwer2015年10月27日 上午12:41 回复

      我改了下。。。还有哪不符合pep8?

      #31
  • De℃,.: )2015年10月27日 下午9:53 回复

    其实也无伤大雅~平时用这个查代码。。。
    sudo apt-get install pep8

    #4  
  • iwtwiioi2015年11月22日 下午7:14 回复

    其实黄学长可以参考requests库,比urllib好用到不知道哪里去了。
    嗯~还有,网络应用的话用多线程有奇效~threading库

    #5  
  • wangm2016年5月13日 下午4:49 回复

    分享一个我实现的糗事百科的爬虫源码:https://github.com/ShenJianShou/crawler_samples,欢迎来拍砖

    #7