python span爬虫中如何find到<\span>后面的内容?

windows 7 系统下爬虫抓取提示如下错误


  

在對unicode字符编码时添加ignore参数,忽略无法无法编码的字符这样就可以正常编码为GBK了。

或者将其转换为GBK编码的超集GB18030 (即,GBK是GB18030的子集):

 修改後正确代码如下;


  

对应的得到的字符是GB18030的编码

}

注意:如果直接使用uri的连接将图爿上传到fastdfs会导致图片上传不完整所以需要将图片先保存下来,上传完成后再删除

}

我要回帖

更多关于 python span 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信