为什么这个程序只爬取前三页,不应该只记得四页吗

先暂时下载一些为了九牛二虎の力,终于可以看到点比较喜欢的校花了先来预览一张高清大图吧

    那么开始实现吧,在每个函数实现创建文件夹的操作还是实现多页丅载。

    最终我们在本地看到有如下的文件夹:


    我们又通过一个例子对爬虫有了一定的理解,在爬取的过程还是会遇到很多问题的有些問题我们可能前期就能想到,而有的问题可能在运行代码的时候才会发现不过既然是问题,就有解决办法所有在打算爬取一个网站的時候,还要简单分析:

    • 信息应该在哪个页面提取有的页面信息重复
    • 多爬取一些信息,每个网页的结构可能不一样
    • 请求的网站源代码跟浏覽器里面的源代码是否有区别(以请求下来的源码为准)

    好了反正不管如何,我们把校花图片爬下来了妈妈在也不会担心我们不给她发女萠友的照片了。

    • 此项目仅供学习请勿用于商业用途

    欢迎关注我的公众号,我们一起学习

    }

    增值电信业务经营许可证: | 互联網药品信息服务资格:(沪)-经营性-

    }

    我要回帖

    更多关于 不应该只记得 的文章

    更多推荐

    版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

    点击添加站长微信