需要爬取一个网站内容,需登录和微信验证码登录,怎么破

从搜狗微信搜到需要抓取的公众號进入到详情页抓取最近发表的十次文章,进入详情页时经常需要输入微信验证码登录... 从搜狗微信搜到需要抓取的公众号进入到详情頁抓取最近发表的十次文章,进入详情页时经常需要输入微信验证码登录

    1、已设置独立密码:请您直接通过微信号+独立密码登录即可

    2、未设置独立密码:可通过以下两种方式设置独立密码后登录:

    1、请您可以在登录界面输入微信号,点击“忘记密码”=》通过手机号微信验證码登录或邮箱重设密码;2、通过电脑登录=》忘记了微信帐号或密码=》通过手机或邮箱修改注:找回后可以通过邮箱/微信号+独立密码登錄。望采纳

    看清楚问题 请勿答非所问谢谢

    你对这个回答的评价是

    这个好办,在阿里云或者其它接码平台都有微信验证码登录识别的api充錢进去,当碰到这个情况时把微信验证码登录发过去,收到后再把微信验证码登录提交微信验证即可

    你对这个回答的评价是?

    • 女生适匼做什么工作 北大青鸟中博-0基础教学,0元入学,名企定向培养,保障就业!女生适合做什么工作学IT好工作 就读北大青鸟!

    • 找什么工作好,上猎聘网,25万猎頭推荐好工作,助你轻松拿offer,海量高薪职位实时更新!找什么工作好尽在[猎聘网],轻松入职百强企业!

}

今天看到一位大佬的文章很感興趣,现照着葫芦画瓢开发具有自己特色的研究路线,原文在此大家可以参观一下~~

 # 导入itchat模块,操作微信个人号的接口 # 扫描二维码登陆微信实际上就是通过网页版微信登陆 

注释很清楚,主要就是使用itchat模块访问微信接口运行之后会显示二维码让你扫码登陆网页版微信:

登陆成功后便会在控制台打印好友详细信息,第一条是自己的。

属性有很多下一篇我们将进行数据的筛选,选取主要的属性这样便於后面进行一系列的统计~~

最后,不得不感叹在这个时代,隐私已成为奢侈品

}

通过 wkhtmltopdf 保存 pdf 的时候存在网络图片丟失的问题,也就是不显示图片那如何解决这个问题呢?通过替换 html 中img 标签的 data-src 和 src 的属性值,由 http 链接改为本地路径即可

思路:请求文章 url,获取 html 信息通过 jsoup 解析 html,然后通过选择器选择 img 标签接着获取 imgdata-src 的属性值(图片地址),然后遍历下载图片到本地下载图片成功之后,通过 jsoup 提供的方法修改该 imgdata-src 的属性值,替换原先的 html 信息核心代码如下:

 //重新赋值为本地路径 

wkhtmltopdf 的转换过程速度比较慢,建议开多个线程搞我是 5 个线程去转换,最后看一下成果图(python 党别喷代码量哈求放过~)

感谢您的阅读,如有不对的地方还请指出修正!文中不理解的地方,可加 qq 交流:

}

我要回帖

更多关于 验证码 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信