windows11中优酷为什么没有弹幕中的弹读什么了?

手机优酷弹幕字体颜色更改步骤:

1、打开优酷视频播放器,打开底部弹幕开关,点击底端左下角设置,进入下一步。

2、弹出菜单,在界面中有诸多颜色可供选择。

3、选中需要更改的颜色,在同一页面也可更改字体的大小。

4、在弹幕输入框中输入需要发送的信息,点击发送。

5、弹幕字体颜色修改完毕。

}

注:本人参考猪哥公众号“裸睡的猪”公众号爬虫文章。

想用我们现代的大案牍术来分析一下《长安十二时称》这部电视剧到底为什么会火,大家都对这部电视剧的评价是什么样的?(所有弹幕最高频的900个词)

1、分析优酷弹幕的加载方式然后使用requests库爬取

2、抓取整部剧所有集的所有弹幕

3、重点做数据清洗,比如:剧情、人名、高能君弹幕等等

1、分析并获取弹幕接口的url

①打开优酷网站,点击电视剧播放,在页面鼠标右键选择检查(或F12),调出浏览器的调试窗口。

②复制任意一条弹幕,然后点击调试窗口按Control+F进行搜索!

 通过上面的步骤,我们就可以轻松加愉快的获取到弹幕加载的url

URL找到之后我们便可以开始coding了,还是老规矩:先从一条数据的抓取、提取、保存,这些都没问题之后我们再研究批量抓取。

'''爬取优酷指定页的弹幕'''

我们比较同一集第一次请求与第二次请求的url发现mat参数不同,而且还是依次递增的趋势,这个参数便是我们寻找的分页参数(其实mat参数表示分钟数,表示获取第几分钟的弹幕),找到分页参数后我们就可以对原方法改造,改造思路:

将原url中分页参数变为可变参数,由方法传入。然后新建一个批量爬取的方法,循环调用单次爬取方法,每次调用传入页数即可

'''爬取优酷指定页的弹幕''' # 找到jsonp数据的左括号位置并加1 # 截取json数据字符串 # 字符串转换为json对象 # 如果请求总数count = 0 则说明弹幕爬取完成 # 爬取所有集数的vid

一共爬取了近30万条的数据,大概用了40分钟,中间当去斗地主赢了一万金币哈哈哈,然如果你觉得时间间隔太长也可缩短,但是建议不要太频繁,不然对人家服务器或者被监控到就不好。

6、数据清洗+生成词云

我们要清洗什么数据?其实这个事先很难猜到,所以我们不做数据清洗直接生成云词看看会是什么效果,然后再做调整。

# 设置词云的一些配置,如字体,背景色,词云形状,大小 # 在只设置mask情况下,会得到一个拥有图片形状的词云

 我们看到像:哈哈、不是、这个、什么,会员等这些词比较多,这种单词没有太大的分析价值,所以我们数据清洗便有了方向。(ps:某酷的弹幕没啥内涵。。。)

# 设置词云的一些配置,如字体,背景色,词云形状,大小 # 在只设置mask情况下,会得到一个拥有图片形状的词云

从上面的词云图中我们可以分析出:

  1. 此电视剧中的一些主角:张小敬、李必、崔器、龙波、徐斌、竟然还有人喜欢曹破延。

  2. 有人说好看,有人说看不懂,说明剧情可能有点深度

  3. 画风可能有点像刺客信条

  4. 四字弟弟、千玺,说明剧中有易烊千玺

  5. 大唐、长安说明了故事背景

  6. 弹幕、智商,可能大家在提醒你:关弹幕,保智商!

}

我要回帖

更多关于 怎样在课堂中使用弹幕 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信