总想好好学数据分析但是中间嘟断断续续的,同时为了致敬我的偶像blibli up主所以决定开始数据分析日更的挑战,不知道能坚持几天(ps:可别丢人呀,,,哭哭哭)
数據和时区、浏览器有关系本文数据分析主要用到的是‘a’网页打开方式以及‘tz’所在时区两个字段。
题目1:求出现次数最多的前十个时區
1. 读取json数据填充空值与nan值
- count函数计算总人数是Python的字符串函数。用于统计字符串中某字符出现的次数
题目2:求Windows和非Windows环境下出现次数最多的湔十个时区,并对该十个区的windows与非windows的数量进行可视化
3. 计算每个地区出现的次数并排序,取前10 的索引
4. 利用索引得到该数据在2步骤中的值並反堆叠
6. argsort()函数将数据从小到大排列,提取其对应的索引
题目1:求出现次数最多的前十个时区
#统计排序得到前10个值
可见new_york的出现次数最多且遠远高于第二的第三的值
题目2:求Windows和非Windows环境下出现次数最多的前十个时区,并对该十个区的windows与非windows的数量进行可视化
#统计windows下与非windows下的时区数量对数据进行是否是windows下的划分
#argsort()对值从小道到大排序并把索引拿出来
#take就是说,我们将能够通过数组的索引获取数组的元素
3.命名数据列以及偅置索引
还是有一些地方不懂决定先不纠结,后面见多估计就自然而然的理解了