如何把统计原始数据据分成维度统计

查看: 3233|回复: 8
如何在同一个透视表里面统计根据不同的维度分别统计
阅读权限10
在线时间 小时
一个学生表 , 比如有三个维度, 为班级,地区,出生日期,&&grade表示年纪
grade& && &&&name& && &&&area& && &&&class& && &&&birth
1001& && && &&&aa& && && && &&&sh& && && && &1& && && & 2001
1002& && && &&&bb& && && && &&&sh& && && && &2& && && &2002
1001& && && &&&cc& && && && &&&gz& && && && &1& && && & 2003
1002& && && &&&dd& && && && &&&sh& && && &&&1& && && & 2001
现在我想分别用这三个维度格统计一次,如下,但是不能用两个透视表,因为需要通过选择grade来查看相关结果
grade& && &&&all& && &&&
& && && && && && &&&total
area& && && && && &
& && &&&sh& && &&&3
& && &&&gz& && &&&1
class& && &&&
& && && &1& && &&&3
& && && &2& && &&&1
阅读权限70
在线时间 小时
帮忙把附件龙上来
阅读权限10
在线时间 小时
希望 sheet2中有3个透视表, 都是以 grade为条件选择的, 但是不能联动, 及其中任意选择一个透视表 grade, 其他两个
透视表的 grade都会跟着变,
具体见我的附件
18:55 上传
点击文件名下载附件
2.96 KB, 下载次数: 27
阅读权限20
在线时间 小时
回复 1楼 lottery009 的帖子
在行总计和列总计里显示数据可以不?
阅读权限10
在线时间 小时
不行, 这是客户的要求, 我只是简单的举个例子, 其实真实的报表比这个复杂很多, 有很多根据不同维度的统计项,
阅读权限20
在线时间 小时
回复 5楼 lottery009 的帖子
那把class也拖到“页字段”。维度再多,把大的拖到页,行和列各留一个字段,我都这么做的~~[em07]
123.jpg (22.3 KB, 下载次数: 8)
19:10 上传
[ 本帖最后由 zealotzcd 于
19:10 编辑 ]
阅读权限10
在线时间 小时
问题是这样的话 显示的格式就会有很大的区别, 我的客户就是要求&&每一项的维度都的统计数据都显示的清清楚楚,
阅读权限20
在线时间 小时
回复 7楼 lottery009 的帖子
excel本来就是二维表,只想到这种.........关注中..........
阅读权限20
在线时间 小时
& & & & & & & &
认真学习,不是太懂,看来任重道远。
玩命加载中,请稍候
玩命加载中,请稍候
Powered by
本论坛言论纯属发表者个人意见,任何违反国家相关法律的言论,本站将协助国家相关部门追究发言者责任! & & 本站特聘法律顾问:徐怀玉律师 李志群律师查看: 9133|回复: 5
数据分析的维度、方法
主题帖子积分
初来乍到, 积分 20, 距离下一级还需 30 积分
初来乍到, 积分 20, 距离下一级还需 30 积分
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
才可以下载或查看,没有帐号?
1.1常规数据分析(设定指标,定期监测)1.1.1常规数据分析维度1.1.1.1宏观方面
& & 对宏观指标进行监控(小时、天、周、月、季度、年等),发现异常(人数掉线、新增用户增长异常、ARPU升高等),给公司提供客观的数据来衡量和判断游戏的运营情况1.1.1.1.1用户数量
18:17 上传
注册用户在线人数(最高在线人数;日、周、月活跃人数;活跃用户平均在线时间、平均在线人数)1.1.1.1.2 ARPU& & 每个(平均在线人数、付费用户、活跃用户)每月贡献人民币& & 运营成本(服务器、带宽、客户服务、推广成本)& & 产品毛收益& & 时间卡模式的固定ARPU& & 增值模式的动态ARPU& & 时间卡+增值模式的动态ARPU& & 付费率1.1.1.1.3 推广力度& & 推广成本(宣传成本、人力成本、时间成本)& & 推广效果(各个路径的转化率:看广告人数—目标用户看广告人数—目标用户记住人数—目标用户感兴趣人数—目标用户尝试人数)1.1.1.1.4 流失率& & 前期流失率& & 自然流失率& & 游戏流失率重要节点分布(初始化页、选线+创建角色、1级、5级、6级、7级、累计)& & 一般流失率(日、周、月)1.1.1.1.5 用户自然增长率1.1.1.1.6病毒性& & 发送邀请人数、发送率& & 接受邀请人数、比例&&接受率& & K-Factor=感染率*转化率1.1.1.2微观方面& & 对微观指标进行监控(小时、天、周、月、季度、年等),发现异常(道具销量异常等),并指导开发团队修正游戏版本,为新版本和新功能提供决策依据。 1.1.1.2.1 MMORPG游戏:& & 职业等级分布& & 任务统计(每个任务参加、完成和取消次数或人数)& & 经济系统统计{ 总剩余金钱、背包存放金钱总量、仓库存放金钱总量、邮件存放金钱总量经济产出:任务产出金钱、玩家卖给NPC物品获得金钱、打工获得金钱经济消耗:(任务消耗、NPC购买消耗、道具合成消耗、道具加工消耗、道具打孔消耗、道具镶嵌消耗、装备升级消耗、装备炼化消耗、兑换家族声望消耗、家族升级消耗、修理装备消耗)}& & 活动统计(活动参与人数、活动完成人数、奖励产量、意外预警)商城统计(销售统计工具,销量排行) 1.1.1.2.2ACG游戏职业等级分布& & 资源使用统计& & 排名统计(增加荣誉感)1.1.2常规数据分析方法1.1.2.1对比分析法各运营核心指标,例如:人气(平均在线人数、高峰在线人数)、收益(每个在线人数的ARPU)1、与目标对比(例如:在11月30号前,某游戏日活跃用户数运营目标为5万户。目前运营结果,日活跃用户为4万户,完成率为80%)2、不同时期对比:同比、环比(例如:周末日活跃用户数比工作日日活跃用户数多)3、行业内对比(QQ平台、当乐网等)4、活动效果对比(实验组和控制组)1.1.2.2结构分析法例如:某道具销售额占所有道具销售额1.1.2.3平均分析法例如:每个地区付费用户的ARPU1.1.2.4交叉分析法& &例如:游戏等级和流失率之间的关系1.1.2.5综合评价分析法例如:构建综合指标客画用户的忠诚度(月登陆次数、在线时长、付费金额等)1.1.2.6漏斗图分析法例如:初始化页,选线+创建角色、1级、5级、6级等关键路径的转化率1.1.2.7 PEST分析法P:国家出台那些相关政策?有何影响?相关法律有哪些?有何影响?E:GDP及增长率、进出口总额及增长率、消费价值指数、失业率、居民可支配收入S:中国手机游戏用户与中国公民在人口规模、性别比例、年龄结构、人口分布等方面,手机游戏网民与全国是否有区别?T:技术(手机终端和游戏开发创新)的发明、传播、更新速度如何?国家重点支持项目、投入研发费用、专利个数如何?1.1.2.8 5W2H分析法& & 用户购买行为分析& & Why:用户购买的目的是什么?产品在哪方面吸引用户?[产品的画面、操作,各方面细节,游戏是否有内涵,客户服务质量,线上活动(开发新任务、策划活动、客服执行活动)]& & What:公司提供什么产品或服务?产品与用户需求是否一致?[例如产品:《新三国争霸》是一款三国题材的策略战争网游。独一无二的战斗模式,热血沸腾的万人国战,让人欲罢不能。 服务:VIP用户系统、爱问系统、电话、邮件、论坛、传真、即时通讯软件、当面客服等。与用户需求是否一致:对游戏玩家调研、进行试玩,对产品进行反馈,也可以通过网页上对游戏的评分、评价、下载量、用户量进行评估 ]& & Who:谁是我们的用户?用户有何特点?[配有手机且手机功能支持游戏运行,用户年龄结构、男女比例、职业类型等]& & When:何时购买?多久再次购买?[分时间点卡和增值道具购买]& & Where:用户在哪购买?用户在各个地区的构成怎么样?[各大游戏网站(当乐网、九游游戏)、游戏运营平台(QQ平台、UC平台) 每个省份地市用户分布情况]& & How:用户购买支付方式是怎样的?[网上银行卡(易宝网银、快钱)、实物卡(盛大卡、征途卡、QQ卡、完美卡)、声讯(固定电话、手机充值)、支付宝(支付宝、财付通)、短信(手机短信)、卡密(神州行)、网吧直充]& & How much:用户购买花费时间、交通等成本各是多少?[每个活跃用户每天在线时长、每个活跃用户ARPU]
主题帖子积分
初来乍到, 积分 20, 距离下一级还需 30 积分
初来乍到, 积分 20, 距离下一级还需 30 积分
1.2专题数据挖掘(更深入了解游戏用户的行为)
基于目前游戏行业快速增长的行业背景,游戏市场远远没有达到饱和状态。而传统电信行业逐步达到饱和状态,而且行业又不相同,所以不能够生搬硬套电信行业的一些成功专题分析经验。但我们可以根据游戏行业目前的业务现状,同时借鉴电信行业的专题分析经验,从而解决目前游戏业务问题。
1.2.1流失预警
基于某款游戏,如果用户量逐步达到饱和状态,且用户流失率居高不下,严重影响到游戏的利润。并且获取一个新客户的成本远高于挽留一个客户的成本,这时候流失预警就具有重要意义。
可以和目前的游戏业务专家明确以下问题:
Who : 分析哪些用户,流失的定义是什么
When: 时间窗口设置,分析期、挽留期、反应期
What: 明确哪些分析指标(衍生出一些占比、趋势字段)
1.2.2客户细分
目前游戏行业的资费业务较单一(时间卡或道具销售),随着业务的不断深入,为了达到收益最大化,增加资费业务的种类有较大意义。可以满足更多用户的差异化需求,同时对不同用户提供差异化产品后可以提高利润。
当游戏行业的资费业务到达一定复杂度后,可以对目前现有的客户资源进行细分,根据不同群体营销不同产品,提高客户的响应度。
1.2.3个性化推荐
根据客户曾经玩过的游戏和购买过的道具,向用户推荐感兴趣的游戏和道具,从而提高用户响应率,进而提升用户的ARPU(价值)
1.2.4种子用户识别
& & 种子用户是手机游戏领域的意见领袖,通过个人的影响力,他们能够带来大量的新用户。如果在推广的时候能一开始找准种子用户,将优秀的游戏推荐给他们,能以最低的成本在最短的时间内拥有大量活跃用户,从而达到病毒式营销的效果。
1.3用户调研(设计问卷、开展调研)
& & 用户调研其实在游戏数据分析工作处在一个边缘的位置,很多玩家不清楚自己想要什么,所以某种程度上我们来做这种调研工作往往会得到错误的玩家信号,所以很少会用调研手段来分析玩家。
主题帖子积分
初来乍到, 积分 23, 距离下一级还需 27 积分
初来乍到, 积分 23, 距离下一级还需 27 积分
楼主如此厉害,做论坛游戏运营板块的版主吧。
主题帖子积分
咨询总监, 积分 2213, 距离下一级还需 787 积分
咨询总监, 积分 2213, 距离下一级还需 787 积分
楼主讲得比较具体,学习了,感谢分享。
主题帖子积分
数据分析师, 积分 423, 距离下一级还需 77 积分
数据分析师, 积分 423, 距离下一级还需 77 积分
楼主讲得很详细
主题帖子积分
初来乍到, 积分 11, 距离下一级还需 39 积分
初来乍到, 积分 11, 距离下一级还需 39 积分
经验丰富,讲解详细。感谢楼主
为论坛做出突出贡献的会员数据分析方法_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
数据分析方法
上传于||暂无简介
阅读已结束,如果下载本文需要使用2下载券
想免费下载本文?
定制HR最喜欢的简历
下载文档到电脑,查找使用更方便
还剩8页未读,继续阅读
定制HR最喜欢的简历
你可能喜欢官方网站上《10
Minutes to pandas》的一个简单的翻译,原文在。这篇文章是对pandas的一个简单的介绍,详细的介绍请参考: 。习惯上,我们会按下面格式引入所需要的包:
一、创建对象
来查看有关该节内容的详细信息。
1、可以通过传递一个list对象来创建一个Series,pandas会默认创建整型索引:
2、通过传递一个numpy
array,时间索引以及列标签来创建一个DataFrame:
3、通过传递一个能够被转换成类似序列结构的字典对象来创建一个DataFrame:
4、查看不同列的数据类型:
5、如果你使用的是IPython,使用Tab自动补全功能会自动识别所有的属性以及自定义的列,下图中是所有能够被自动识别的属性的一个子集:
二、查看数据
详情请参阅:
1、查看frame中头部和尾部的行:
2、显示索引、列和底层的numpy数据:
3、describe()函数对于数据的快速统计汇总:
4、对数据的转置:
5、按轴进行排序
6、按值进行排序
虽然标准的Python/Numpy的选择和设置表达式都能够直接派上用场,但是作为工程使用的代码,我们推荐使用经过优化的pandas数据访问方式: .at,&.iat,&.loc,&.iloc&和&.ix详情请参阅 和 。
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、选择一个单独的列,这将会返回一个Series,等同于df.A:
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、通过[]进行选择,这将会对行进行切片
l通过标签选择
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、使用标签来获取一个交叉的区域
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、通过标签来在多个轴上进行选择
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、标签切片
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、对于返回的对象进行维度缩减
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、获取一个标量
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、快速访问一个标量(与上一个方法等价)
l通过位置选择
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、通过传递数值进行位置选择(选择的是行)
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、通过数值进行切片,与numpy/python中的情况类似
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、通过指定一个位置的列表,与numpy/python中的情况类似
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、对行进行切片
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、对列进行切片
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、获取特定的值
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、使用一个单独列的值来选择数据:
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、使用where操作来选择数据:
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、使用isin()方法来过滤:
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、设置一个新的列:
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、通过标签设置新的值:
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、通过位置设置新的值:
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、通过一个numpy数组设置一组新值:
上述操作结果如下:
<span lang="EN-US" style="mso-bidi-font-size:10.5font-family:&Courier New&;
mso-fareast-font-family:&Courier New&;color:#、通过where操作来设置新的值:
四、缺失值处理
在pandas中,使用np.nan来代替缺失值,这些值将默认不会包含在计算中,详情请参阅:。
1、reindex()方法可以对指定轴上的索引进行改变/增加/删除操作,这将返回原始数据的一个拷贝:、
2、去掉包含缺失值的行:
3、对缺失值进行填充:
4、对数据进行布尔填充:
五、相关操作
详情请参与
l统计(相关操作通常情况下不包括缺失值)
1、执行描述性统计:
2、在其他轴上进行相同的操作:
3、对于拥有不同维度,需要对齐的对象进行操作。Pandas会自动的沿着指定的维度进行广播:
1、对数据应用函数:
具体请参照:
l字符串方法
Series对象在其str属性中配备了一组字符串处理方法,可以很容易的应用到数组中的每个元素,如下段代码所示。更多详情请参考:.
Pandas提供了大量的方法能够轻松的对Series,DataFrame和Panel对象进行各种符合各种逻辑关系的合并操作。具体请参阅:
lJoin 类似于SQL类型的合并,具体请参阅:
lAppend 将一行连接到一个DataFrame上,具体请参阅:
对于”group by”操作,我们通常是指以下一个或多个操作步骤:
l(Splitting)按照一些规则将数据分为不同的组;
l(Applying)对于每组数据分别执行一个函数;
l(Combining)将结果组合到一个数据结构中;
详情请参阅:
1、分组并对每个分组执行sum函数:
2、通过多个列进行分组形成一个层次索引,然后执行函数:
八、Reshaping
详情请参阅
l数据透视表,详情请参阅:.
可以从这个数据中轻松的生成数据透视表:
九、时间序列
Pandas在对频率转换进行重新采样时拥有简单、强大且高效的功能(如将按秒采样的数据转换为按5分钟为单位进行采样的数据)。这种操作在金融领域非常常见。具体参考:。
1、时区表示:
2、时区转换:
3、时间跨度转换:
4、时期和时间戳之间的转换使得可以使用一些方便的算术函数。
十、Categorical
从0.15版本开始,pandas可以在DataFrame中支持Categorical类型的数据,详细
介绍参看:和。
1、将原始的grade转换为Categorical数据类型:
2、将Categorical类型数据重命名为更有意义的名称:
3、对类别进行重新排序,增加缺失的类别:
4、排序是按照Categorical的顺序进行的而不是按照字典顺序进行:
5、对Categorical列进行排序时存在空的类别:
十一、画图
具体文档参看:&docs
对于DataFrame来说,plot是一种将所有列及其标签进行绘制的简便方法:
十二、导入和保存数据
lCSV,参考:
1、写入csv文件:
2、从csv文件中读取:
lHDF5,参考:
1、写入HDF5存储:
2、从HDF5存储中读取:
lExcel,参考:
1、写入excel文件:
2、从excel文件中读取:
阅读(...) 评论()苹果/安卓/wp
积分 404, 距离下一级还需 46 积分
权限: 自定义头衔, 签名中使用图片
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡, 匿名卡下一级可获得
道具: 抢沙发
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
开心签到天数: 148 天连续签到: 1 天[LV.7]常住居民III
我想请教下各位高人如何用SPSS将一个变量的两个维度按照均值或中位数将其进行高低组合划分为四个维度。比如我研究的问题绩效考核目的可以划分为评估型绩效考核与发展型绩效考核两个维度,我想将这两个维度进行组合形成四类,怎么用SPSS处理呢?急求各位高人指点!!!!
载入中......
鼓励积极发帖讨论
总评分:&经验 + 60&
学术水平 + 1&
超越昨天的自己!!!
我也想学spss啊!!!!可不可以+1
具体方法不清楚,没有做过这方面的研究。我记得徐淑英等出版的那本组织与管理实证研究方法一书中有介绍,建议楼主阅读,当中是以徐淑英发表的一篇文章为例进行介绍。
湘中竖子 发表于
具体方法不清楚,没有做过这方面的研究。我记得徐淑英等出版的那本组织与管理实证研究方法一书中有介绍,建 ...谢谢啊 借本书找找
无限扩大经管职场人脉圈!每天抽选10位免费名额,现在就扫& 论坛VIP& 贵宾会员& 可免费加入
加入我们,立即就学扫码下载「就学」app& Join us!& JoinLearn&
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
京ICP证090565号
论坛法律顾问:王进律师}

我要回帖

更多关于 大数据维度统计 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信