怎么分析数据?
1,结构分析法:看整体构成和分布,一步步拆解。2.分组分析法:按照某个具体维度细分拆卸。
3.对比分析,同比,环比,同行业,同品类等。
4.时间序列趋势法:查看时间趋势。
5.相关性分析方法:相关性和因果性。
分析模型
对于一些简单的模型,确实可以通过常见的分析方法得出一些一般性的结论,但是在实际工作中,并不是单一的问题,往往是一些符合性的问题,所以要考虑的方面也会增加:
要解决的问题涉及到那些维度的数据;
从数据分析师的角度来看,这个问题有一个通用的解决方案或者需要重新研究。
从原始数据集到分析数据是否需要处理。
而所有的模型都是为了更好的解决问题。
RFM分类模型
R(recency),最近消费时间,表示用户最近一次消费的时间距离现在越近,客户越多s值。
f(频率)消费频率是指用户在统计周期内的购买次数。频率越高,值越大。
m(货币)消费金额:指统计期内消费的总额,金额越大,数值越高。
通过数据的标准化发送权重设置,对分类模型进行评分,比如餐厅的单价,20元以下的普通用户。
20-30个好用户,40个以上优秀用户,所有指标都可以用这个方法标准化。
中位数法常用于定义分支。
最晚消费时间,一般是一周或一个月,结合经营情况。
这种模式的本质是筛选头部用户,专注运营。
AARRR成长模型,了解模型就好,实际需要结合自己的业务。
A:得到A:当天活跃,R:明天继续活跃,R:增加收入,R:提高自我沟通。
模型的主要功能是可以从那些点快速理清增长,找到突破点。
5W2H通用型号
生活中的聊天都是围绕这几点展开的,这个模型可以帮助我们快速确定一个问题。
用户生命周期模型
互联网行业往往可以跟踪每个阶段的用户,每个阶段应该有不同的运营策略和发展方向。对于分析师来说,要及时识别。
对模型有所了解,从而知道什么时候用,怎么用。
数据分析方法怎么写?
一.描述性统计描述性统计是对统计方法的总结,揭示了数据分布的特征。主要包括数据频率分析、数据集中趋势分析、数据分散程度分析、数据分布以及一些基本的统计图表。
1.填补缺失值:常见的方法有消元法、平均法、决策树法。
2.正态性检验:许多统计方法要求数值服从或近似服从正态分布,所以数据分析前需要进行正态性检验。常用方法:非参数K-数量检验、P-P图、Q-Q图、W检验、动态差分法。
二、回归分析
回归分析是应用最广泛的数据分析方法之一。它以观察到的数据为基础,在变量之间建立适当的依赖关系来分析数据的内在规律。
1.一元线性分析
只有一个自变量X与因变量Y相关,X和Y都必须是连续变量,因变量Y或其残差必须服从正态分布。
2.多次线性回归分析
使用条件:分析多个自变量X和因变量Y的关系,X和Y都必须是连续变量,因变量Y或其残差必须服从正态分布。
3.逻辑回归分析
线性回归模型要求因变量是连续的正态分布变量,自变量和因变量具有线性关系,而Logistic回归模型不要求因变量的分布,一般在因变量离散时使用。
4.其他回归方法:非线性回归、有序回归、Probit回归、加权回归等。
第三,方差分析
使用条件:每个样本必须是独立的随机样本;每个样本都来自正态分布的总体;人口方差相等。
1.单因素方差分析:当一个实验只有一个影响因素,或者有多个影响因素时,只分析其中一个因素与响应变量的关系。
2.有交互作用的多因素方差分析:1.实验中有很多影响因素。分析影响因素与响应变量之间的关系,同时考虑影响因素之间的关系。
3.多因素非交互方差分析:分析多个影响因素与响应变量之间的关系,但影响因素之间没有影响关系或影响关系被忽略。
4.协方差分叉:传统的方差分析有明显的缺点,不能控制分析中的一些随机因素,降低了分析结果的准确性。协方差分析是将线性回归和方差分析相结合的一种分析方法,主要是排除协变量的影响,然后分析校正后的主效应的方差。
第四,假设检验
1.参数测试
参数检验是对一些主要参数(如均值、百分比、方差、相关系数等)进行检验。)在已知总体分布的条件下(一个要求总体服从正态分布)。
2.非参数检验
非参数检验不考虑总体分布是否已知,往往不是针对总体参数,而是针对总体的一些一般假设(如总体分布的位置是否相同,总体分布是否正态)。
应用:顺序数据,其分布通常是未知的。
1)虽然是连续数据,但总体分布模式未知或非正态;
2)虽然总体呈正态分布,数据连续,但样本量极小,如10以下;
主要方法有卡方检验、秩和检验、二项式检验、游程检验、K-数量检验等。