
【简答题】定量分析的方法有哪些?
定量分析方法是通过数据建模和统计计算揭示变量关系的系统性工具,主要分为描述性统计与推断性统计两大类,后者又包含回归分析、机器学习等进阶技术。这些方法广泛应用于预测建模、风险评估、市场分析等场景,例如通过回归分析确定广告投入与销售额的关系。
通过统计量和图表概括数据的集中趋势、离散程度与分布形态,不涉及对总体的推断。
核心指标:
集中趋势:平均值(班级考试平均分)、中位数(中间位置学生成绩)、众数(最常见分数段);
离散程度:标准差(数据偏离均值的程度)、极差(最高分与最低分差值)、四分位数(数据分布的区间划分);
可视化工具:直方图(展示成绩分布)、散点图(分析两个变量相关性)、箱线图(识别异常值)。
应用场景:快速掌握数据全貌,如企业年度销售额的波动范围与平均水平分析。
基于样本数据推断总体特征,通过假设检验、置信区间等方法验证结论可靠性。
假设检验:判断样本差异是否具有统计意义,如新药疗效是否显著优于安慰剂。
时间序列分析:处理随时间变化的数据,分解趋势(长期增长)、季节性(季度波动)和随机波动,用于销售预测或经济周期分析。
回归分析:建模变量间的因果关系,核心类型包括:
线性回归:如广告投入(自变量)与销售额(因变量)的线性关系,模型表达式为 \(Y = aX + b\),通过最小二乘法求解参数;
逻辑回归:用于二分类问题(如用户是否点击广告),通过Sigmoid函数将输出映射到[0,1]区间,表示事件发生概率;
正则化方法:当自变量高度相关时,岭回归(L2正则化)和套索回归(L1正则化)通过惩罚项降低过拟合风险,前者保留所有变量,后者可自动筛选关键变量。
应用案例:通过多元线性回归分析房价影响因素(面积、地段、学区等),并预测未知房源价格。
适用于高维、非线性数据,通过算法自动学习数据规律。
监督学习:
决策树/随机森林:通过树形结构划分特征空间,随机森林集成多棵树降低过拟合风险,用于客户流失预测;
支持向量机(SVM):将低维非线性数据映射到高维空间,构建超平