分类 DataAnalysis 下的文章

统计中常用的分布

1. 概述

1.1 相关概念

  1. 随机变量:
    • 设随机试验的样本空间为S(e) = {e}. X = X(e)是定义在样本空间S上的实值单值函数. 称X = X(e)为随机变量.
  2. 离散型随机变量:
    • 有些随机变量, 它全部可能取到的值是有限个或可列无限多个, 这种随机变量称为离散型随机变量.

- 阅读剩余部分 -

多元统计分析之因子分析

1. 概述

  • 研究观测变量变动的共同原因和特殊原因, 从而达到简化变量结构目的的多元统计方法

1.1 应用

  • 寻求变量的基本结构, 简化变量系统
  • 用于分类, 根据因子得分值, 在因子轴所构成的空间中将变量或者样本进行分类(能够分析样品间差异的原因)

- 阅读剩余部分 -

多元统计分析之主成分分析

1. 概述

  • 主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标, 同时根据实际需要从中取几个较少的综合指标尽可能多地反映原来指标的信息。
  • 这种将多个指标转化为少数互相无关的综合指标的统计方法叫做主成分分析或称主分量分析。

- 阅读剩余部分 -

多元统计分析之判别分析(贝叶斯判别和费歇判别)

1. 概述

  • 判别分析是判别样品所属类型的一种分析方法,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。
  • 判别分析于聚类分析的功能差不多,区别在于,聚类分析之前,没有人知道具体的是怎么分的类,分了哪几大类。而判别分析是已经把类别给分好,要做的是把没有分好类的数据观测,按照之前分好的类再进行分类。这里不同于生活中常见的分类先有具体的分类逻辑(这里叫做判别函数)。所以判别分的难点在于先由分好类的数据观测找到一个或者多个判别函数,然后对未进行分类的观测按照该判别公式进行分类。

- 阅读剩余部分 -

多元统计分析之聚类分析

1. 概述

  • 聚类分析是研究如何将研究对象按照多个方面的特征进行综合分类的一种统计方法
  • 聚类分析就是分析如何对样品(或变量)按照他们在性质上的亲疏程度进行量化分类的问题
  • 聚类分析有效解决了科学研究中多因素、多指标的分类问题

- 阅读剩余部分 -