2-1 基本特征数 2.1.1 资料的收集与整理 一、相关术语: 1.资料:经过调查和记载得到的该生物体的各种性状的大量数据。 2.总体:指的是具有共同性质的个体所组成的集团。 又分为有限总体和无限总体。 3.样本:指的是从总体内抽取出来的的若干个个体,或者说是总体的一部分个体。是用来研究总体的。 4.参数由总体的全部观察值计算得到的总体特征数为参数。 它是该总体的真正的值。 5.统计数:由样本观察值计算得到的样本特征数为统计数。 二、资料的整理: 一)试验资料的类别: (一)数量性状资料: 1.连续性变数资料: 2.非连续性变数资料: (二)质量性状资料: 1.统计次数的方法: 在一定的总体内统计具有某性状的个体数目及具有不同性状的个体数目,按其类别统计其次数或相对次数。 例如:200株豌豆中,有140株紫花占70%,60株白花占30%,这类资料称为次数资料。 2.给予每类性状相当数量的方法: 二)资料的的整理: (一)次数分布表 1.非连续性变数的整理: 见表4-1第35页 2.连续性变数资料的整理 1)求全距。 2)确定组数和组距。 3)确定组限和组中值(中点值)。 4)原始资料的归类 3.质量性状变数资料的整理 (二)次数分布图 1.柱形图: 2.多边形图: 3.条形图
2.1.2 平均数与变异数 一、平均数数种类: 平均数是数量资料的代表值,表示整个资料的集中趋势,并作为资料的代表值与另一组资料相比较。 (一)算术平均数:一个数量资料各个观察值的总和除以观察值个数所得的商称为算术平均数。 (二)中数:将资料中的观察值由小到大依次排列,居于中间位置的观察值称为中数。 (三)众数:资料中出现最多的观察值称为众数 (四)几何平均数:以n个观察值相乘开n次方所得的数值为几何平均数。一般用G表示。 1、算术平均数计算方法 (一)未分组资料计算方法 (二)分组资料计算法 2、算术平均数的性质 (一)各个观察值与平均数的差数总和等于零,即离均差总和等于零。 (二)样本中各个观察值与其平均数差数平方的总和为最小,即离均差的平方总和为最小,即: ∑(x- )2=最小 三、变异数 (一)极差: 极差是资料中最大观察值与最小观察值的差数,亦称为全距,用R表示。 (二)方差: 含有n个观察值的样本,其各个观察值为x1、x2、x3、……xn,每个值与 相减,即可得到离均差。如果相加,其总和等于0,不能反映变异度的大小。如把各个离均差平方相加得离均差的平方和。简称平方和。用ss表示,定义如下: 样本ss= 2 总体ss= �0�8)2 如果ss大,变异度大 均方或方差
样本均方用s2 总体均方用δ2 (三)标准差: 标准差表示资料的变异度. 样本S= 总体δ= (四)变异系数(CV%) CV%= ×100
一个向量(或函数)被矩阵相乘,表示对这个向量做了一个线性变换。如果变换后还是这个向量本身乘以一个常数,这个常数就叫特征值。这是特征值的数学涵义