某地一批超基性岩样品,经分析 Ni,Co,Cu,Cr,S,As 含量见表8-6。
表8-6 某地超基性岩样品 Ni,Co,Cu,Cr,S,As 含量
1.用 R 型聚类分析对元素进行分类
1)将原始数据转换为对数,并计算各元素对数值的平均值和标准离差,其结果见表8-7。
表8-7 某地超基性岩样品中元素含量对数值 lg(wB/10- 6)、平均值 及标准偏差值
2)将各样品中各元素含量对数值进行标准化。
3)按照数据标准化公式:
地球化学找矿方法
于是可得标准化数据见表8-8。
4)计算相关系数,列出相关系数矩阵(R(0)),按照相关系数计算公式:
地球化学找矿方法
表8-8 标准化数据
于是得相关矩阵(R(0))
地球化学找矿方法
5)将 R(0)中相关系数最大的 Co,Cu 联结成一类,记为 Co'填入分类统计表中,并计算 Co'的数据。
按照加权平均计算公式:
地球化学找矿方法
于是得表 8 9。
表8-9 由 R(0)得到的 Co'值
6)计算新变量 Co'与剩余的变量的相关系数,列出新相关矩阵 R(1)。
相关系数计算公式同前(以下同)于是得:
地球化学找矿方法
7)将 R(1)中相关系数最大的 Ni,Co'联结成一类,记为 Ni'填入分类统计表中,并计算 Ni'的数据。
Ni'的数据仍按前加权平均的公式计算(以下同),于是得表 8 10。
表8-10 由 Co'重新计算的 Ni'值
8)计算新变量 Ni'与剩余的变量的相关系数,列出新相关矩阵 R(2)。
于是得:
地球化学找矿方法
9)将 R(2)中相关系数最大的 S,As 联结成一类,记为填入分类统计表中,并计算 S'的数据(表 8 11)。
表8-11 S'计算结果
10)计算新变量 S'与剩余变量的相关系数,列出刷新的相关矩阵 R(3):
地球化学找矿方法
11)将 R(3)中相关系数最大的 Ni'与 S'联结成一类,记为 Ni″,填入分类统计表中(表 8 12)。
表8-12 Ni″计算结果
12)计算新变量 Ni″与剩余变量的相关系数,列出刷新的相关矩阵 R(4)。
13)最后将 Ni″与 Cr 联结起来,记入分类统计表 8 - 13。
表8-13 分类统计表
14)制作谱系图(图 8 6)。
从上述谱系图可见,在相关系数 0.2 ~ 0.5 的相似水平上,可将述六个元素分为两类: 一类是 Cr(亲氧元素); 另一类是 Co,Cu,Ni,As(亲硫元素)。在相关系数 0.6 左右可将亲硫元素分为两组,一组是 S,As(阴离子); 一组是 Co,Cu,Ni(阳离子),且 Co,Cu 相关关系更密切。这样通过 R 型聚类分析清楚地提示出这些元素在超基性岩石的相互关系。
图8-6 谱系图
2.用 Q 型聚类分析对样品进行分类
仍以上述超基岩样品分析结果为例。
对样品分类常用距离系数。由于距离系数是对直角坐标系而言,即要求变量要互不相关。故可先用 R 型聚类分析(式 R 型因子分析)选出互相独立的变量(在用 R 型聚类分析时,通常取相关系数绝对值小的变量),然后以距离系数对样品进行分类。
上例 R 型聚类分析结果,在 R = 0.6 水平左右可将变量分为三组,即 Ni'(Ni,Co,Cu); S'(S,As); Cr,现以这三组为变量对样品进行分类。
1)将变量数据(对数值)进行合并,得出新的数据表。合并的办法是取该组变量的平均值,于是得表 8 14。
表8-14 对变量数据合并后的新的数据
2)将数据正规化。按正规化的公式:
地球化学找矿方法
于是得表 8 15。
表8-15 正规后的数据表
3)计算距离系数 djk,列出初始距离系数矩阵 D(0)。
按距离系数公式:
地球化学找矿方法
于是得:
地球化学找矿方法
4)将 D(0)中距离系数值最小的(5),(6)样品联结成一类,记为(5')填入分类统计表中,并计算(5')的数据。
按照加权平均计算公式:
地球化学找矿方法
于是得表 8 16。
表8-16(5')的数据表
5)计算(5')与样品的距离系数,列出刷新距离系数矩阵 D(1)。
于是得:
地球化学找矿方法
6)将 D(1)中距离系数最大的(2),(5')联结成一类,记为(2'),填入分类统计表中,并计算(2')的数据。
于是得表 8 17。
表8-17(2')的数据表
7)计算(2')与剩余样品的距离系数,列出刷新的距离系数矩阵 D(2)于是得:
地球化学找矿方法
8)将 D(2)中距离系数最小的(1),(4)联结成一类,记为(1'),填入分类统计表中,并计算(1')的数据。
于是得表 8 18。
表8-18(1')的数据表
9)计算(1')与剩余样品的距离系数,列出刷新的距离系数矩阵 D(3)。
于是得:
地球化学找矿方法
10)将 D(3)中距离系数最小的(1'),(2'),联结成一类,记为(1″),填入分类统计表中,并计算(1″)的数据。
于是得表 8 19。
表8-19(1″)的数据表
11)计算(1″)与剩余样品的距离系数,列出新的距离系数矩阵 D(4)。
于是得:
地球化学找矿方法
12)最后将(1″),(3)联结成一类,填入分类统计表 8 20。
表8-20 分类统计表
13)制作谱系图(图 8 7)。
从谱系图上可得: 在距离系数 0.35 ~ 0.5水平上,可将数个样品分成三类: 一类是矿化的蛇纹岩(1)及(4); 另一类是无矿化的蛇纹岩(2)及滑镁岩(5),(6); 样品(3)为单独一类,它是无矿化的蛇纹岩。因此,通过Q 型聚类分析很好地将该地含矿岩体和不含矿岩体区分开来。至于样品(3)单独开,还可进一步研究它与其他无矿岩体的差异。
图8-7 谱系图
这里需要特别指出的是运用回归分析、判别分析、聚类分析都是在特定的地质条件下得出的统计规律,因此,在利用这些规律对未知进行判断时,一定要注意地质条件的相似性,切不可把某一地质条件下导出的规律,生搬硬套地用于解决不同地质条件下的问题。
本 章 小 结
1.地球化学测量数据原则上都要进行相应的数据处理,不同的统计方法处理数据,将得到不同的结果。
2.这些不同的结果将以图表的形式表示以便异常的解释评价。
复习思考题
1.相关分析能解决哪些问题?
2.为了解决数据在空间上的变化规律,我们常用哪种数理统计方法?
3.移动平均在一维、二维空间上处理数据,会使相应的图件发生什么样的变化?