新知梳理
一般地,设有 $ n $ 个数据 $ x_{1},x_{2},···,x_{n} $,其平均数记为 $ \overline{x} $,则离差平方和为
一般地,设有 $ n $ 个数据 $ x_{1},x_{2},···,x_{n} $,其平均数记为 $ \overline{x} $,则离差平方和为
$d^{2}=(x_{1}-\bar{x})^{2}+(x_{2}-\bar{x})^{2}+···+(x_{n}-\bar{x})^{2}$
。如果把这组数据分为两组,前 $ m(m < n) $ 个数据为一组,后 $ (n - m) $ 个数据为一组,它们的平均数分别记为 $ \overline{x}_{1} $ 和 $ \overline{x}_{2} $,离差平方和分别为 $ d_{1}^{2}=(x_{1}-\overline{x}_{1})^{2}+(x_{2}-\overline{x}_{1})^{2}+···+(x_{m}-\overline{x}_{1})^{2} $,$ d_{2}^{2}=(x_{m + 1}-\overline{x}_{2})^{2}+(x_{m + 2}-\overline{x}_{2})^{2}+···+(x_{n}-\overline{x}_{2})^{2} $,那么 $ d^{2}=d_{1}^{2}+d_{2}^{2}+m(\overline{x}_{1}-\overline{x})^{2}+(n - m)(\overline{x}_{2}-\overline{x})^{2} $。其中 $ d_{1}^{2}+d_{2}^{2} $ 称为组内离差平方和,表示两个组内数据的离散程度;记 $ d_{12}^{2}=m(\overline{x}_{1}-\overline{x})^{2}+(n - m)(\overline{x}_{2}-\overline{x})^{2} $,$ d_{12}^{2} $ 是 $ m $ 个第一组数据平均数、$ (n - m) $ 个第二组数据平均数关于总体数据平均数的离差平方和,称为组间离差平方和,表示两个组间的差异。答案:$d^{2}=(x_{1}-\bar{x})^{2}+(x_{2}-\bar{x})^{2}+···+(x_{n}-\bar{x})^{2}$
1. 将以下 10 个数据 $ 1,9,12,3,2,11,10,4,7,13 $ 按数值从小到大排序后,根据组内离差平方和最小的原则分为两组,最佳的分割点在第
4
个数据点之后。答案:1. 4
2. 某班 10 名学生的身高情况(单位:cm)如下:
$\begin{array}{lllll}145 & 150 & 140 & 142 & 158 \\160 & 145 & 150 & 158 & 144\end{array}$
根据组内离差平方和最小的原则,将这 10 名学生分为两组。
$\begin{array}{lllll}145 & 150 & 140 & 142 & 158 \\160 & 145 & 150 & 158 & 144\end{array}$
根据组内离差平方和最小的原则,将这 10 名学生分为两组。
答案:
2. 将数据从小到大排序:140,142,144,145,145,150,150,158,158,160.尝试分组列表如下(结果保留2位小数):

$\therefore$根据题意,前7个数据为一组,后3个数据为一组进行分组,即$\{140,142,144,145,145,150,150\}$和$\{158,158,160\}$
2. 将数据从小到大排序:140,142,144,145,145,150,150,158,158,160.尝试分组列表如下(结果保留2位小数):
$\therefore$根据题意,前7个数据为一组,后3个数据为一组进行分组,即$\{140,142,144,145,145,150,150\}$和$\{158,158,160\}$