【統計検定1級】統計応用・社会科学 2021年 問1【解答】

本記事は、2021年に実施された統計検定1級・統計応用・社会科学の問1について、投稿者による解答例と解説を掲載しています。
統計検定の問題は、実施団体が定める「統計検定の問題の使用に関する規約」により、当サイトでは掲載いたしません。出題の正確な内容や公式の解答は公式問題集等をご参照ください。
記載内容は投稿者個人の見解であり、一般財団法人統計質保証推進協会および日本統計学会の公式見解・公式解答ではありません。
統計検定®は一般財団法人統計質保証推進協会の登録商標です。

解答

[1]

全体の母平均$\mu$は各層の平均$\mu_i$から次のように求められる。
\begin{align*}
\mu &= \frac{1}{N} \sum_{h=1}^H N_i \mu_i \\
&= \frac{1}{1000} (700\times 100 + 200\times 200 + 100\times 500) = 160
\end{align*}
ここで、$H$は層の数、$N_i$は各層の施設数、$N=N_1+\cdots +N_H$は全施設数。
また、全体の分散$\sigma^2$は
\[
\sigma^2 = \frac{1}{N} \sum_{i=1}^N X_i^2 – \mu^2
\]
として表せられる。ここで、二乗和の平均は各層の標準偏差より次のように与えらえる。
\begin{align*}
h=1 \quad m_1 = \frac{1}{N_1} \sum_{i=1}^{N_1} X_{1i}^2 &=
\sigma_1^2 + \mu_1^2 = 10^2+100^2 = 10100
\\
h=2 \quad m_2 = \frac{1}{N_2} \sum_{i=1}^{N_2} X_{2i}^2 &=
\sigma_2^2 + \mu_2^2 = 50^2+200^2 = 42500
\\
h=3 \quad m_3 = \frac{1}{N_3} \sum_{i=1}^{N_3} X_{3i}^2 &=
\sigma_3^2 + \mu_3^2 = 100^2+500^2 = 260000
\end{align*}
これより、求める$\sigma^2$は
\begin{align*}
\sigma^2 &= \frac{1}{N} \sum_{h=1}^H N_h m_h – \mu^2 \\
&= 0.7 \times 10100 + 0.2 \times 42500 + 0.1 \times 260000 – 160^2 = 15970
\end{align*}

[2]

非復元無作為抽出における標本平均$\bar{X}$の期待値と分散は
\[
\E[\bar{X}] = \mu, \qquad
\textrm{V}[\bar{X}] = \frac{\sigma^2}{n} \cdot \frac{N-n}{N-1}
\]
として与えらえる。だが、問題文に「有限母集団修正は行わないものとする」とあるので
\begin{align*}
\E[\bar{X}] &= \mu = 160 \\
\textrm{V}[\bar{X}] &= \frac{\sigma^2}{n} = 159.7
\end{align*}

[3]

ここでは次のような各層から標本を抽出しその標本平均を割合の加重平均をした推定量を考える。
\[
\hat{X} = \sum_{h=1}^3 \frac{N_h}{N} \frac{1}{n_h} \sum_{i=1}^{n_h} X_{h i}
\]
このとき、期待値は
\begin{align*}
\E[\hat{X}] &=
\sum_{h=1}^3 \frac{N_h}{N} \frac{1}{n_h} \sum_{i=1}^{n_h} \E[X_{h i}]
\\
&=
\sum_{h=1}^3 \frac{N_h}{N} \mu_h
\end{align*}
となり、これより
\[
\frac{700}{1000} \times 100 +
\frac{200}{1000} \times 200 +
\frac{100}{1000} \times 500 = 160
\]
また、分散は
\begin{align*}
\textrm{V}[\hat{X}] &=
\sum_{h=1}^3 \frac{N_h^2}{N^2} \frac{1}{n_h^2}
\sum_{i=1}^{n_h} \textrm{V}[X_{h i}]
\\
&=
\sum_{h=1}^3 \frac{N_h^2}{N^2} \frac{\sigma_h^2}{n_h}
\end{align*}
となり、これより
\[
\left(\frac{700}{1000}\right)^2 \times \frac{10^2}{70} +
\left(\frac{200}{1000}\right)^2 \times \frac{50^2}{20} +
\left(\frac{100}{1000}\right)^2 \times \frac{100^2}{10}
= 15.7
\]
となる。

[4]

問題文よりネイマン配分法による標本数は次のように与えらえる。
\[
n_k = \frac{\sigma_k N_k}{\sum_{h=1}^H \sigma_h N_h} n
\]
として与えられる。
このとき、
\[
\sum_{h=1}^H \sigma_h N_h =
10 \times 700 + 50 \times 200 + 100 \times 100 = 27000
\]
となり、これより
\begin{align*}
n_1 &= \frac{10 \times 700}{27000} \times 100 = 25.9259\cdots \approx 26 \\
n_2 &= \frac{50 \times 200}{27000} \times 100 = 37.0370\cdots \approx 37 \\
n_3 &= \frac{100\times 100}{27000} \times 100 = 37.0370\cdots \approx 37
\end{align*}
となる。
このとき、$\hat{X}$の期待値は[4]より$n_h$には依存しないので、$\E[\hat{X}] = 160$となり、分散$\textrm{V}[\hat{X}]$は[3]より
\begin{align*}
\textrm{V}[\hat{X}] &=
\sum_{h=1}^3 \frac{N_h^2}{N^2} \frac{\sigma_h^2}{n_h}
\\
&=
\left(\frac{700}{1000}\right)^2 \times \frac{10^2}{26} +
\left(\frac{200}{1000}\right)^2 \times \frac{50^2}{37} +
\left(\frac{100}{1000}\right)^2 \times \frac{100^2}{37}
= 7.29\cdots
\end{align*}
となる。