【統計検定1級】統計応用・社会科学 2025年 問1【解答】

本記事は、2025年に実施された統計検定1級・統計応用・社会科学の問1について、投稿者による解答例と解説を掲載しています。
統計検定の問題は、実施団体が定める「統計検定の問題の使用に関する規約」により、当サイトでは掲載いたしません。出題の正確な内容や公式の解答は公式問題集等をご参照ください。
記載内容は投稿者個人の見解であり、一般財団法人統計質保証推進協会および日本統計学会の公式見解・公式解答ではありません。
統計検定®は一般財団法人統計質保証推進協会の登録商標です。

解答

[1]

母平均$\mu$は、各層の平均をその構成比率(重み)$p_h$で加重平均したもので表せるので
\[
\mu = p_1 \mu_1 + p_2 \mu_2
\]
また、母分散$\sigma^2$は、分散分析で使われる平方和の分解より
\begin{align*}
\textrm{総平方和} &=
\textrm{層間平方和(群間平方和)} +
\textrm{層内平方和(郡内平方和)}
\\
&=
\textrm{層内平方和(郡内平方和)} +
\textrm{層間平方和(群間平方和)}
\end{align*}
と分割でき、これより全体の分散$\sigma^2$は「層内分散の平均」と「層間分散(各層の平均と全体平均の差)」との和に分解でき、次のように表せる。
\[
\sigma^2 =
\underbrace{(p_1 \sigma_1^2 + p_2 \sigma_2^2)}_{\text{層内変動}} +
\underbrace{\{p_1 (\mu_1 – \mu)^2 + p_2 (\mu_2 – \mu)^2\} }_{\text{層間変動}}
\]
さらに、今回2層からなっているので、$p_1+p_2=1$であることに注意すると
\[
\mu_1 – \mu = \mu_1 – (p_1 \mu_1 + p_2 \mu_2) = (1-p_1)\mu_1 – p_2 \mu_2
= p_2 (\mu_1 – \mu_2)
\]
同様にして
\[
\mu_2 – \mu = p_1 (\mu_2 – \mu_1)
\]
となる。これより全体の分散$\sigma^2$は次のようにも表せる。
\begin{align*}
\sigma^2 &=
(p_1 \sigma_1^2 + p_2 \sigma_2^2) +
\{p_1 (\mu_1 – \mu)^2 + p_2 (\mu_2 – \mu)^2\}
\\
&= (p_1 \sigma_1^2 + p_2 \sigma_2^2) +
p_1 p_2^2 (\mu_1 – \mu_2)^2 + p_1^2p_2 (\mu_2 – \mu_1)^2
\\
&= (p_1 \sigma_1^2 + p_2 \sigma_2^2) + p_1 p_2 (\mu_1 – \mu_2)^2
\end{align*}
また表1の値から$\mu$と$\sigma^2$を求めると$p_1=0.25, \mu_1=90, \sigma_1=30$ および $p_2=0.75, \mu_2=30, \sigma_2=10$より
\begin{align*}
\mu &= 0.25 \times 90 + 0.75 \times 30 = 22.5 + 22.5 =45 \\
\sigma^2 &=
0.25 \times 30^2 + 0.75 \times 10^2 +
0.25 \times 0.75 \times \times (90-30)^2
\\
&= 225 + 75 + 675 = 975
\end{align*}
となる。

[2]

一般論として有限母集団であろうと標本平均$\bar{X}$の期待値は母平均$\mu$と一致し、また標本平均$\bar{X}$の分散は問題文より有限母集団修正を行わないので母集団の分散$\sigma^2$を標本数$n$で割ったものとなる。つまり、
\[
\E[\bar{X}] = \mu, \quad \textrm{V}[\bar{X}] = \frac{\sigma^2}{n}
\]
これより、$n=100$と[1]の結果から
\begin{align*}
\E[\bar{X}] &= 45 \\
\textrm{V}[\bar{X}] &= \frac{975}{100} = 9.75
\end{align*}

[3]

ここで、
\[
\tilde{X} =
\frac{p_1}{n_1} \sum_{i=1}^{n_1} X_{1i} +
\frac{p_2}{n_2} \sum_{i=1}^{n_2} X_{2i}
\]
とすると、これの分散は
\begin{align*}
\textrm{V}[\tilde{X}] &=
\frac{p_1^2}{n_1} \sigma_1^2 + \frac{p_2^2}{n_2} \sigma_2^2
\end{align*}
となる。
ここで、$n_1 = p_1 n$、$n_2 = p_2 n$とすると
\begin{align*}
\textrm{V}[\tilde{X}] &=
\frac{1}{n} (p_1 \sigma_1^2 + p_2 \sigma_2^2)
\end{align*}
となる。
これより、$n=100$、$p_1=0.25$、$p_1=0.75$、$\sigma_1 = 30$、$\sigma_2=10$を代入すれば
\begin{align*}
\textrm{V}[\tilde{X}] &=
\frac{1}{100} (0.25 \times 30^2 + 0.75 \times 10^2)
= \frac{300}{100} = 3
\end{align*}

[4]

問題文より
\[
n_1:n_2 = p_1 \sigma_1 : p_2 \sigma_2
\Rightarrow
n_1 p_2 \sigma_2 = n_2 p_1 \sigma_1
\]
となり、また$n_1 + n_2 =n$より
\[
n_1 p_2 \sigma_2 = (n-n_1) p_1 \sigma_1
\Rightarrow
n_1 = \frac{p_1 \sigma_1}{p_1 \sigma_1 + p_2 \sigma_2} n
\]
また、同様にして
\[
n_2 = \frac{p_2 \sigma_2}{p_1 \sigma_1 + p_2 \sigma_2} n
\]
を得る。これより、このもとでの分散$\textrm{V}[\tilde{X}]$は
\begin{align*}
\textrm{V}[\tilde{X}] &=
\frac{p_1^2}{n_1} \sigma_1^2 + \frac{p_2^2}{n_2} \sigma_2^2
\\
&=
\frac{1}{n} (p_1 \sigma_1 + p_2 \sigma_2)^2
\end{align*}
となる。
これより、$n=100$、$p_1=0.25$、$p_1=0.75$、$\sigma_1 = 30$、$\sigma_2=10$を代入すれば
\begin{align*}
\textrm{V}[\tilde{X}] &=
\frac{1}{100} (0.25 \times 30 + 0.75 \times 10)^2
= \frac{225}{100} = 2.25
\end{align*}
となり、[2]や[3]で求めた分散と比較して最小の分散であることがわかる。