【統計検定1級】統計応用・社会科学 2025年 問5【解答】

本記事は、2025年に実施された統計検定1級・統計応用・社会科学の問5について、投稿者による解答例と解説を掲載しています。
統計検定の問題は、実施団体が定める「統計検定の問題の使用に関する規約」により、当サイトでは掲載いたしません。出題の正確な内容や公式の解答は公式問題集等をご参照ください。
記載内容は投稿者個人の見解であり、一般財団法人統計質保証推進協会および日本統計学会の公式見解・公式解答ではありません。
統計検定®は一般財団法人統計質保証推進協会の登録商標です。

解答

[1]

ここで、$U$を母集団から一人を取り出したとき500万以上である事象、$L$を母集団から一人を取り出したとき500万未満である事象とする。
このとき質問AにYesと解答する確率$\theta$は
\begin{align*}
\theta &= P(\textrm{A=Yes}) \\
&= P(U) P(\textrm{A=Yes}|U) + P(L)P(\textrm{A=Yes}|L) \\
&= \pi (1-h_1) + (1-\pi) h_2 = (1-h_1-h_2) \pi + h_2
\end{align*}
となる。
このとき、$m$は二項分布$B(n, \theta)$に従う確率変数より、推定量$\tilde{\pi} = \frac{m}{n}$の期待値は以下のように与えられる。
\begin{align*}
\E[\tilde{\pi}] &= \E\left[\frac{m}{n}\right] \\
&= \theta = (1-h_1-h_2) \pi + h_2 \\
&= (1 – 0.1 – 0.2)\pi + 0.2 = 0.7\pi + 0.2
\end{align*}
また分散は
\begin{align*}
\textrm{V}[\tilde{\pi}] &= \textrm{V}\left(\frac{m}{n}\right) \\
&= \frac{\theta (1-\theta)}{n}
= \frac{1}{n} \{ (1-h_1-h_2) \pi + h_2 \} \{1-h_2 – (1-h_1-h_2) \pi \} \\
&= \frac{1}{n}(0.2+0.7\pi)(0.8-0.7\pi)
\end{align*}

[2]

[1]より、$m$は二項分布$B(n, \theta)$に従うので$\theta$の最尤推定量は標本比率 $\hat{\theta} = \frac{m}{n}$ である。
ここで、$\theta = (1 – h_1 – h_2)\pi + h_2$より
\[
\pi = \frac{\theta-h_2}{1- h_1 – h_2}
\]
と表せる。つまり$\pi$は$\theta$の一次関数として表せるので、最尤推定量の不変性の原理により、
\[
\hat{\pi} = \frac{\hat{\theta}-h_2}{1- h_1 – h_2}
= \frac{\hat{\theta}-0.2}{0.7}
\]
として与えられる。
だが、$\pi$は$0\le \pi \le 1$であることに注意する必要がある。
$\hat{\pi} < 0$となるとき、つまり
\[
\frac{\hat{\theta}-0.2}{0.7} < 0 \implies \hat{\theta} < 0.2
\]
のときは$\hat{\pi} = 0$とする。
また、$\hat{\pi} > 1$となるとき、つまり
\[
\frac{\hat{\theta}-0.2}{0.7} > 1 \implies \hat{\theta} > 0.9
\]
のときは$\hat{\pi} = 1$とする。
以上、まとめると
\[
\hat{\pi} =
\begin{cases}
0 & \hat{\theta} < 0.2 \\
\frac{\hat{\theta}-0.2}{0.7} & 0.2 \le \hat{\theta} \le 0.9 \\
1 & \hat{\theta} > 0.9
\end{cases}
\]
となる。または$\hat{\theta} = \frac{m}{n}$として
\[
\hat{\pi} =
\begin{cases}
0 & m < 0.2 n \\
\frac{m – 0.2n}{0.7n} & 0.2n \le m \le 0.9n \\
1 & m > 0.9n
\end{cases}
\]

[3]

質問にYesと答える確率は
\begin{align*}
P(\textrm{YES}) &=
P(\textrm{A}) P(Yes | \textrm{A}) + P(\textrm{B}) P(Yes | \textrm{B}) \\
&= p \pi + (1-p) (1-\pi) \\
&= (2p-1) \pi + 1-p \\
&= \left( \frac{4}{3} – 1 \right) \pi + 1 – \frac{2}{3} \\
&= \frac{1}{3}\pi + \frac{1}{3}
\end{align*}

[4]

[2]と同様にして、最尤推定量$\breve{\pi}$は最尤推定量$\hat{\theta}$を使って与えられる。
いま、$\theta$と$\pi$の関係は
\[
\theta = (2p-1) \pi + 1-p \implies
\pi = \frac{\theta – (1-p)}{2p-1}
\]
より
\[
\breve{\pi} = \frac{\hat{\theta} – (1-p)}{2p-1}
= \frac{\hat{\theta} – \frac{1}{3}}{\frac{1}{3}}
= 3 \hat{\theta} – 1
\]
として与えられる。
だが、$\pi$は$0\le \pi \le 1$であることに注意する必要がある。
$\breve{\pi} < 0$となるとき、つまり
\[
3 \hat{\theta} – 1 < 0 \implies \hat{\theta} < \frac{1}{3}
\]
のときは$\breve{\pi} = 0$とする。
また、$\breve{\pi} > 1$となるとき、つまり
\[
3 \hat{\theta} – 1 > 1 \implies \hat{\theta} > \frac{2}{3}
\]
のときは$\breve{\pi} = 1$とする。
以上、まとめると
\[
\breve{\pi} =
\begin{cases}
0 & \hat{\theta} < \frac{1}{3} \\
3 \hat{\theta} – 1 & \frac{1}{3} \le \hat{\theta} \le \frac{2}{3} \\
1 & \hat{\theta} > \frac{2}{3}
\end{cases}
\]
となる。または$\hat{\theta} = \frac{m}{n}$として
\[
\hat{\pi} =
\begin{cases}
0 & m < \frac{1}{3}n \\
3 \frac{m}{n} – 1 & \frac{1}{3}n \le m \le \frac{2}{3}n \\
1 & m > \frac{2}{3}n
\end{cases}
\]

[5]

ここでは推定量の分散に注目する。
$\breve{\pi}$の分散は、$m$は二項分布$B(n, \theta)$に従っていることと
\[
\breve{\pi} = \frac{\hat{\theta} – (1-p)}{2p-1}
\]
より、次のように与えられる。
\[
\textrm{V} (\breve{\pi}) = \frac{1}{(2p-1)^2} \cdot \frac{\theta (1-\theta)}{n}
\]
これより、$p$が$\frac{1}{2}$に近づくと分散が大きくなることがわかる。
これは、回答がどちらの質問に対するものか判別しづらくなるためである。
そのため、$0<p<\frac{1}{2}$または$\frac{1}{2}<p<1$のようにどちらか質問によった方が分散は小さくすることができるが、これは真の値$\pi$によって依存しているので現状ではわからない。