本記事は、2022年に実施された統計検定1級・統計応用・社会科学の問2について、投稿者による解答例と解説を掲載しています。
統計検定の問題は、実施団体が定める「統計検定の問題の使用に関する規約」により、当サイトでは掲載いたしません。出題の正確な内容や公式の解答は公式問題集等をご参照ください。
記載内容は投稿者個人の見解であり、一般財団法人統計質保証推進協会および日本統計学会の公式見解・公式解答ではありません。
統計検定®は一般財団法人統計質保証推進協会の登録商標です。
解答
[1]
$D=Y-X$において、$X \sim N(\mu_X, \sigma_X^2)$、$Y \sim N(\mu_Y, \sigma_Y^2)$より$D$も正規分布となる。このとき、$D$の期待値と分散は
\begin{align*}
\E[D] &= \E[Y] – \E[X] = \mu_Y – \mu_X = 120-120=0 \\
\textrm{V} [D] &= \textrm{V}[Y] + \textrm{V}[X] -2\textrm{Cov}(X, Y) \\
&= \sigma_Y^2 + \sigma_Y^2 -2\sigma_{XY} \\
&= \sigma_Y^2 + \sigma_Y^2 -2\rho_{XY} \sigma_X \sigma_Y \\
&= 12^2 + 12^2 – 2 \times 0.75 \times 12^2 = 72
\end{align*}
となるので、$D \sim N(0, 72)$。
これより、$P(D \le -4)$は$Z \sim N(0, 1)$とすると
\[
P(D \le -4) =
P\left( \frac{D-0}{\sqrt{72}} \le \frac{-4-0}{\sqrt{72}} \right) =
P\left( Z \le – \frac{\sqrt{2}}{3} \right) = 0.3187
\]
[2]
$X$、$Y$が正規分布に従うとき、$X=x$を与えたもとでの$Y$の条件付き分布は
\[
Y|X=x \sim
N\left( \mu_Y – \frac{\sigma_{XY}}{\sigma_X^2} (\mu_X – x),
\sigma_Y^2 – \frac{\sigma_{XY}^2}{\sigma_X^2}
\right)
\]
となることが知れている。これより、$\sigma_{XY} = \rho_{XY} \sigma_X \sigma_Y$として計算すると
\begin{align*}
\E[Y|X=132] &=
120 – \frac{0.75 \times 12^2}{12^2} (120 -132) = 120 + 0.75\times 12 =129
\\
\textrm{V}[Y|X=132] &=
12^2 – \frac{0.75^2 \times 12^2 \times12^2}{12^2} =
12^2 \left( 1 – \frac{9}{16} \right) = 63
\end{align*}
をえる。
また平均への回帰とは、1回目の測定値132と平均120との差は12だが、2回目の条件付き期待値129と平均120との差は9となり、1回目の測定値より2回目の条件付き期待値の方が平均に近づくことを平均への回帰という。
これより、2回目の測定値128において1回目の測定値132からの下降分4のうち、129までの3が平均への回帰分とみなすことができる。
[3]
$X = \theta + \varepsilon_1$、$Y = \theta + \varepsilon_2$より
\begin{align*}
\textrm{V}[X] &= \textrm{V}[\theta] + \textrm{V}[\varepsilon_1] = \tau^2 + \psi^2
\\
\textrm{V}[Y] &= \textrm{V}[\theta] + \textrm{V}[\varepsilon_2] = \tau^2 + \psi^2
\\
\textrm{Cov}(X, Y) &= \textrm{Cov}(\theta + \varepsilon_1, \theta + \varepsilon_2)
\\
&=
\textrm{V}[\theta] = \tau^2
\end{align*}
となる。ここで、$\textrm{V}[X] = \textrm{V}[Y] = 12^2$、$\textrm{Cov}(X, Y) = 0.75 \times 12^2$より、まず$\tau^2 = \textrm{Cov}(X, Y) = 0.75 \times 12^2 = 108$となり、$\psi^2 = \textrm{V}[X] – \tau^2 = 12^2 – 108 = 36$をえる。
[4]
ここで、$X$と$\theta$の共分散は
\[
\textrm{Cov}(X, \theta) = \textrm{Cov}(\theta + \varepsilon_1, \theta) =
\textrm{V}[\theta] = \tau^2
\]
より、$X$と$\theta$の同時分布は
\[
\left( \begin{array}{c}
X \\ \theta
\end{array} \right)
\sim N\left(
\left( \begin{array}{c}
\mu \\ \mu
\end{array} \right),
\left( \begin{array}{cc}
\tau^2 + \psi^2 & \tau^2 \\
\tau^2 & \tau^2
\end{array} \right)
\right)
\]
となる。これより、条件付き期待値および条件付き分散は次のように計算できる。
\begin{align*}
\E[\theta | X=132] &=
\mu – \frac{\tau^2}{\tau^2 + \psi^2} (\mu – 132)
\\
&=
120 – \frac{0.75 \times 12^2}{12^2} (120-132) = 129
\\
\textrm{V}[\theta | X=132] &=
\tau^2 – \frac{\tau^4}{\tau^2 + \psi^2}
\\
&=
0.75 \times 12^2 – 0.75^2 \times 12^2 = 27
\end{align*}
[5]
$X=132$をもとでの$Y = \theta + \varepsilon_2$の分布は、まず$\theta$が[4]より
\[
\theta | X=132 \sim N(129, 27)
\]
となり、次に$\varepsilon_2$はこれは$\theta$、$\varepsilon_1$と互いに独立より$X$とも独立となり、$X=132$の条件を与えても分布は変わらないので
\[
\varepsilon_2 \sim N(0, 36)
\]
以上より、
\[
Y | X=132 \sim N(129, 63)
\]
この結果から、平均への回帰現象つまり1回目の測定値を与えた条件付き期待値が平均に近くづく理由は、1回目の測定値$X=x$が$\theta$の分布に影響を与え、$X=x$を与えたもとでの$\theta$の条件付き分布は$x$よりも$\mu$に近い平均をもつためである。
また、求める確率は$Z \sim N(0, 1)$とすると
\begin{align*}
P ( Y \le 128 | X=132 ) &=
P\left( \frac{Y-129}{\sqrt{63}} \le \frac{128-129}{\sqrt{63}}
\biggm| X=132 \right)
\\
&= P\left( Z \le \frac{-1}{\sqrt{63}} \right) = 0.4499
\end{align*}
