【統計検定1級】統計応用・社会科学 2025年 問2【解答】

本記事は、2025年に実施された統計検定1級・統計応用・社会科学の問2について、投稿者による解答例と解説を掲載しています。
統計検定の問題は、実施団体が定める「統計検定の問題の使用に関する規約」により、当サイトでは掲載いたしません。出題の正確な内容や公式の解答は公式問題集等をご参照ください。
記載内容は投稿者個人の見解であり、一般財団法人統計質保証推進協会および日本統計学会の公式見解・公式解答ではありません。
統計検定®は一般財団法人統計質保証推進協会の登録商標です。

解答

[1]

$n$個の独立な観測値$y_1, \dots, y_n$が得られたときの尤度関数 $L(\lambda)$ は以下のように表される。
\[
L(\lambda) =
\prod_{i=1}^n \frac{\lambda^{y_i} e^{-\lambda}}{y_i!} =
\frac{\lambda^{\sum_{i=1}^n y_i} e^{-n\lambda}}{\prod_{i=1}^n y_i!}
\]
これに対数をとった対数尤度関数$l(\lambda) = \log L(\lambda)$にすると
\[
l(\lambda) =
\left(\sum_{i=1}^n y_i\right) \log \lambda – n\lambda – \sum_{i=1}^n \log(y_i!)
\]
これを$\lambda$で微分し、0として解くと
\begin{align*}
\frac{d l}{d \lambda} = \frac{\sum_{i=1}^n y_i}{\lambda} – n &= 0 \\
\lambda &= \frac{1}{n}\sum_{i=1}^n y_i = \bar{y}
\end{align*}
となり、これより最尤推定量は$\hat{\lambda}$は
\[
\hat{\lambda} = \bar{y}
\]
また表1より、$n = 30$、合計日数 $\sum_{i=1}^n y_i = 21$である。
これより、
\[
\hat{\lambda} = \frac{21}{30} = 0.7
\]

[2]

確率関数$p(y)$が単調減少である条件は、$y=0, 1, 2, \ldots, $において$p(y) > p(y+1)$ が成り立つことである。
これより
\begin{align*}
p(y) &> p(y+1) \\
\frac{\lambda^y e^{-\lambda}}{y!} &>
\frac{\lambda^{y+1} e^{-\lambda}}{(y+1)!} \\
\frac{\lambda^y}{\lambda^{y+1}} &> \frac{y!}{(y+1)!} \\
\frac{1}{\lambda} &> \frac{1}{y+1} \\
y+1 &> \lambda \\
\lambda &< y+1
\end{align*}
となる。
これが$y=0, 1, 2, \ldots, $で成り立つためには、最小の$y=0$のときにこの不等式をみたせばよい。
これより、$\lambda < 1$のとき、確率関数$p(y)$が単調減少である。

[3]

このとき、$Y \ge 1$のもとでの条件付き確率関数において、全確率の和は1となるので次をみたす。
\[
\sum_{y=1}^{\infty} P(Y=y \mid Y \ge 1) =
C(\tau) \sum_{y=1}^{\infty} \frac{\tau^y e^{-\tau}}{y!} = 1
\]
ここで、総和記号$\sum_{y=1}^{\infty}$のなかはパラメータ$\tau$のポアソン分布の確率関数なので次のように変形できる。
\[
\sum_{y=1}^{\infty} \frac{\tau^y e^{-\tau}}{y!} =
\sum_{y=0}^{\infty} \frac{\tau^y e^{-\tau}}{y!} – \frac{\tau^0 e^{-\tau}}{0!} =
1 – e^{-\tau}
\]
これより、
\begin{align*}
C(\tau) \sum_{y=1}^{\infty} \frac{\tau^y e^{-\tau}}{y!} &= 1 \\
C(\tau) (1 – e^{-\tau}) &= 1 \\
C(\tau) &= \frac{1}{1 – e^{-\tau}}
\end{align*}
となる。
また、単調減少になる条件は[2]と同様にして
\begin{align*}
P(Y=y | Y \ge 1) &> P(Y=y+1 | Y \ge 1) \\
C(\tau) \frac{\tau^y e^{-\tau}}{y!} &>
C(\tau) \frac{\tau^{y+1} e^{-\tau}}{(y+1)!} \\
\frac{\tau^y}{\tau^{y+1}} &> \frac{y!}{(y+1)!} \\
\frac{1}{\tau} &> \frac{1}{y+1} \\
y+1 &> \tau \\
\tau &< y+1
\end{align*}
となる。
これが$y=1, 2, \ldots, $で成り立つためには、最小の$y=1$のときにこの不等式をみたせばよい。
これより、$\tau < 2$のとき、単調減少となる。

[4]

$Y$の条件付き期待値$\E[Y|Y\ge 1]$は
\begin{align*}
\E[Y | Y \ge 1] &=
\sum_{y=1}^{\infty} y C(\tau) \frac{\tau^y e^{-\tau}}{y!}
\\
&= C(\tau) e^{-\tau} \sum_{y=1}^{\infty} \frac{\tau^y}{(y-1)!}
\\
&= C(\tau) e^{-\tau} \tau \sum_{y=1}^{\infty} \frac{\tau^{y-1}}{(y-1)!}
\end{align*}
ここで、$e^x$のマクローリン展開が
\[
e^x = \sum_{n=0}^{\infty} \frac{x^n}{n!}
\]
より、
\[
\sum_{y=1}^{\infty} \frac{\tau^{y-1}}{(y-1)!} =
\sum_{y=0}^{\infty} \frac{\tau^{y}}{y!} = e^{\tau}
\]
となる。
よって、
\[
\E[Y | Y \ge 1]
= C(\tau) e^{-\tau} \tau \sum_{y=1}^{\infty} \frac{\tau^{y-1}}{(y-1)!}
= \frac{\tau}{1-e^{-\tau}}
\]
をえる。

[5]

ここで$y_1, \ldots, y_m$が$P(Y | Y \ge 1)$で表される分布からの独立な$m$個の観測地とする。
これらが得られたときの尤度関数 $L(\tau)$ は以下のように表される。
\[
L(\lambda) =
\prod_{i=1}^m C(\tau) \frac{\tau^{y_i} e^{-\tau}}{y_i!} =
\frac{1}{(1-e^{-\tau})^m}
\frac{\tau^{\sum_{i=1}^m y_i} e^{-m\tau}}{\prod_{i=1}^m y_i!}
\]
これに対数をとった対数尤度関数$l(\tau) = \log L(\tau)$にすると
\[
l(\tau) = -m \log (1-e^{-\tau}) +
\left(\sum_{i=1}^m y_i\right) \log \tau – m\tau – \sum_{i=1}^m \log(y_i!)
\]
これを$\tau$で微分し、0として解くと
\begin{align*}
\frac{d l}{d \tau} =
m \frac{e^{-\tau}}{1-e^{-\tau}} + \frac{\sum_{i=1}^m y_i}{\tau} – m &= 0 \\
\frac{\sum_{i=1}^m y_i}{\tau} &= m – m\frac{e^{-\tau}}{1-e^{-\tau}} \\
\frac{1}{m} \sum_{i=1}^m y_i &=
\tau \left( 1 – \frac{e^{-\tau}}{1-e^{-\tau}} \right) \\
\bar{y} &= \frac{\tau}{1-e^{-\tau}}
\end{align*}
となり、これより最尤推定量は$\hat{\tau}$は次をみたす。
\[
\bar{y} = \frac{\hat{\tau}}{1-e^{-\hat{\tau}}}
\]
これより、$g(\hat{\tau}) = \frac{\hat{\tau}}{1-e^{-\hat{\tau}}}$である。
では、次に$\hat{\tau}$を求めるアルゴリズムを示す。
ここでは、ニュートン・ラプソン法を使って求める方法を考える。
$f(\tau) = \frac{\tau}{1-e^{-\tau}} – \bar{y}$として$f(\tau) = 0$を解くために、ニュートン・ラプソン法を用いる。このとき、
\[
\tau_{k+1} = \tau_{k} – \frac{f(\tau_{k})}{f'(\tau_{k})}
\]
として求めることができる。
具体的には
\[
f'(\tau) = \frac{1-e^{-\tau} – \tau e^{-\tau}}{(1-e^{-\tau})^2}
= \frac{1-(1+\tau) e^{-\tau}}{(1-e^{-\tau})^2}
\]
より、
\[
\tau_{k+1} = \tau_{k} –
\frac{\tau (1-e^{-\tau}) – \bar{y} (1-e^{-\tau})^2}{1-(1+\tau) e^{-\tau}}
\]
を得る。
このとき、$\tau_0$として(1)で求めた値を使い行ってみると
\[
\tau_0 = 0.7, ~~
\tau_1 = 0.7154, ~~
\tau_2 = 0.7154, ~~
\tau_3 = 0.7154, ~~
\cdots
\]
となり、$\hat{\tau} = 0.7154$に収束することがわかる。

また、公開されている解答では不動点反復法によって求めている。
不動点反復法は次のように与えられる。
\begin{align*}
\bar{y} &= \frac{\tau}{1-e^{-\tau}} \\
\tau &= \bar{y} (1-e^{-\tau})
\end{align*}
と変形して
\[
\tau_{k+1} = \bar{y} (1-e^{-\tau_k})
\]
として求める。
このとき、$\tau_0$として(1)で求めた値を使い行ってみると
\[
\tau_0 = 0.7, ~~
\tau_1 = 0.70478, ~~ \cdots, ~~
\tau_{19} = 0.7154, ~~
\cdots
\]
となり、$\hat{\tau} = 0.7154$に収束することがわかる。

このとき、それぞれのアルゴリズムが収束する理由を考える。
まず、そもそも$\bar{y} = g(\hat{\tau})$をみたす$\hat{\tau}$はただ1つ存在する。
なぜならば、$Y|Y\ge1$の確率分布は指数型分布族であり、その性質より次のことが知られている。
\[
g'(\tau) = \frac{d}{d\tau} \E[Y|Y\ge 1] = \textrm{V}(Y|Y\ge 1) \ge 0
\]
これより、$g(\tau)$は単調増加関数であり、また
\begin{align*}
& \tau \to 0 \textrm{のとき} g(\tau) \to 1 \\
& \tau \to \infty \textrm{のとき} g(\tau) \to \infty \\
\end{align*}
であることがわかる。
ここで、$\bar{y}$は$Y|Y\ge 1$のもとでの標本平均なので$\bar{y} \ge 1$となる。
これより、$\bar{y} \ge 1$であり、$g(\tau)$は単調増加関数で$0 \le g(\tau) \le \infty$より、$\bar{y} = g(\hat{\tau})$をみたす$\hat{\tau}$はただ1つ存在することがわかる。

次に、ニュートン・ラプソン法が収束する理由は、$Y|Y\ge1$の確率分布は指数型分布族であり、いま求める方程式$\bar{y} = g(\hat{\tau})$は対数尤度関数の導関数$l’ (\tau)=0$である。このとき、指数型分布族の性質より対数尤度関数の2階微分$l”(\tau) < 0$となることが知られている。これより、対数尤度関数$l(\tau)$は上に凸な関数であることがわかり、上に凸な関数な傾きが0となる点を求めるときニュートン・ラプソン法は大域的最適解に向かうことが知られている。これらより、ニュートン・ラプソン法によって解が求められる。

また、不動点反復法は縮小写像の原理により収束が保証される。
実際、$\tau = \bar{y} (1-e^{-\tau})$において$h(\tau) = \bar{y} (1-e^{-\tau})$として、$h'(\tau) = \bar{y} e^{-\tau}$となり、ここで求めたい方程式の解は$\bar{y} = \frac{\tau}{1-e^{-\tau}}$より、これを$h'(\tau)$の$\bar{y}$に代入すると
\[
h'(\tau) = \frac{\tau}{1-e^{-\tau}} e^{-\tau} = \frac{\tau}{e^{\tau}-1}
\]
となる。ここで、$\tau>0$において$e^{\tau} < \tau + 1$が成り立つことを使うと$h'(\tau) < 1$となる。
よって、
\[
0 < h'(\tau) < 1
\]
となり、$h(\tau)$は解の付近で微分係数が1よりも小さくなる。
これより、$h(\tau)$は縮小写像であり、これから不動点反復法が収束することがわかる。

[6]

降雪0日の年は30年中15回あるので
\[
\hat{p} = \frac{15}{30} = \frac{1}{2} = 0.5
\]
また、ポアソン分布$P(\lambda)$のもとでの$P(Y=0)$の推定値と有意に異なるかをみるためには適合度検定によって調べることができる。
このとき、帰無仮説と対立仮説は次にようになる。
\[
H_0 : p = e^{-\lambda}, ~~
H_1 : p \neq e^{-\lambda}
\]
として、$\hat{p}=0.5$、$\hat{\lambda} =0.7$を用いて計算を行う。

これは問題では要求されていないが実際に適合度検定を行ってみると$\hat{p}=0.5$のもとでは降雪0日は15日、降雪1日以上は15日であり、$\hat{\lambda} =0.7$のポアソン分布では期待度数として降雪0日は$30\times e^{-0.7} = 14.90$、降雪1日以上は$30 – 30\times e^{-0.7} = 15.10$となる。これより検定統計量は
\[
T = \frac{(15 – 14.90)^2}{14.90} + \frac{(15 – 15.10)^2}{15.10} = 0.0014
\]
となり、自由度1のカイ二乗分布の上側5\%点$\chi^2_{0.05}(1) = 3.84$よりも小さいので有意水準5%で帰無仮説は棄却されないことがわかる。