対数正規分布 (log-normal distribution) の可視化

0よりも大きい値しかとらない確率変数*1について、その事前分布を設定するときに、対数正規分布 (log-normal distribution) を用いることがある。

定義

対数正規分布とは、ある確率変数  x について、その対数  \log x の分布が正規分布に従うような分布のことである。以下の確率密度関数を持つ。

\displaystyle
\mathcal{LN}(x \mid \mu, \sigma^{2} ) = \frac{1}{x} \cdot \frac{1}{\sqrt{2 \pi \sigma^{2}}} \cdot \exp \left\{ - \frac{ ( \log x - \mu )^{2} }{2 \sigma^{2} } \right\}

ただし、  x \in \mathbb{R}_{> 0}, \mu \in \mathbb{R}, \sigma \in \mathbb{R}_{> 0} である。

性質

以下の性質を持つ。

  • meanは  \exp(\mu + \sigma^{2} / 2) で表される。
  • medianは  \exp(\mu) で表される
  • modeは  \exp(\mu - \sigma^{2}) で表される

直感的には、  \sigma^{2} が比較的小さいとき、mean、median、modeはいずれも  \exp(\mu) に近くなり、これを中心とした左右対称に近い分布になっていると思われる。逆に  \sigma^{2} を大きくしていくと、mean(つまり重心)は  \exp(\mu) よりも大きい方にずれ、mode(つまり最大をとる値)は  \exp(\mu) よりも小さい方にずれていく。

可視化

対数正規分布の形は少し想像が難しい。以下に可視化例を示す。

f:id:yuki-koyama:20190728094015p:plain
対数正規分布 (log-normal distribution) の可視化(  \mu を固定)

f:id:yuki-koyama:20190728094242p:plain
対数正規分布 (log-normal distribution) の可視化(  \sigma^{2} を固定)

以下に可視化に用いたPythonコードを示す。

おまけ:対数正規分布の対数

MAP推定などの統計的推定では、計算上対象とする分布の対数を扱うことが多い。対数正規分布の対数をとったものは

\displaystyle
\log \left\{ \mathcal{LN}(x \mid \mu, \sigma^{2} ) \right\} = - \log x - \frac{1}{2} \log(2 \pi \sigma^{2}) - \frac{ (\log x - \mu)^{2} }{2 \sigma^{2}}

となり、その微分

\displaystyle
\frac{d}{dx} \log \left\{ \mathcal{LN}(x \mid \mu, \sigma^{2} ) \right\} = - \frac{1}{x} \left(1 + \frac{\log x - \mu}{\sigma^{2}} \right)

となる。

*1:例えば分散  \sigma^{2} を確率変数とみなして統計的推定を行う場合など。