動画の解説を参照
情報源事象系 (入力の値「0」「1」を事象とする事象系) \(X\) と、出力の値「0」「1」を事象とする事象系 \(Y\) があるとき、通信路で変化が起こると、
\(X\) と \(Y\) は異なったものになり、それぞれのエントロピーは図のように表されます。
このうちの重なり部分、つまり相互情報量が「実質的に通信路を通った情報の量」です。
これが多ければ通信路をたくさんの情報が通れる、つまり通信路の性能が良いことになります。
ちなみに、
左の三日月 \(H(X|Y)\) は「出力について知っていても入力についてわからないこと」→「通信路を通れなかった情報の量」
右の三日月 \(H(Y|X)\) は「入力について知っていても出力についてわからないこと」→「変化してできたゴミ情報の量」
です。
相互情報量の値は、「情報源事象系 \(X\) で 0, 1 が発生する確率」と「通信路で変化が起こる確率」の両方に依存します。
一般的な通信路で考えると複雑になりすぎるので、2元対称通信路
\(\boldsymbol{T} = \begin{bmatrix}1-p & p \\ p & 1-p\end{bmatrix}\)
と、以下の確率で 0, 1 が発生する情報源事象系で考えてみましょう。
\(\boldsymbol{p}_x = \begin{bmatrix}\alpha \\ 1-\alpha\end{bmatrix}\)
前回やったように、出力が 0, 1 になる確率は以下のように求められます。
\(\boldsymbol{p}_y=\boldsymbol{T}^T\boldsymbol{p}_x\)
\(= \begin{bmatrix}1-p & p \\ p & 1-p\end{bmatrix} \begin{bmatrix}\alpha \\ 1-\alpha\end{bmatrix}\)
\(= \begin{bmatrix}(1-p)\alpha +p(1-\alpha)\\ p\alpha+(1-p)(1-\alpha)\end{bmatrix}\)
このあとの計算でこの長い式を書くのは面倒なので \(\alpha, p\) の関数として
\(f\equiv (1-p)\alpha +p(1-\alpha)\)
を定義すると、それぞれのエントロピーは以下のようになります。
\(H(X)=-\alpha\log \alpha -(1-\alpha)\log(1-\alpha)\)・・・(1)
\(H(Y)=-f\log f -(1-f)\log(1-f)\)・・・(2)
さらに、 \(X\) と \(Y\) の結合事象系 \(XY\) は以下のようになります。
\(
XY=
\begin{bmatrix}
x_0,y_0 & x_1,y_0 & x_0,y_1 & x_1,y_1 \\
\alpha(1-p) & (1-\alpha)p & \alpha p & (1-\alpha)(1-p)
\end{bmatrix}
\)
このエントロピーは
\(H(XY)\)
\(=-\alpha(1-p)\log\{\alpha(1-p)\}\)
\(-(1-\alpha)p\log\{(1-\alpha)p\}\)
\(-\alpha p\log(\alpha p)\)
\(-(1-\alpha)(1-p)\log\{(1-\alpha)(1-p)\}\)
\(=-\alpha\log\alpha\)
\(-(1-\alpha)\log(1-\alpha)\)
\(-p\log p\)
\(-(1-p)\log(1-p)\)・・・(3)
となります。ここで第4回の (5) の関係式を使い、(3) 式右辺の第1, 2項が (1) 式の右辺と一致することを考えれば
\(I(X, Y)\)
\(= H(X)+H(Y)-H(XY)\)
\(=-f\log f -(1-f)\log(1-f)\)
\(+p\log p+(1-p)\log(1-p)\)・・・(4)
が得られます。
※ 準備 : 学籍番号を入れて「入力」をクリック (タップ) してください。
概要の例で、\(\alpha\) =
, \(p\) =
の場合の入力・出力の相互情報量 \(I(X, Y)\)
を求めてください。
結果は四捨五入して小数第2位までにしてください。
課題1解説
概要の例で、\(\alpha\) =
, \(p\) =
の場合の入力・出力の相互情報量 \(I(X, Y)\)
を求めてください。
結果は四捨五入して小数第2位までにしてください。
課題2解説
同じ通信路でも入力の 0, 1 の発生する確率が近い方が \(H(X)\) が大きくなるため、\(I(X, Y)\) も大きくなる傾向があります。
※ 動画中では最後の答えを「0.72 (bit)」としていますが、正しくは「0.73 (bit)」です。
動画の解説を参照
課題1, 2で見たように、通信路を通る情報の量 \(I(X, Y)\) は「通信路の性質(上の例では \(p\))」「入れてやる情報の性質(上の例では
\(\alpha\))」の両方に左右されるため、通信路の性能を表わす指標としては使いにくいです。
そこで、入力する情報の性質をいろいろ変えて、\(I(X, Y)\) が最大になるときの値を指標として使います。これを
通信路容量と呼び、文字 \(C\) で表します。
そのためには、実際に最大になる条件を求める必要があります。(4)式の4つの項のうち、第3, 4項は \(p\) だけできまります。第1, 2項の和は、それらがちょうど同じ値になったとき、つまり
\(f=1/2\)
になったときに最大になります (その理由は(4)式を \(\alpha\) で偏微分すればわかりますが、ここでは省略します。興味のある人は
こちらを参照)。
このときの \(I(X, Y)\) の値、つまり通信路容量は以下のようになります。
\(C\)
\(=-\frac{1}{2}\log\frac{1}{2}\)
\(-\frac{1}{2}\log\frac{1}{2}\)
\(+p\log p+(1-p)\log(1-p)\)
\(=1+p\log p+(1-p)\log(1-p)\)・・・(5)
\(p\) =
の場合の通信路容量 \(C\) を求めてください。
結果は四捨五入して小数第2位までにしてください。
課題3解説
定義上、課題1, 2の結果よりも大きい値になるはずです。