第9回 通信路容量

オンデマンドで受講する場合は、本題に入る前に必ず連絡の動画を見てください。

通信路を通る情報の量

概要

動画の解説を参照

情報源事象系 (入力の値「0」「1」を事象とする事象系) \(X\) と、出力の値「0」「1」を事象とする事象系 \(Y\) があるとき、通信路で変化が起こると、 \(X\) と \(Y\) は異なったものになり、それぞれのエントロピーは図のように表されます。

このうちの重なり部分、つまり相互情報量が「実質的に通信路を通った情報の量」です。
これが多ければ通信路をたくさんの情報が通れる、つまり通信路の性能が良いことになります。

ちなみに、
左の三日月 \(H(X|Y)\) は「出力について知っていても入力についてわからないこと」→「通信路を通れなかった情報の量」
右の三日月 \(H(Y|X)\) は「入力について知っていても出力についてわからないこと」→「変化してできたゴミ情報の量」
です。

相互情報量の値は、「情報源事象系 \(X\) で 0, 1 が発生する確率」と「通信路で変化が起こる確率」の両方に依存します。
一般的な通信路で考えると複雑になりすぎるので、2元対称通信路
\(\boldsymbol{T} = \begin{bmatrix}1-p & p \\ p & 1-p\end{bmatrix}\)
と、以下の確率で 0, 1 が発生する情報源事象系で考えてみましょう。
\(\boldsymbol{p}_x = \begin{bmatrix}\alpha \\ 1-\alpha\end{bmatrix}\)
前回やったように、出力が 0, 1 になる確率は以下のように求められます。
\(\boldsymbol{p}_y=\boldsymbol{T}^T\boldsymbol{p}_x\) \(= \begin{bmatrix}1-p & p \\ p & 1-p\end{bmatrix} \begin{bmatrix}\alpha \\ 1-\alpha\end{bmatrix}\) \(= \begin{bmatrix}(1-p)\alpha +p(1-\alpha)\\ p\alpha+(1-p)(1-\alpha)\end{bmatrix}\)
このあとの計算でこの長い式を書くのは面倒なので \(\alpha, p\) の関数として
\(f\equiv (1-p)\alpha +p(1-\alpha)\)
を定義すると、それぞれのエントロピーは以下のようになります。
\(H(X)=-\alpha\log \alpha -(1-\alpha)\log(1-\alpha)\)・・・(1)
\(H(Y)=-f\log f -(1-f)\log(1-f)\)・・・(2)
さらに、 \(X\) と \(Y\) の結合事象系 \(XY\) は以下のようになります。
\( XY= \begin{bmatrix} x_0,y_0 & x_1,y_0 & x_0,y_1 & x_1,y_1 \\ \alpha(1-p) & (1-\alpha)p & \alpha p & (1-\alpha)(1-p) \end{bmatrix} \)
このエントロピーは
\(H(XY)\)
\(=-\alpha(1-p)\log\{\alpha(1-p)\}\) \(-(1-\alpha)p\log\{(1-\alpha)p\}\) \(-\alpha p\log(\alpha p)\) \(-(1-\alpha)(1-p)\log\{(1-\alpha)(1-p)\}\)
\(=-\alpha\log\alpha\) \(-(1-\alpha)\log(1-\alpha)\) \(-p\log p\) \(-(1-p)\log(1-p)\)・・・(3)
となります。ここで第4回の (5) の関係式を使い、(3) 式右辺の第1, 2項が (1) 式の右辺と一致することを考えれば
\(I(X, Y)\)
\(= H(X)+H(Y)-H(XY)\)
\(=-f\log f -(1-f)\log(1-f)\) \(+p\log p+(1-p)\log(1-p)\)・・・(4)
が得られます。

課題1

※ 準備 : 学籍番号を入れて「入力」をクリック (タップ) してください。


概要の例で、\(\alpha\) = , \(p\) = の場合の入力・出力の相互情報量 \(I(X, Y)\) を求めてください。
結果は四捨五入して小数第2位までにしてください。
課題1解説

課題2

概要の例で、\(\alpha\) = , \(p\) = の場合の入力・出力の相互情報量 \(I(X, Y)\) を求めてください。
結果は四捨五入して小数第2位までにしてください。
課題2解説
同じ通信路でも入力の 0, 1 の発生する確率が近い方が \(H(X)\) が大きくなるため、\(I(X, Y)\) も大きくなる傾向があります。
※ 動画中では最後の答えを「0.72 (bit)」としていますが、正しくは「0.73 (bit)」です。

通信路容量

概要

動画の解説を参照

課題1, 2で見たように、通信路を通る情報の量 \(I(X, Y)\) は「通信路の性質(上の例では \(p\))」「入れてやる情報の性質(上の例では \(\alpha\))」の両方に左右されるため、通信路の性能を表わす指標としては使いにくいです。
そこで、入力する情報の性質をいろいろ変えて、\(I(X, Y)\) が最大になるときの値を指標として使います。これを通信路容量と呼び、文字 \(C\) で表します。

そのためには、実際に最大になる条件を求める必要があります。(4)式の4つの項のうち、第3, 4項は \(p\) だけできまります。第1, 2項の和は、それらがちょうど同じ値になったとき、つまり
\(f=1/2\)
になったときに最大になります (その理由は(4)式を \(\alpha\) で偏微分すればわかりますが、ここでは省略します。興味のある人はこちらを参照)。
このときの \(I(X, Y)\) の値、つまり通信路容量は以下のようになります。
\(C\) \(=-\frac{1}{2}\log\frac{1}{2}\) \(-\frac{1}{2}\log\frac{1}{2}\) \(+p\log p+(1-p)\log(1-p)\)
\(=1+p\log p+(1-p)\log(1-p)\)・・・(5)

課題3

\(p\) = の場合の通信路容量 \(C\) を求めてください。
結果は四捨五入して小数第2位までにしてください。
課題3解説
定義上、課題1, 2の結果よりも大きい値になるはずです。

課題

課題解答