ってことにしておいてくださいw
寝まくりな一日。
情報理論で一日をつぶす。
ランレングスハフマンで検索したらこりゃまたかなりいいページが出てきたのでご参考にさせていただく。
秋山に聞いたら、どうやら画像処理のレポートでランレングス自体はやっているらしい…
まったく覚えてないYO!ヽ(`Д´)ノ あはは・・今理解したから許してくれよ。
FAXなどに用いられているっていうのはいい情報だった。
簡単に説明すると、FAXやプリントにおいて12を書くと
白白黒白白白黒黒白白白
白黒黒白白黒白白黒白白
白白黒白白白白黒白白白
白白黒白白白黒白白白白
白黒黒黒白黒黒黒黒白白
の情報を送らなければいけない。
圧倒的に「白」の情報が多いので、何とかして送信情報を少なくするために
白白黒白白白黒黒白白白 を 白2黒白3黒2白3のようにして送信するための方法。
さらに、符号をいくつまとめで切るかなどの考え方があって、それによって符号長が変わってくる。
白の重複を最大3つで取ると、白白白 白白黒 白黒 黒の4つしか組み合わせはなく、4つですべてが表すことができる。
白の出る確率が0.8、黒の出る確率が0.2だとすると、
白白白=0.512
白白黒=0.128
白黒=0.16
黒=0.2 合計1。
ハフマン符号化すると
白白白 1
白白黒 010
白黒 011
黒 00
と書ける。
これで上の12を表すとすると、
010100001
01100100101
01010111
01010011
01100000110000001
とかける。
白黒だけで表した場合は11×5=55bitの情報が必要だったのに対して
53bitの情報で済んだ… ってあんまり変わらないww
2文字でこの違いだから、1000文字になると1000bitの違いになってくる。
画像圧縮のしくみはこのようになっているのだ。
ハフマン符号>ランレングスハフマン符号>エントロピーの順に符号長が短くなっていくらしい。
で、平均語調を導出してみたのはいいが、上のような結果にならない…
計算ミスor計算方法間違い?明日の課題です。