編碼方案
數據壓縮過程稱為編碼
數據解壓過程稱為解碼
給定的字符集C
(
等長編碼方案將給定字符集C中每個字符的碼長定為[lg|C|]
【例】設待壓縮的數據文件共有
示六個字符
(
變長編碼方案將頻度高的字符編碼設置短
【例】設待壓縮的數據文件共有
(簡稱頻度)見表
表
字符 a b c d e f
頻度(單位
定長編碼
變長編碼
根據計算公式
(
整個文件被編碼為
注意
變長編碼可能使解碼產生二義性
【例】設E
對字符集進行編碼時
注意
等長編碼是前綴碼
平均碼長或文件總長最小的前綴編碼稱為最優的前綴碼
其中
p i 為第i個字符得概率
l i 為碼長
【例】若將表
求得的平均碼長為
From:http://tw.wingwit.com/Article/program/sjjg/201311/23863.html