我知道英语的Shannon熵是每个字母1.0到1.5位,有些人说每个字母低至0.6到1.3位但是我想知道有没有办法运行一个查看大量文本的算法然后确定集体文本的期望值是集体文本的每个字母的.08位?
algorithm text
algorithm ×1
text ×1