我想总结而不是以类似的方式压缩运行长度编码,但是在嵌套意义上.
例如,我想:ABCBCABCBCDEEF成为:(2A(2BC))D(2E)F
我并不担心在两个相同的可能嵌套之间选择一个选项
ABBABBABBABA可以是(3ABB)ABA或A(3BBA)BA,它们具有相同的压缩长度,尽管具有不同的结构.
但是我确实希望选择最贪婪.例如:
ABCDABCDCDCDCD将选择(2ABCD)(3CD) - 原始符号中长度为6的小于ABCDAB(4CD),其在原始符号中长度为8.
在背景方面,我有一些重复的模式,我想总结一下.这样数据就更容易消化了.我不想破坏数据的逻辑顺序,因为它很重要.但是我想总结它,通过说,符号A次出现3次,其次是符号XYZ 20次出现等等,这可以用嵌套的方式在视觉上显示.
欢迎的想法.