使用localStorage进行javascript字符串压缩

inv*_*bob 20 javascript compression unicode base64 local-storage

localStorage在一个项目中使用,它需要存储大量的数据,主要是int,bool和string类型.我知道javascript字符串是unicode,但是当存储时localStorage,它们是否保持unicode?如果是这样,有没有办法压缩字符串以使用unicode字节中的所有数据,或者我应该只使用base64并减少压缩?所有数据都将存储为一个大字符串.

编辑:现在我考虑一下,base64根本不会做太多压缩,数据已经在64位,a-zA-Z0-9 ;:是65个字符.

Ore*_*ner 26

"当存储在localStorage中时,它们会保持unicode吗?"

Web存储工作草案定义为DOMString本地存储的值.DOMStrings被定义为使用UTF-16编码的16位单元序列.所以是的,他们保持Unicode.

有没有办法压缩字符串以使用unicode字节中的所有数据 ...

"Base32k"编码应该为每个字符提供15位.base32k类型编码利用UTF-16字符的全部16位,但丢失了一点以避免双字符跳闸.如果原始数据是base64编码的,则每个字符仅使用6位.将这6位编码到base32k中应该将其压缩到原始大小的6/15 = 40%.请参阅http://lists.xml.org/archives/xml-dev/200307/msg00505.htmlhttp://lists.xml.org/archives/xml-dev/200307/msg00507.html.

即使进一步的小型化,您可以将您的base64字符串解码成其完整的8位二进制,与一些已知的压缩算法压缩它们(例如见的gzip的JavaScript实现),然后base32k编码压缩输出.


小智 7

您可以编码为Base64,然后实现简单的无损压缩算法,例如游程编码或Golomb编码.这不应该太难做,可能会给你一点压力.

Golomb编码

我也找到了JsZip.我想你可以查看代码并只使用算法,如果它是兼容的.

希望这可以帮助.

http://jszip.stuartk.co.uk/


Mar*_*all 7

我最近不得不在localStorage中保存巨大的JSON对象.

首先,是的,他们确实保持unicode.但是,不要试图将对象直接保存到本地存储.它需要是一个字符串.

在将对象转换为字符串之前,我使用了一些压缩技术(在我的情况下看起来效果很好):

通过执行类似(+ num).toString(36)的操作,可以将任何数字从10的基数转换为36的基数.例如,数字48346942将是"ss8qm",即(包括引号)少1个字符.添加引号可能实际上会增加字符数.所以数字越大,收益越好.要将其转换回来,您可以执行类似parseInt("ss8qm",36)的操作.

如果要存储具有任何将重复的键的对象,则最好创建一个查找对象,在该对象中为原始项指定缩短的键.所以,举例来说,如果你有:

{
    name: 'Frank',
    age: 36,
    family: [{
        name: 'Luke',
        age: 14,
        relation: 'cousin'
    }, {
        name: 'Sarah',
        age: 22,
        relation: 'sister'
    }, {
        name: 'Trish',
        age: 31,
        relation: 'wife'
    }]
}
Run Code Online (Sandbox Code Playgroud)

然后你可以做到:

{
    // original w/ shortened keys
    o: {    
        n: 'Frank',
        a: 36,
        f: [{
            n: 'Luke',
            a: 14,
            r: 'cousin'
        }, {
            n: 'Sarah',
            a: 22,
            r: 'sister'
        }, {
            n: 'Trish',
            a: 31,
            r: 'wife'
        }]
    },

    // lookup
    l: {
        n: 'name',
        a: 'age',
        r: 'relation',
        f: 'family'
    }
}
Run Code Online (Sandbox Code Playgroud)

再次,这与尺寸有关.并重复.就我而言,它的效果非常好.但这取决于主题.

所有这些都需要一个缩小功能,一个需要扩展.

另外,我建议创建一个用于存储和检索本地存储数据的类.我跑到那里没有足够的空间.所以写入会失败.其他站点也可能写入本地存储,这可能会占用一些空间.有关详细信息,请参阅此帖子.

在我构建的课程中,我所做的是首先尝试使用给定的键删除任何项目.然后尝试setItem.这两行用try catch包裹.如果失败则假定存储已满.然后它会清除localStorage中的所有内容,以便为它腾出空间.然后,在清除之后,再次尝试setItem.这也包含在try catch中.因为如果字符串本身大于localStorage可以处理的字符串,它可能会失败.

编辑:此外,你会遇到很多人提到的LZW压缩.我实现了它,它适用于小字符串.但是对于大字符串,它会开始使用无效字符,从而导致数据损坏.所以要小心,如果你去那个方向测试测试