相关疑难解决方法(0)

撰写包含160位可恢复信息的合成英语短语

我有160位随机数据.

只是为了好玩,我想生成伪英语短语来"存储"这些信息.我希望能够从短语中恢复这些信息.

注意:这不是一个安全问题,我不在乎别人是否能够恢复信息甚至检测到它是否存在.

更好的短语的标准,从最重要到最不重要:

短
独特
自然的

目前的方法,建议在这里:

取三个1024个名词,动词和形容词列表(选择最受欢迎的名词).通过以下模式生成短语,为每个单词读取20位:

Noun verb adjective verb,
Noun verb adjective verb,
Noun verb adjective verb,
Noun verb adjective verb.

现在,这似乎是一个很好的方法,但这句话有点太长,有点太沉闷.

我在这里找到了一个单词集(部分语音数据库).

经过一些特别的过滤后,我计算出这个语料库大约含有

50690个可用的形容词
123585名词
15301动词
13010副词(不包含在模式中,但在答案中提到)

这让我可以使用

每个形容词16位(实际上是16.9,但我无法计算如何使用小数位)
每个名词15位
每个动词13位
每个副词13位

对于名词 - 动词 - 形容词 - 动词模式,这在短语中每个"句子"给出57位.这意味着,如果我将使用我可以从该语料库中获得的所有单词,我可以生成三个句子而不是四个(160 /57≈2.8).

Noun verb adjective verb,
Noun verb adjective verb,
Noun verb adjective verb.

还有点太长而且沉闷.

任何提示我如何改进它？

我看到我可以尝试:

尝试在编码之前以某种方式压缩我的数据.但由于数据是完全随机的,只有一些短语会更短(而且,我猜,不是很多).
改进短语模式,这样看起来会更好.
使用几种模式,使用短语中的第一个单词以某种方式指示将来解码使用的模式.(例如,使用最后一个字母甚至单词的长度.)根据数据的第一个字节选择模式.

......我对英语不是很好,可以提出更好的短语模式.有什么建议？

在模式中使用更多语言学.不同的时态等

......我想,我需要比现在更好的词语语料库.任何提示我可以在哪里得到合适的？

nlp steganography

Ale*_*ysh

2017 05-23

10
推荐指数

1
解决办法

441
查看次数

生成一个包含160位可恢复信息的伪诗

我有160位随机数据.

只是为了好玩,我想生成一个英文伪诗来"存储"这些信息.我希望能够从这首诗中恢复这些信息.(对于任何一种诗歌,这里的"诗"是一个含糊的术语.)

注意:这不是一个安全问题,我不在乎别人是否能够恢复信息甚至检测到它是否存在.

更好的诗的标准:

更好的aestetics
更好的押韵和脚
唯一性
更短的长度

我要说的是,可接受的诗不超过三行每节四行.(但另一种,既定的诗歌形式,如十四行诗也很好.)

我喜欢这个想法,但是,我担心,我对如何使用英语计算机生成的诗歌完全无能为力.(当我年轻的时候,我为俄罗斯编程了,但看起来这种体验对我来说无济于事.)

那么,有什么线索吗？

注意:我已经问了类似的问题.我想试试这两种方法.请注意好的诗歌标准与并行问题中的好词组有何不同.请记住,这只是"为了好玩".

另外,我必须注意到这一点:在某些相关问题上有一个RFC 1605.但它没有提出任何实施细节,所以对我来说这对我没有用,对不起.<G>

nlp steganography

Ale*_*ysh

2017 05-23

9
推荐指数

1
解决办法

345
查看次数

标签统计

nlp ×2

steganography ×2

撰写包含160位可恢复信息的合成英语短语

生成一个包含160位可恢复信息的伪诗

标签 统计

标签统计