一条推文有多少字节的内存?

TIM*_*MEX 8 memory string

140个字符.它会占用多少内存?

我正在尝试计算我的EC2 Large实例Mongo DB可以容纳多少条推文.

Cha*_*les 9

Twitter 使用UTF-8编码的消息.

UTF-8代码点最长可达六个四个八位字节,最大消息大小为140 x 4 = 560个8位字节.

当然,这仅适用于原始消息,不包括存储开销,索引和其他与存储相关的填充.

e:Twitter成功让我发布消息:

™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™ ™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™ ™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™™

是的,那是140个商标符号,每个符号是UTF-8三个八位字节

  • UTF-8编码代码点,而不是字形.每个代码点最多可以是UTF-8,UTF-16和UTF-32的4个八位字节.CESU-8编码可以使用6个八位字节作为单个代码点,但这只是将UTF-16的天真编码转换为UTF-8,并且实际上不是有效的UTF-8. (3认同)