从Twitter存储Tweets的MySQL数据类型

Lup*_*upo 2 mysql database database-design

我需要存储大量的Twitter推文

  • 这可能是推文的最佳数据库类型→最佳猜测就是这样 TEXT
  • 我也需要防止重复.→最好的猜测varchar(255)UNIQUE key
    • 可能是varchar(140)角色应该工作,但我们也有中国人?(会节省很多空间)

另一个想法是,将所有推文存储为,TEXT并添加另一列,将推文散列到MD5并UNIQUE key在列上添加一个.

问题:存储推文的最佳MySQL类型是什么?

sty*_*972 5

编辑

Twitter不再计算用户句柄,特别针对140个字符的限制,因此varchar(140)不足以存储包含用户句柄的整个长推文.

但是,通过检查,当通过他们的句柄提到另一个Twitter用户时,我仍然无法超过140个字符.

原始答案

varchar(140)utf8格式中.

TEXT会非常低效.char(140)会浪费太多空间.

并不是说这支持了我的答案,但在技​​术和效率方面仍然是有趣的阅​​读.