在SQLite中处理Emojis

Dom*_*ito 8 sql sqlite encoding emoji

我希望在使用SQL Lite的文本对话中确定哪些表情符号最常用.我正在使用数据库浏览器,表情符号就像在iMessage中一样显示(见下图),但我对如何计算它们感到难过.

我在想是否有办法检查并查看字符是不是字母/数字/标点符号,然后我可以计算所有不符合先决条件列表的字符的频率.也就是说,我不熟悉SQLite命令以及如何实现这一点.

有没有更好的方法来解决这个问题?如果您需要更多背景来回答这个问题,请告诉我.

表情符号示例

pau*_*aul 0

我认为直接使用 SQLite 执行此操作的唯一方法是从源代码编译 SQLite,以便您可以添加对regex_replace.

然而,您只计划执行一次,重新编译 SQLite 可能有点矫枉过正。

相反,您可以将text列复制到纯文本文件中,然后运行以下命令:

sed 's/\(.\)/\1\n/g' temp.txt | sed 's/[[:alnum:].-]//g' | sort -r | uniq -c

这将导致以下结果:

Hello! Are you stuck? I saw in the park!!!!! - all lies. Easy as 123!

进入:

  1 
 11 
  3 
  6 
  1 ?
  7 !
 17
 50
Run Code Online (Sandbox Code Playgroud)

希望这足以让您实现目标。最后两个条目用于制表符和空格。

sed是一个 Linux 命令,因此如果您运行的是 Windows,您可能需要在此处获取 Windows 版本: https: //github.com/mbuilov/sed-windows