安全分裂表情符号

pos*_*abs 16 javascript emoji

我试图将一个字符串分成单个单词/字符,但是当涉及表情符号时我遇到了麻烦.

首先,我不能简单地使用空字符拆分字符串,因为表情符号通常长度> = 2.

"".split("")
["?", "?"]
Run Code Online (Sandbox Code Playgroud)

我发现了一个表情符号的表情符号,但现在我看到了一些奇怪的肉色块.在某些情况下,我甚至会看到它们出现在Twitter上.

在此输入图像描述

这是用笔来说明肉块的问题 http://codepen.io/positlabs/pen/QyEOEG?editors=011

在此输入图像描述

更新-----------

尝试spliddit,我仍然看到肤色字符的问题.有没有办法将它们粘合在一起?

http://codepen.io/positlabs/pen/rxLqwL?editors=001

Ble*_*der 11

JavaScript的字符串是UTF-16,因此您的表情符号在内部表示为两个代码单元:

> "\ud83d\ude0e" === ""
true
Run Code Online (Sandbox Code Playgroud)

String.prototype.split函数并不真正关心UTF-16中的代理对,因此它天真地反转单个代码单元并破坏您的表情符号,因为JavaScript没有提供任何方法来处理字符串中的单个字符.

处理它没有简单的方法.您需要像spliddit这样的库来正确处理各个代码单元.

我不是100%熟悉术语,所以请根据需要编辑我的答案.