小编J L*_*J L的帖子

R可以读取html编码的表情符号吗?

我的问题,如下所述,是如何使用R来读取包含HTML表情符号代码的字符串��,并且(1 ) in the parsed string, or (2) convert it into its text equivalent (":hugging face:")?

背景

我有一个文本消息的XML数据集(来自Android/iOS应用程序[信号])(https://signal.org/),我正在阅读R文本挖掘项目.数据看起来像这样,每个文本消息都在sms节点中表示:

<?xml version="1.0" encoding="UTF-8" standalone="yes" ?>
<!-- File Created By Signal -->
    <smses count="1">
        <sms protocol="0" address="+15555555555" contact_name="Jane Doe" date="1483256850399" readable_date="Sat, 31 Dec 2016 23:47:30 PST" type="1" subject="null" body="Hug emoji: &#55358;&#56599;" toa="null" sc_toa="null" service_center="null" read="1" status="-1" locked="0" />
</smses>
Run Code Online (Sandbox Code Playgroud)

问题

我目前正在使用xml2R 的包读取这些数据.xml2::read_xml但是,当我使用该函数时,我收到以下错误消息:

Error in doc_parse_raw(x, encoding = encoding, base_url …
Run Code Online (Sandbox Code Playgroud)

xml html-encode r emoji xml2

6
推荐指数
1
解决办法
1137
查看次数

标签 统计

emoji ×1

html-encode ×1

r ×1

xml ×1

xml2 ×1