相关疑难解决方法(0)

PostgreSQL - 替换HTML实体

我刚刚开始从我们的数据库中删除HTML实体的任务,因为我们做了大量的爬行,并且一些爬虫在输入时没有这样做:(

所以我开始编写一堆看起来像的查询;

UPDATE nodes SET name=regexp_replace(name, 'à', 'à', 'g') WHERE name LIKE '%#xe0%';
UPDATE nodes SET name=regexp_replace(name, 'á', 'á', 'g') WHERE name LIKE '%#xe1%';
UPDATE nodes SET name=regexp_replace(name, 'â', 'â', 'g') WHERE name LIKE '%#xe2%';
Run Code Online (Sandbox Code Playgroud)

这显然是一种非常天真的方法.我一直试图弄清楚我能用解码功能做些什么聪明的事情; 也许通过正则表达式像抓住了HTML实体/&#x(..);/,然后通过刚刚%1部分到ASCII解码器,以及重建串...或东西...

我应该继续查询吗?可能只有40左右.

regex sql postgresql replace

4
推荐指数
2
解决办法
3696
查看次数

标签 统计

postgresql ×1

regex ×1

replace ×1

sql ×1