频道导航

PostgreSQL – 替换HTML实体

2020-07-12 Postgre SQL 前端之家

前端之家收集整理的这篇文章主要介绍了PostgreSQL – 替换HTML实体，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我刚刚开始从我们的数据库中删除HTML实体的任务,因为我们进行了大量的爬行,并且一些爬虫在输入时没有这样做:(

所以我开始编写一堆看起来像的查询;

UPDATE nodes SET name=regexp_replace(name,'&#xe0;','à','g') WHERE name LIKE '%#xe0%';
UPDATE nodes SET name=regexp_replace(name,'&#xe1;','á','g') WHERE name LIKE '%#xe1%';
UPDATE nodes SET name=regexp_replace(name,'&#xe2;','â','g') WHERE name LIKE '%#xe2%';

这显然是一种非常天真的方法.我一直试图弄清楚我能用解码功能做些什么聪明的事情;也许通过正则表达式来抓取html实体,比如/\u0026amp; #x(.); /,然后只将％1部分传递给ascii解码器,然后重构字符串……或者其他东西……

我应该继续查询？可能只有40左右.

使用pl / perlu编写函数并使用此模块 https://metacpan.org/pod/HTML::Entities

当然你需要安装perl和pl / perl.

1)
首先创建过程语言pl / perlu：

CREATE EXTENSION plperlu;

2)然后创建一个这样的函数：

CREATE FUNCTION decode_html_entities(text) RETURNS TEXT AS $$
    use HTML::Entities;
    return decode_entities($_[0]);
$$LANGUAGE plperlu;

3)然后你可以像这样使用它：

select decode_html_entities('aaabbb&amp;.... asasdasdasd &hellip;');
   decode_html_entities    
---------------------------
 aaabbb&.... asasdasdasd …
(1 row)

上一篇：不在postgresql中不工作下一篇：PostgreSQL排序

猜你在找的Postgre SQL相关文章

PosegreSQL基础回顾(第 4 章 SQL语法)

来源：http://www.postgres.cn/docs/11/ 4.1.1. 标识符和关键词 SQL标识符和关键...

作者：前端之家时间：2020-11-21

PosegreSQL基础回顾(第 8 章数据类型)

来源：http://www.postgres.cn/docs/11/ 8.1. 数字类型数字类型由2、4或8字节的...

作者：前端之家时间：2020-11-21

PosegreSQL基础回顾(第 5 章数据定义)

来源：http://www.postgres.cn/docs/11/ 5.1. 表基础 SQL并不保证表中行的顺序。...

作者：前端之家时间：2020-11-21

PosegreSQL基础回顾(第 6 章数据操纵、第 7 章查询)

来源：http://www.postgres.cn/docs/11/ 6.4. 从修改的行中返回数据有时在修改行...

作者：前端之家时间：2020-11-21

PosegreSQL基础回顾(第 13 章并发控制)

来源：http://www.postgres.cn/docs/11/ 13.2.1. 读已提交隔离级别读已提交是Po...

作者：前端之家时间：2020-11-21

PostgreSQL安装和使用

青岛OJ系统用的关系型数据库是PostgreSQL,为此对PostgreSQL大致了解下。今天的主要话题围...

作者：前端之家时间：2020-11-01

PostgreSQL整体架构

作者：前端之家时间：2020-08-07

为什么选择PostgreSQL而不是MySQL

David Bolton是一名独立开发者，他使用PostgreSQL和MySQL都已有超过十年的时间。近日，他撰...

作者：前端之家时间：2020-08-07

为什么选择PostgreSQL而不是MySQL

David Bolton是一名独立开发者，他使用PostgreSQL和MySQL都已有超过十年的时间。近日，他撰...

作者：前端之家时间：2020-08-07

专访唐成：从小工到专家，PostgreSQL的修炼之道

唐成，拥有十几年数据库、操作系统、存储领域的工作经验。目前任沃趣科技首席数据库架构师...

作者：前端之家时间：2020-08-07

编程分类

MySQL MsSQL Oracle Sqlite Postgre SQL Mariadb MongoDB NoSQL HBase JDBC

最新文章