-- 截取html内容 先取得body内容,再替换转义字符
regexp_replace(
regexp_replace(
regexp_replace(
regexp_replace(
regexp_replace(
regexp_replace(
regexp_replace(
regexp_replace(
( regexp_match ( html_value, '<\s*body[^>]*>(.*)<\s*/\s*body\s*>' ) ) [ 1 ], '<[^>]*>', '', 'g' )
,' ', ' ', 'g' )
,'"', '"', 'g' )
,'”', '”', 'g' )
,'“', '“', 'g' )
,'>', '>', 'g' )
,'<', '<', 'g' )
,'&', '&', 'g' );
-- 替换标签
regexp_replace($1, '<[^>]*>', '', 'g');
-- 正则报错 http://postgres.cn/docs/12/functions-matching.html
-- 在方括号表达式里,\d、\s和\w会失去它们的外层方括号,而\D、\S和 \W是非法的(也就是说,例如[a-c\d]等效于[a-c[:digit:]]。同样[a-c\D]等效于 [a-c^[:digit:]]的,也是非法的)。
regexp_replace($1, '[\s\S].*', '', 'g');
-- 可以考虑如下方案:
regexp_replace($1, '(\s|\S).*', '', 'g');