如何使用正则表达式删除Java中的SUB(HEX:1A)控制字符?

前端之家收集整理的这篇文章主要介绍了如何使用正则表达式删除Java中的SUB(HEX:1A)控制字符?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有一个包含错误数据的文件(一些随机的SUB控制字符本身……它们不是字形的一部分)我试图使用正则表达式搜索模式删除它们:

Text to Find: \x1a
Replace with:

删除了我的SUB字符,但它也搞乱了我的其他具有重音符号的字符(具体为é和í).

是否有正则表达式将删除SUB控制字符(代码点),如果它本身? (例如,不是字形的一部分)

样本数据(用SUB控制字符替换你看到“␚”的任何地方:

A,André,Fernandez
A,Daniel,O␚Shea
A,Ibhlín,Flanders
A,Donny,O␚'Donnell
A,Spencer,O'Maley

示例数据输出如果我使用我当前的正则表达式:

A,Andr�,OShea
A,Ibhl�n,O'Donnell
A,O'Maley

期望的数据输出

A,O'Maley

解决方法

Position        Decimal        Name                     Appearance   
 0x241A          9242           SYMBOL FOR SUBSTITUTE    ␚

unicode chart

也许这可以帮到你.

随之而来.

Regex Unicode

@H_404_54@

猜你在找的正则表达式相关文章