java – 用于将德语地址拆分为其部分的正则表达式

前端之家收集整理的这篇文章主要介绍了java – 用于将德语地址拆分为其部分的正则表达式前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
晚上好,

我试图通过Java将德国地址字符串的各个部分拆分成它的部分.有没有人知道正则表达式或图书馆这样做?要拆分它,如下所示:

NamederStraße25a88489 Teststadt

NamederStraße| 25a | 88489 | Teststadt

要么

Teststr. 3 88489 Beispielort(GroßerKreis)

Teststr.|​​ 3 | 88489 | Beispielort(GroßerKreis)

如果系统/正则表达式仍然有效,如果缺少像邮政编码或城市这样的部分,那将是完美的.

有没有我可以存档的正则表达式或库?

编辑:德国地址规则:
街:人物,数字和空格
房屋号码:数字和任何字符(或空格),直到一系列数字(zip)(至少在这些例子中)
邮编:5位数
地方或城市:其余的也可能有空格,逗号或大括号

解决方法

我遇到了类似的问题,并稍微调整了这里提供的解决方案,并找到了这个解决方案也可以工作,但(imo)有点简单易懂和扩展:
/^([a-zäöüß\s\d.,-]+?)\s*([\d\s]+(?:\s?[-|+/]\s?\d+)?\s*[a-z]?)?\s*(\d{5})\s*(.+)?$/i

这里有一些example matches.

它还可以处理丢失的街道号码,并且可以通过向字符类添加特殊字符来轻松扩展.

[a-zäöüß\s\d,.-]+?                         # Street name (lazy)
[\d\s]+(?:\s?[-|+/]\s?\d+)?\s*[a-z]?)?     # Street number (optional)

在那之后,必须有邮政编码,这是绝对必要的唯一部分,因为它是唯一不变的部分.邮政编码后的所有内容都被视为城市名称.

猜你在找的Java相关文章