我有这种文字结构:
1.6.1 Members................................................................ 12 1.6.2 Accessibility.......................................................... 13 1.6.3 Type parameters........................................................ 13 1.6.4 The T generic type aka <T>............................................. 13
我需要创建JS对象:
{ num:"1.6.1",txt:"Members" },{ num:"1.6.2",txt:"Accessibility" } ...
那不是问题.
问题是我想通过正向前瞻分割通过正则表达式分割来提取值:
Split via the first time you see that next character is a letter
我试过了什么:
'1.6.1 Members........... 12'.split(/\s(?=(?:[\w\. ])+$)/i)
这很好用:
["1.6.1","Members...........","12"] // I don't care about the 12.
但如果我有2个字或更多:
'1.6.3 Type parameters................ 13'.split(/\s(?=(?:[\w\. ])+$)/i)
结果是:
[“1.6.3”,“类型”,“参数…………….”,“13”] //我再也不在乎13.
我当然可以加入他们,但我希望这些话能够在一起.
题 :
如何增强我的正则表达式而不是分裂单词?
期望的结果:
[“1.6.3”,“类型参数”]
要么
[“1.6.3”,“类型参数……..”] //我稍后会删除附加内容
要么
[“1.6.3”,“类型参数…….. 13”] //我稍后会删除附加内容
NB
我知道我可以通过“”或其他更简单的解决方案进行拆分,但我正在寻求(纯粹的知识)对我的解决方案进行增强,使用正向前瞻分割.
nb2:
文本中间也可以包含大写字母.
解决方法
你可以使用这个正则表达式:
/^(\d+(?:\.\d+)*) (\w+(?: \w+)*)/gm
并使用匹配的组#1和匹配的组#2获得所需的匹配.
更新:对于String#split,您可以使用此正则表达式:
/ +(?=[A-Z\d])/g
更新2:在章节名称中也可能有大写字母,需要更复杂的正则表达式:
var re = /(\D +(?=[a-z]))| +(?=[a-z\d])/gmi; var str = '1.6.3 Type Foo Bar........................................................ 13'; var m = str.split( re ); console.log(m[0],',m.slice(1,-1).join(''),m.pop() ); //=> 1.6.3,Type Foo Bar........................................................,13