我需要从文本中提取一些数字.文字是
x <- "Lorem ipsum dolor sit amet[245],consectetur adipiscing (325). Deinde prima illa,quae in congressu[232]. solemus: Quid tu,inquit,huc? Sequitur disserendi ratio cognitioque 295. naturae;"
要提取的数字是325和232.这些数字在括号内和句子末尾.其他数字不包括在内.我试过strsplit(文字,“[A-Za-z]”),但没有得到我需要的东西.
这是一个stringi方法
x <- "Lorem ipsum dolor sit amet[245],huc? Sequitur disserendi ratio cognitioque 295. naturae; Claudii libidini,qui tum erat summo ne imperio,dederetur" library(stringi) stri_extract_all_regex(x,"(?<=[\\[(])\\d+(?=[\\])][.?!])") ## [[1]] ## [1] "325" "232"