频道导航

nlp – 如何编写POS正则表达式的spacy matcher

2020-07-27 正则表达式前端之家

前端之家收集整理的这篇文章主要介绍了nlp – 如何编写POS正则表达式的spacy matcher，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

Spacy有两个我想要结合的功能 – part-of-speech(POS)和 rule-based matching.

我怎样才能以简洁的方式将它们组合起来？

例如 – 假设输入是单个句子,我想验证它是否符合某些POS排序条件 – 例如动词在名词之后(类似于名词**动词正则表达式).结果应该是真的还是假的.那可行吗？或者匹配器在示例中是特定的

基于规则的匹配可以有POS规则吗？

如果不是 – 这是我目前的计划 – 将所有内容收集在一个字符串中并应用正则表达式

import spacy
nlp = spacy.load('en')
#doc = nlp(u'is there any way you can do it')
text=u'what are the main issues'
doc = nlp(text)

concatPos = ''
print(text)
for word in doc:
    print(word.text,word.lemma,word.lemma_,word.tag,word.tag_,word.pos,word.pos_)
    concatPos += word.text +"_" + word.tag_ + "_" + word.pos_ + "-"
print('-----------')
print(concatPos)
print('-----------')

# output of string- what_WP_NOUN-are_VBP_VERB-the_DT_DET-main_JJ_ADJ-issues_NNS_NOUN-

解决方法

当然,只需使用POS属性.

import spacy
nlp = spacy.load('en')
from spacy.matcher import Matcher
from spacy.attrs import POS
matcher = Matcher(nlp.vocab)
matcher.add_pattern("Adjective and noun",[{POS: 'ADJ'},{POS: 'NOUN'}])

doc = nlp(u'what are the main issues')
matches = matcher(doc)

上一篇：正则表达式 – awk和等价类下一篇：正则表达式,返回特定字母后面的数字

猜你在找的正则表达式相关文章

常用正则表达式-手机号、身份证、邮箱

一、校验数字的表达式 1 数字：^[0-9]*$ 2 n位的数字：^d{n}$ 3 至少n位的数字：^d{n,}$ 4...

作者：前端之家时间：2021-01-10

JS正则表达式详解

正则表达式非常有用，查找、匹配、处理字符串、替换和转换字符串，输入输出等。下面整理一...

作者：前端之家时间：2020-12-29

组内正则培训记录

0. 注：不同语言中的正则表达式实现都会有一些不同。下文中的代码示例除特别说明的外，都...

作者：前端之家时间：2020-12-20

高级正则表达式技术（Python版）

正则表达式是从信息中搜索特定的模式的一把瑞士军刀。它们是一个巨大的工具库，其中的...

作者：前端之家时间：2020-07-22

史上最全最常用的正则表达式

一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,...

作者：前端之家时间：2020-07-22

正则表达式工具

作者：前端之家时间：2020-07-22

正则表达式初步

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

　　正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编...

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器...

作者：前端之家时间：2020-07-22

[知识积累]--正则表达式记忆表

在工作中常常遇到正则表达式问题，有时候又会忘记这则的语法。下面就分享一份正则表达式记...

作者：前端之家时间：2020-07-22

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章