Python nltk 之 snowball 提取词干的简单示例

前端之家收集整理的这篇文章主要介绍了Python nltk 之 snowball 提取词干的简单示例前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧!

机器学习中很重要的应用场景就是机器自动分类,而分类的关键是词干提取。所以我们要用到snowball。

下面说一下snowball 提取词干的两种方法

两种方法

方法一:


# 来自jb51.cc 
>>> from nltk import SnowballStemmer
>>> SnowballStemmer.languages # See which languages are supported
('danish','dutch','english','finnish','french','german','hungarian','italian','norwegian','porter','portuguese",'romanian','russian','spanish','swedish')
>>> stemmer = SnowballStemmer("german") # Choose a language
>>> stemmer.stem(u"Autobahnen") # Stem a word
u'autobahn'

# End www.jb51.cc
但是当你知道你使用的语言场景的时候可以使用下面的方法直接调用

方法二:

# 来自jb51.cc 
>>> ps = nltk.stem.snowball.PortugueseStemmer()
>>> ps.stem('celular')
u'celul'
>>> ps.stem('celular')
u'celul'

# End www.jb51.cc
原文链接:https://www.f2er.com/python/526974.html

猜你在找的Python相关文章