中文文档:http://sklearn.apachecn.org/cn/stable/modules/pipeline.html
英文文档:http://sklearn.apachecn.org/en/stable/modules/pipeline.html
官方文档:http://scikit-learn.org/stable/
GitHub:https://github.com/apachecn/scikit-learn-doc-zh(觉得不错麻烦给个 Star,我们一直在努力)
贡献者:https://github.com/apachecn/scikit-learn-doc-zh#贡献者
关于我们:http://www.apachecn.org/organization/209.html
4.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
4.1.1. Pipeline: 链式评估器
-
Pipeline
可以把多个评估器链接成一个。这个是很有用的,因为处理数据的步骤一般都是固定的,例如特征选择、标准化和分类。 -
Pipeline
主要有两个目的: - 便捷性和封装性
- 你只要对数据调用 ``fit``和 ``predict``一次来适配所有的一系列评估器。
- 联合的参数选择
- 你可以一次 :ref: `grid search <grid_search>`管道中所有评估器的参数。
- 安全性
- 训练转换器和预测器使用的是相同样本,管道有助于防止来自测试数据的统计数据泄露到交叉验证的训练模型中。
transform
方法). 最后一个评估器的类型不限(转换器、分类器等等)
@H_404_70@功能函数make_pipeline
是构建管道的缩写; 它接收多个评估器并返回一个管道,自动填充评估器名:
@H_502_96@
import make_pipeline
sklearn.naive_bayes import MultinomialNB
sklearn.preprocessing import Binarizer
>>> make_pipeline(Binarizer(), MultinomialNB())
steps=[('binarizer',Binarizer(copy=True,threshold=0.0)),51)"> ('multinomialnb',MultinomialNB(alpha=1.0,51)"> class_prior=None,51)"> fit_prior=True))])
steps
属性内:
@H_502_96@
pipe.steps[0]
('reduce_dim',iterated_power='auto',n_components=None,random_state=None,51)"> svd_solver='auto',tol=0.0,whiten=False))