pipeline 对部分特征进行处理
2017-08-17 14:24
106 查看
http://scikit-learn.org/stable/auto_examples/preprocessing/plot_function_transformer.html#sphx-glr-auto-examples-preprocessing-plot-function-transformer-py
利用下面的方法实现, 先对某一些进行选择,然后利用featureUnin 进行合并,重新变成整个特征集 。
利用下面的方法实现, 先对某一些进行选择,然后利用featureUnin 进行合并,重新变成整个特征集 。
def all_but_first_column(X): return X[:, 1:] def drop_first_component(X, y): """ Create a pipeline with PCA and the column selector and use it to transform the dataset. """ pipeline = make_pipeline( PCA(), FunctionTransformer(all_but_first_column), # 先对整个特征集做pca,然后再滤掉第一列。即0列。 ) X_train, X_test, y_train, y_test = train_test_split(X, y) pipeline.fit(X_train, y_train) return pipeline.transform(X_test), y_test
相关文章推荐
- 使用JQuery在IE和FF中对xml进行处理的方法(部分转载)
- matlab处理图像时突出某一特征部分
- 小小机器可进行自我设计 具有生命的部分特征
- 用Apache Spark进行大数据处理——第二部分:Spark SQL
- 在JavaScript中进行文件处理,第二部分:文件读取
- 在JavaScript中进行文件处理,第五部分:Blobs
- 在JavaScript中进行文件处理,第一部分:基础
- 对屏幕特定部分进行后期特效处理
- 字符串处理,根据传入的参数进行分离,目前较适合字符串中提取引号包裹的部分的提取
- 【easyui】 jq 表单返回的数据,动态增加部分数据后,提交到后台进行处理
- 通过Js对电话和姓名身份证等进行部分隐藏处理
- 用js函数处理事件时,有时候可能因为页面部分组件不需要显示,但仍需要执行js,会有报错,但是不想暴露页面,是业务正常进行。。。。
- 用Apache Spark进行大数据处理-第三部分:Spark流
- 处理离散型特征和连续型特征共存的情况 归一化 论述了对离散特征进行one-hot编码的意义
- 机器学习(八)使用sklearn库进行数据分析_——特征处理之过滤、包裹、嵌入型
- 用Apache Spark进行大数据处理——第二部分:Spark SQL
- APUE 7-9 进行命令处理程序的典型骨架部分
- 机器学习(九)使用sklearn库进行数据分析_——文本特征处理
- js对电话和姓名身份证等进行部分隐藏处理
- linux 上安装tomcat、进行相关设置、处理部分部署问题