特征工程
一、特征选择
(1)特征来源:
1、已经处理好的特征数据
2、从业务特征中自己去寻找高级数据特征
(2)选择合适的特征:
1、寻找该领域专家,向他们寻求建议
2、方差筛选
3、过滤法
4、包装法
5、嵌入法
(3) 寻找高级特征
1、若干项特征向加和
2、若干项特征相乘
3、若干项特征之差
4、若干项特征除商
二、特征表达(如何对某一特征的具体表现形式做处理)
(1)缺失值处理
1、对连续值来说:取平均值、中位数进行缺失值补充
2、对离散值来说:最频繁出现的类别
(2)特殊的特征处理
一般有些特征的默认值取值比较特殊,一般需要做了处理后才能用于算法
1、对于时间特征:采用连续的时间差值法;转化为若干离散特征;权重法
2、对地理特征:可以转化为经度和维度连续特征值
(3)离散特征的连续处理:
1、独热编码one-hot encoding
2、特征嵌入embedding
(4)离散特征的离散化:
1、独热编码
2、虚拟编码
(5) 连续特征离散化
三、特征预处理
(1)特征的标准化与归一化
1、z-score标准化
2、max-min标准化
3、L1、L2范数标准化
(2)异常特征样本清洗
1、聚类
2、异常点检测
(3)处理不平衡数据
1、权重法
2、采样法
参考:https://www.cnblogs.com/pinard/p/9093890.html
https://www.cnblogs.com/pinard/p/9061549.html
https://www.cnblogs.com/pinard/p/9061549.html
原文地址:https://www.cnblogs.com/spp666/p/11479999.html
- [喵咪Golang(2)]安装和Helloworld
- LSTM的简单介绍,附情感分析应用
- 使用实体嵌入的结构化数据进行深度学习
- Otter-入门篇3(Node搭建)
- PhalGo-Respones
- 数据库分库分表中间件 Sharding-JDBC 源码分析 —— SQL 改写
- Otter-入门篇2(Manager安装配置)
- Java的字符串常量相关的一个问题
- [喵咪Liunx(3)]端口转发工具rinetd
- 基于PhalApi的Smarty拓展
- PhalGo-参数验证过滤
- [喵咪Redis]Redis配置文件和主从设置
- [喵咪Redis]Redis-Sentinel
- [喵咪Redis]Redis安装与介绍
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法