利用箱线图巧剔异常值
时间:2022-07-23
本文章向大家介绍利用箱线图巧剔异常值,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
每个研究生都盼望着“天天有数据,年年发文章”,但有时候我们会发现实验数据中存在一些不合理的值。剔除这些异常值的办法有很多,在这里小编教大家使用箱线图剔除异常值。
使用箱线图剔除异常值的标准很简单,超出箱线图上限和下限的值即为异常值。
那什么是箱线图的上限和下限呢?首先让我们来理解几个概念。
上四分位数(Q1):所有数值由小到大排列后位于第75%位置的数字。
下四分位数(Q3):所有数值由小到大排列后位于第25%位置的数字。
四分位间距(IQR):上四分位数减下四分位数。(Q1-Q3)
上限即为非异常值范围内的最大值。(Q1+1.5*IQR)
下限即为非异常值范围内的最小值。(Q3-1.5*IQR)
根据上述箱形图剔除异常值的标准,小编写了一个脚本,可以快速去除异常值。
脚本储存在https://github.com/biozhp/boxplot_iqr (点击阅读原文即可下载),下载解压后即可使用。
输入文件为以“tab”为分隔符的文本文件。第一列为样本名称,第二列为数值。
## 该脚本须在Linux环境下使用,并安装有Python及R语言
sh ./run_pipline.sh ./input.txt ./out_name
脚本执行完成后即可获得剔除异常值后的文件(out_name.iqr.txt)。
参考资料:
R语言实战(第2版)122-123页
https://blog.csdn.net/clairliu/article/details/79217546
https://www.jianshu.com/p/76d872022dd8
- N-CryptoAsset投资组合 | 使用PCA识别高度相关的加密货币(最近听说某币很疯狂哦!)
- 仿刮刮乐刮奖效果
- Spacebuilder在Mono上运行修改备忘
- maven配置详解
- 这一新的可视化方法教你优雅地探索相关性
- LSTM Networks在股票市场上的探究
- MSBuild的简单介绍与使用
- actionbar详解(二)
- actionbar完全解析(一)
- android galley实现画廊效果
- RavenDB:基于Windows/.NET平台的NoSQL数据库
- 神经网络算法交易:波动预测与定制损失函数
- 贝叶斯深度学习:桥接PyMC3和Lasagne构建层次神经网络
- How does it work in Mono's C# compiler?
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 如何用开源项目申请 JetBrains 产品的 license
- npm -i 与npm install -S与-D的区别以及dependencies与devDependencies的区别
- axios POST提交数据的三种请求方式写法
- 将资源文件编译成源代码文件
- 一道简单的笔试题_时钟切换电路(Glitch-free clock switching circuit)
- 【STM32F429开发板用户手册】第26章 STM32F429的定时器应用之TIM1-TIM14的中断实现
- 【STM32F407开发板用户手册】第26章 STM32F407的定时器应用之TIM1-TIM14的中断实现
- ATTR节点应用
- 等待队列
- samba
- gpio_key按键驱动
- Linux中断下半部实现机制
- linux中led驱动(设备树)编程笔记
- POLL机制
- C语言规范_V1.1