Tidyverse|数据列的分分合合,一分多,多合一
时间:2022-07-22
本文章向大家介绍Tidyverse|数据列的分分合合,一分多,多合一,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
TCGA数据挖掘可做很多分析,前期数据“清洗”费时费力但很需要。
比如基因列为ID的需要转为常见的symbol,基因列为symbol|ID的就需要拆开了!
excel分列可以解决,但是表达量数据较大,且excel容易产生“数据变形”。
一 载入数据 R包
使用TCGA下载的数据,仅使用以下几行几列, 作为示例
library(tidyverse)
data <- read.csv("separate.csv",header = TRUE, check.name = FALSE)
head(data)
第一列的ID,和人为添加的ID2,名称不规则,我们只需要前面的基因名。
二 合久可分-一列拆多列
使用separate
函数, 将“指定”分隔符出现的位置一列分成多列
2.1 默认,不指定分隔符
data %>%
separate(ID, into = c("Gene", "IDnum")) %>% head()
2.2 指定分隔符且保留原始列
data %>%
separate(ID2, into = c("Gene2", "IDnum2"),sep = "/",remove = FALSE) %>%
head()
2.3 特殊字符的指定方式
data %>%
separate(ID, into = c("Gene1", "IDnum1"),sep = "l",remove = FALSE) %>%
head()
按照同样的方式,想把"|"分隔的ID拆分,发现报错。?黑人问号脸
发现问题先?separate
或者help(separate)
查询帮助函数,发现"|"为特殊字符,可以使用"[|]"
括起来或者"\|"
:
data %>%
separate(ID, into = c("Gene1", "IDnum1"),sep = "[|]",remove = FALSE) %>% head()
#或者
data2 <- data %>%
separate(ID, into = c("Gene1", "IDnum1"),sep = "\|",remove = FALSE)
2.4,按照第几个字符拆
根据第几个字符拆分,适合数据规整的,,,
可以用来将TCGA中的sampleID转为常见的16位,需要先转置
data2 %>% select(Gene1,contains("TCGA")) %>% #选择指定列
column_to_rownames(var = "Gene1") %>% # 将Gene1列转为rownames
t() %>% as.data.frame() %>% #数据转置,样本为行名
rownames_to_column(var="Sample") %>% #行名变为数据中的列
separate(Sample, into = c("Sample", "bar"),sep = 16) %>% #按照规则取前16个字符
select(-bar) #去掉分割后不需要的bar列
可参考:盘一盘Tidyverse| 筛行选列之select,玩转列操作
Tips:
- 1)数据分列可以先默认试一下,如2.1所示
- 2)使用R的帮助,一定!
三 分久必合-多列合一列
使用unite
函数, 可将多列按照“指定”分隔符合并为一列
data %>%
unite(ID_new, ID:ID2, sep = "_") %>% head()
- checkbox 全选和取消
- SQL 存储过程分页
- 使用shell进行日志分析(r2第14天)
- easyui表单提交验证form
- 数据紧急修复之启用错误日志 (r2第12天)
- javascript 模拟按键点击提交
- 微信小程序调用接口返回数据或提交数据
- 巧用shell脚本生成快捷脚本(r2第12天)
- asp.net动态增加服务器端控件并提交表单
- c# asp.net 实现分页(pager)功能
- 一次数据库无法登陆的"问题"及排查(r2第11天)
- popcorn-js视频Video框架简单用法
- 一次数据库响应缓慢的问题排查(r2第9天)
- 通过Ajax方式上传文件(input file),使用FormData进行Ajax请求
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- Android studio 禁用AndroidX方式
- Android 实现把bitmap图片的某一部分的颜色改成其他颜色
- AndroidStudio构建项目提示错误信息“unable to find valid certification”的完美解决方案
- Android自定义View实现抖音飘动红心效果
- Android Studio 利用Splash制作APP启动界面的方法
- android surfaceView实现播放视频功能
- Android Studio中一套代码多渠道打包的实现方法
- Android自定义View实现圆环进度条
- Android启动页用户相关政策弹框的实现代码
- 10个好用的 HTML5 特性
- Android实现签名涂鸦手写板
- Android 开发使用Activity实现加载等待界面功能示例
- 详解Android使用CoordinatorLayout+AppBarLayout+CollapsingToolbarLayou实现手指滑动效果
- Android开发自定义控件之折线图实现方法详解
- Android Studio实现长方体表面积计算器