文献笔记二十一:PhenoGram可视化染色体上的信息

时间:2022-07-23
本文章向大家介绍文献笔记二十一:PhenoGram可视化染色体上的信息,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
文章题目

Visualizing genomic information across chromosomes with PhenoGram

发表期刊及完成单位

BioData Mining 大类生物4区 小类数学与计算生物学3区 影响因子1.912 发表年份2013 完成单位 The Pennsylvania State University The Huck Institutes of the Life Sciences 论文本地文件名称 1756-0381-6-18.pdf

这个工具的基本功能是:可视化展示某些特征在染色体上的位置,比如snp、基因等。可以看下软件官网提供的一些例子 http://visualization.ritchielab.org/phenograms/examples

image.png

目前我用到的可能是展示某个基因家族所有基因在染色体上的分布情况。

软件的帮助文档

http://visualization.ritchielab.org/phenograms/document 这个软件可以在线使用,也可以下载到本地使用,在线使用还挺方便的,本地使用的方法暂时还没有探索,本地下载链接

https://ritchielab.org/software/phenogram-downloads

在线使用链接

http://visualization.ritchielab.org/phenograms/plot

如果我想画某个基因家族在染色体上的分布的话 最基本的使用需要准备两个输入文件,文件用tab键分割

  • 染色体的信息 第一列 包括染色体编号 第二列 染色体的长度 第三列 还可以指定着丝粒(centromere)的位置,(可以不指定这个信息)

示例文件

ID size
1 10000
2 12000
3 11000
4 10500
  • 基因家族的位置信息 第一列 基因名称 第二列 染色体编号 第三列 基因在染色体上的位置,不是区间是单一的数字,比如基因的起始位置或者终止位置 第四列 图上展示的基因名称,可以和第一列一样 第四列 所属基因家族

示例文件

gene chr pos phenotype ethnicity
1 1 1049 Gene1 Family1
2 1 2049 Gene2 Family1
3 1 3049 Gene3 Family1
4 1 4604 Gene4 Family1
5 1 5604 Gene5 Family1
6 1 6604 Gene6 Family1
7 2 4302 Gene7 Family2
8 2 5302 Gene8 Family2
9 2 6302 Gene9 Family2
10 2 7042 Gene10 Family3
11 2 8042 Gene11 Family3
12 2 9042 Gene12 Family3
13 3 1049 Gene13 Family3
22 3 2049 Gene22 Family4
32 3 3049 Gene32 Family4
42 3 4604 Gene42 Family4
52 3 5604 Gene52 Family4
62 3 6604 Gene62 Family5
72 4 4302 Gene72 Family5
82 4 5302 Gene82 Family5
92 4 6302 Gene92 Family5
102 4 7042 Gene102 Family5
112 4 8042 Gene112 Family5
122 4 9042 Gene122 Family5

第一行是列名不能变

链接

http://visualization.ritchielab.org/phenograms/plot

image.png

input file 上传基因家族位置信息

Title 自己写,会展示在图片的上方

Genome选other,然后上传自己准备的染色体信息

Phenotype spacing 和 Phenotype color 有三个选项,可以自己分别试一试

图片格式三个可选,分别是jpg,png和pdf

Zoom options 和Additional options暂时不管

直接点plot就可以了

最终的结果