log10数据要当心
log10数据要当心
基因表达芯片的数值范围是需要关注的信息。 1.表达芯片的数据范围zscore的数据可以用来做热图,做箱线图,做生存分析,但是一般不用来做差异分析,因为它不是正常的log2后的数据了,做出来的结果难以解释。可以从箱线图上面看出大部分的端倪。 2.不仔细检查怎么能发现问题呢代码语言:javascript代码运行次数:0运行复制opti(timeout = )
li
log10数据要当心
基因表达芯片的数值范围是需要关注的信息。
1.表达芯片的数据范围
zscore的数据可以用来做热图,做箱线图,做生存分析,但是一般不用来做差异分析,因为它不是正常的log2后的数据了,做出来的结果难以解释。
可以从箱线图上面看出大部分的端倪。
2.不仔细检查怎么能发现问题呢
代码语言:javascript代码运行次数:0运行复制opti(timeout = 10000)
library(tinyarray)
代码语言:javascript代码运行次数:0运行复制##
代码语言:javascript代码运行次数:0运行复制## tinyarray v 2.4.2 welcome to use tinyarray!
## If you use tinyarray in published research, please acknowledgements:
## We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee,especially Xiaojie Sun, for generously sharing their experience and codes.
代码语言:javascript代码运行次数:0运行复制a = geo_download("GSE66229")
代码语言:javascript代码运行次数:0运行复制## 54675 probes, 400 samples from 0.57261115 to 4.46752098
代码语言:javascript代码运行次数:0运行复制#因为样本数量太多,用sample抽样10个样本出来画箱线图即可。
boxplot(a$exp[,sample(1:ncol(a$exp),10)])
这个数据的范围是在0-4之间的。正常的log之后的数据范围是0~20之间,这个范围很不正常。一般是下载到了log后的数据,又给人log一次,才会这样。
但是呢,这数据下载下来就是这么个范围,并不是多余log导致的。所以我们应该去GEO网站上面答案啊。
数据处理的细节不在GSE页面上,而是在GSM页面上,也就是说应该点开某个具体的样本来看。
破案了哦,这是log10的数据,是不可以直接使用的,你拿它计算log2FC算出来的值就非常小!
所以需要逆转一下:
代码语言:javascript代码运行次数:0运行复制exp = a$exp
exp = log2(10^exp+1)
boxplot(exp[,sample(1:ncol(a$exp),10)])
再看这个范围,已经恢复正常咯。
总结
我们并不是提前知道这个数据取了log10,而是看到数据范围在0-4之间,不太正常,所以到网页上查才查到的。
和它一样log10的数据还有一个:GSE62254。一毛一样的情况。
本文参与 腾讯云自媒体同步曝光计划,分享自。原始发表:2024-07-15,如有侵权请联系 cloudcommunity@tencent 删除网站数据处理sample数据芯片#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格
上传时间: 2025-07-26 17:26:05
推荐阅读
留言与评论(共有 19 条评论) |
本站网友 abase | 0秒前 发表 |
已经恢复正常咯 | |
本站网友 哈西二手房网 | 30分钟前 发表 |
log10数据要当心 基因表达芯片的数值范围是需要关注的信息 | |
本站网友 hdtv | 20分钟前 发表 |
如有侵权请联系 cloudcommunity@tencent 删除网站数据处理sample数据芯片 | |
本站网友 蚌埠绿地世纪城 | 21分钟前 发表 |
所以到网页上查才查到的 | |
本站网友 税友 | 18分钟前 发表 |
boxplot(a$exp[ | |
本站网友 教育工作会议 | 3分钟前 发表 |
也就是说应该点开某个具体的样本来看 | |
本站网友 加替沙星 | 22分钟前 发表 |
如有侵权请联系 cloudcommunity@tencent 删除网站数据处理sample数据芯片 | |
本站网友 柳州男科医院 | 12分钟前 发表 |
log10数据要当心 基因表达芯片的数值范围是需要关注的信息 | |
本站网友 河北软件职业技术学院怎么样 | 28分钟前 发表 |
已经恢复正常咯 | |
本站网友 乒乓球馆 | 25分钟前 发表 |
做箱线图 | |
本站网友 天地会总舵主 | 9分钟前 发表 |
破案了哦 | |
本站网友 影印本 | 26分钟前 发表 |
是不可以直接使用的 | |
本站网友 生长因子 | 21分钟前 发表 |
ncol(a$exp) | |
本站网友 养肾穴位 | 18分钟前 发表 |
10)]) 再看这个范围 | |
本站网友 红绿色盲测试图 | 24分钟前 发表 |
和它一样log10的数据还有一个:GSE62254 | |
本站网友 我愿等 | 4分钟前 发表 |
你拿它计算log2FC算出来的值就非常小!所以需要逆转一下:代码语言:javascript代码运行次数:0运行复制exp = a$exp exp = log2(10^exp+1) boxplot(exp[ | |
本站网友 初中男洗澡会干什么 | 28分钟前 发表 |
log10数据要当心 基因表达芯片的数值范围是需要关注的信息 | |
本站网友 独行侠红屋歼外星霸 | 5分钟前 发表 |
一毛一样的情况 |