您现在的位置是:首页 > 编程 > 

log10数据要当心

2025-07-27 13:41:36
log10数据要当心 基因表达芯片的数值范围是需要关注的信息。 1.表达芯片的数据范围zscore的数据可以用来做热图,做箱线图,做生存分析,但是一般不用来做差异分析,因为它不是正常的log2后的数据了,做出来的结果难以解释。可以从箱线图上面看出大部分的端倪。 2.不仔细检查怎么能发现问题呢代码语言:javascript代码运行次数:0运行复制opti(timeout = ) li

log10数据要当心

基因表达芯片的数值范围是需要关注的信息。

1.表达芯片的数据范围

zscore的数据可以用来做热图,做箱线图,做生存分析,但是一般不用来做差异分析,因为它不是正常的log2后的数据了,做出来的结果难以解释。

可以从箱线图上面看出大部分的端倪。

2.不仔细检查怎么能发现问题呢
代码语言:javascript代码运行次数:0运行复制
opti(timeout = 10000)
library(tinyarray)
代码语言:javascript代码运行次数:0运行复制
## 
代码语言:javascript代码运行次数:0运行复制
## tinyarray v 2.4.2  welcome to use tinyarray!
## If you use tinyarray in published research, please acknowledgements:
## We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee,especially Xiaojie Sun, for generously sharing their experience and codes.
代码语言:javascript代码运行次数:0运行复制
a = geo_download("GSE66229")
代码语言:javascript代码运行次数:0运行复制
## 54675 probes, 400 samples from 0.57261115 to 4.46752098
代码语言:javascript代码运行次数:0运行复制
#因为样本数量太多,用sample抽样10个样本出来画箱线图即可。
boxplot(a$exp[,sample(1:ncol(a$exp),10)])

这个数据的范围是在0-4之间的。正常的log之后的数据范围是0~20之间,这个范围很不正常。一般是下载到了log后的数据,又给人log一次,才会这样。

但是呢,这数据下载下来就是这么个范围,并不是多余log导致的。所以我们应该去GEO网站上面答案啊。

数据处理的细节不在GSE页面上,而是在GSM页面上,也就是说应该点开某个具体的样本来看。

破案了哦,这是log10的数据,是不可以直接使用的,你拿它计算log2FC算出来的值就非常小!

所以需要逆转一下:

代码语言:javascript代码运行次数:0运行复制
exp = a$exp
exp = log2(10^exp+1)
boxplot(exp[,sample(1:ncol(a$exp),10)])

再看这个范围,已经恢复正常咯。

总结

我们并不是提前知道这个数据取了log10,而是看到数据范围在0-4之间,不太正常,所以到网页上查才查到的。

和它一样log10的数据还有一个:GSE62254。一毛一样的情况。

本文参与 腾讯云自媒体同步曝光计划,分享自。原始发表:2024-07-15,如有侵权请联系 cloudcommunity@tencent 删除网站数据处理sample数据芯片

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址:http://www.dnpztj.cn/biancheng/1236988.html

相关标签:无
上传时间: 2025-07-26 17:26:05

上一篇:听说你的KM

下一篇:trans

留言与评论(共有 19 条评论)
本站网友 abase
0秒前 发表
已经恢复正常咯
本站网友 哈西二手房网
30分钟前 发表
log10数据要当心 基因表达芯片的数值范围是需要关注的信息
本站网友 hdtv
20分钟前 发表
如有侵权请联系 cloudcommunity@tencent 删除网站数据处理sample数据芯片
本站网友 蚌埠绿地世纪城
21分钟前 发表
所以到网页上查才查到的
本站网友 税友
18分钟前 发表
boxplot(a$exp[
本站网友 教育工作会议
3分钟前 发表
也就是说应该点开某个具体的样本来看
本站网友 加替沙星
22分钟前 发表
如有侵权请联系 cloudcommunity@tencent 删除网站数据处理sample数据芯片
本站网友 柳州男科医院
12分钟前 发表
log10数据要当心 基因表达芯片的数值范围是需要关注的信息
本站网友 河北软件职业技术学院怎么样
28分钟前 发表
已经恢复正常咯
本站网友 乒乓球馆
25分钟前 发表
做箱线图
本站网友 天地会总舵主
9分钟前 发表
破案了哦
本站网友 影印本
26分钟前 发表
是不可以直接使用的
本站网友 生长因子
21分钟前 发表
ncol(a$exp)
本站网友 养肾穴位
18分钟前 发表
10)]) 再看这个范围
本站网友 红绿色盲测试图
24分钟前 发表
和它一样log10的数据还有一个:GSE62254
本站网友 我愿等
4分钟前 发表
你拿它计算log2FC算出来的值就非常小!所以需要逆转一下:代码语言:javascript代码运行次数:0运行复制exp = a$exp exp = log2(10^exp+1) boxplot(exp[
本站网友 初中男洗澡会干什么
28分钟前 发表
log10数据要当心 基因表达芯片的数值范围是需要关注的信息
本站网友 独行侠红屋歼外星霸
5分钟前 发表
一毛一样的情况