您现在的位置是:首页 > 编程 > 

第一眼差点就被这个变化倍数唬住了

2025-07-21 02:06:06
第一眼差点就被这个变化倍数唬住了 之前我们反反复复提到过,差异分析如果想要看到泾渭分明的上下调基因,其实主要是靠生物学背景,比如癌症和正常组织那么肯定是有全局表达量差异,还有不同单细胞亚之间的差异也很大,药物处理前后差异就具体情况具体分析了。但是肯定是有很多场合,大家想差异就会得到一定会非常的不明显的结果,比如病人按照结局的好坏分组,再比如神经退行性疾病和正常人取血液看转录组差异就很小很小

第一眼差点就被这个变化倍数唬住了

之前我们反反复复提到过,差异分析如果想要看到泾渭分明的上下调基因,其实主要是靠生物学背景,比如癌症和正常组织那么肯定是有全局表达量差异,还有不同单细胞亚之间的差异也很大,药物处理前后差异就具体情况具体分析了。

但是肯定是有很多场合,大家想差异就会得到一定会非常的不明显的结果,比如病人按照结局的好坏分组,再比如神经退行性疾病和正常人取血液看转录组差异就很小很小,这样的情况比比皆是,比如这个新鲜出炉的研究:

  • December 27, 2024《 Coupling of respe biomarkers between tumor and peripheral blood in patients undergoing chemoimmunotherapy》
  • (24)0065-0

完美的说明了,免疫的疗效分组在转录组表达量全局pca无法体现,那么按照疗效分组去差异,也是非常勉强的!

免疫的疗效分组在转录组表达量全局pca无法体现

但是最近学员反馈了一个明显是应该差异很小的实验设计,就是结直肠癌的取样部位的差异,居然在文献里面体现出来了一个很厉害的变化倍数!

其实早在2021就有一个单细胞转录组文献做了类似的实验设计,标题是:《Resolving the difference between left-sided and right-sided colorectal cancer by single-cell sequencing》,寄希望于个病人的小样品数量的实验设计就想发现统计学显著的左右取样部位的差异,实在是有点“痴人说梦”了:

想发现统计学显著的左右取样部位的差异

那么,扩大样品数量,就能发现统计学显著的左右取样部位的差异吗,让我们一起看看2020的数据挖掘文章:《Molecular Pathway Analysis Indicates a Distinct Metabolic Phenotype in Women With Right-Sided Colon Cancer》,针对4个公共的表达量芯片数据集,分别是:SE41258, GSE9582, GSE7892, and GSE14,做差异分析,这样的话样品数量就很可观了 :

  • right-sided colon cancers (RCCs) (tumors arising between the cecum and proximal transverse colon)
  • left-sided colon cancers (LCCs) (tumors arising between the distal transverse colon and sigmoid colon, excluding the rectum).

文献里面的作者给出来的差异分析基因信息如下所示,给人家的感觉是这些差异基因在两个分组的变化倍数都好厉害啊:

差异分析基因信息

实际上,是一个迷惑人的科学计数法而已,一种表示非常大或非常小的数字的方法,它由两部分组成:一个介于1和10之间的实数(不包括10),以及一个10的整数次幂。这种表示法的一般形式为 ( a X 10^n ),其中 ( a ) 是尾数(mantissa),( n ) 是指数(exponent)。比如上面的表格里面的几个变化倍数值,科学计数法的表示如下:

科学计数法的表示

如果你在处理数据时遇到科学计数法,可以按照上述方法将其转换为常规数字。在许多编程语言和电子表格软件(如Microsoft Excel或Google Sheets)中,科学计数法是默认的显示方式,用于处理非常大或非常小的数字。这些工具通常允许你更改显示格式,以便更直观地查看数字。

学徒作业

在GSE14数据集里面,就有记录CRC病人的Left 和 Right 信息,可以做差异分析,如下所示的病人临床信息

代码语言:javascript代码运行次数:0运行复制
> table(group_list)
group_list
        Colon   Left Rectum  Right 
     1          122     9    125 

需要大家提前CRC病人的Left 和 Right 两分组,然后针对表达量矩阵做一下差异分析,理论上就可以跟文章里面的基因的差异变化情况对比:

代码语言:javascript代码运行次数:0运行复制
> tmp = deg[cg,c(1,2,4)]
> tmp
           logFC AveExpr P.Value
DDXY  -0.966001   6.009 0.01086
EIF1AX -0.00892  10.958 0.8996
EIF1AY -0.896070   5.745 0.02507
KDM5D  -0.456692   6.77 0.05577
PRKX    0.200408   7.096 0.01245
PRKY    0.068115   5.742 0.29471 
RPS4X  -0.00188  12.669 0.9179
RPS4Y1 -0.928750   8.02 0.01148
TTTY15 -0.188674   5.407 0.15600
TXLGY -0.672571   6.19 0.01919
USP9Y  -0.42780   4.546 0.14667
UTY    -0.00920   6.2 0.90776
XIST   -0.146269   4.95 0.4220
ZFX     0.069649   7.70 0.2514
本文参与 腾讯云自媒体同步曝光计划,分享自。原始发表:2025-01-18,如有侵权请联系 cloudcommunity@tencent 删除软件数据芯片数据挖掘表格

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址:http://www.dnpztj.cn/biancheng/1163461.html

相关标签:无
上传时间: 2025-07-20 22:29:58
留言与评论(共有 18 条评论)
本站网友 宝坻一中升学率
28分钟前 发表
GSE9582
本站网友 44552
29分钟前 发表
以及一个10的整数次幂
本站网友 马鞍山美食
13分钟前 发表
然后针对表达量矩阵做一下差异分析
本站网友 福朋酒店
14分钟前 发表
其实主要是靠生物学背景
本站网友 日产召回
13分钟前 发表
差异分析如果想要看到泾渭分明的上下调基因
本站网友 孕妇能吃杏吗
0秒前 发表
以便更直观地查看数字
本站网友 艺龙消费券
24分钟前 发表
就是结直肠癌的取样部位的差异
本站网友 石龙二手房
11分钟前 发表
也是非常勉强的! 免疫的疗效分组在转录组表达量全局pca无法体现但是最近学员反馈了一个明显是应该差异很小的实验设计
本站网友 激光治疗红血丝
3分钟前 发表
分享自
本站网友 瑞和家园
13分钟前 发表
GSE7892
本站网友 美白脸部皮肤小窍门
1分钟前 发表
其实主要是靠生物学背景
本站网友 阿波菲斯
4分钟前 发表
GSE7892
本站网友 大灰兔
4分钟前 发表
2024《 Coupling of respe biomarkers between tumor and peripheral blood in patients undergoing chemoimmunotherapy》(24)0065-0完美的说明了
本站网友 苏州求职
12分钟前 发表
是一个迷惑人的科学计数法而已
本站网友 去胎毒
21分钟前 发表
科学计数法的表示如下: 科学计数法的表示如果你在处理数据时遇到科学计数法
本站网友 快速美白的方法
12分钟前 发表
科学计数法是默认的显示方式
本站网友 军政社区
21分钟前 发表
其中 ( a ) 是尾数(mantissa)