小弟是小白,用 R 语言的 edgeR 包分析了从 TCGA 数据库里面下载的一个肿瘤的 count 数据,通过 edgeR 分析确定了一个 logFC=3 点多,p<0.001 的上调差异表达基因,然后呢想把它拿出来继续研究,于是把它单独拎出来,还是用前面的 TCGA 的数据,用这个基因在 500 多个癌症样本和 40 多个正常样本中的表达进行比较,做了一个小提琴图,出现问题了,发现做出小提琴图来以后这个基因在癌症组和正常组里面的表达没有差异,p=0.58 。各位大佬,为什么会出现这种情况,是数据分析有错,还是因为 edgeR 和小提琴图的 Wilcox 检验的算法不同造成的?这样到底算它是不是差异基因啊? 还有就是我用 TCGA 数据里 40 多个正常样本,找到他们配对的癌症样本,对这个基因的表达在这两组进行配对 t 检验,发现是有意义的上调。