久久99精品麻豆国产 使用小提琴图可视化方针基因并推敲显耀性

在这个月的前几期推文中,主要基于单细胞数据使用小提琴图可视化marker基因进行了整理:
VlnPlot恶果及常用参数浅析
基于VlnPlot参数及ggplot2好意思化小提琴图
也有一期答读者问——小提琴图有点无图是何启事?
这期就一皆来学习一下画方针基因的小提琴图并推敲显耀性!
小提琴图可视化并推敲显耀性用途在单细胞数据分析中,通过小提琴图可视化和显耀性推敲不错匡助参谋者直不雅且统计地评估方针基因在不同细胞群体中的抒发各异
展示基因在不同细胞群体的抒发散播:小提琴图不错直不雅地展示基因在各个细胞亚群中的抒发水温存散播情况。
小提琴图好像反馈不同群体中抒发的中位数、四分位数及抒发值的变化限制。极端是在复杂的细胞亚群中,这种散播展示特别有助于发现基因的各异性抒发。
折服基因在不同亚群中的特异性抒发:通过显耀性推敲不错明确方针基因是否在特定细胞亚群中显耀抒发。
举例,通过t施行或非参数施行(如Wilcoxon施行)来比拟不同亚群间的抒发水平,匡助筛选出与特定功能或病理气象有关的细胞群体。
为后续功能参谋提供陈迹:显耀性各异的基因抒发频繁不错看到基因可能在不同细胞群体的生物功能或疾病经过中起要道作用。
是以当咱们需要检讨单细胞不同分组,或者不同细胞亚群中某个遐想基因的抒发情况况且比拟的时分,就不错计整齐下显耀性
基于小提琴图可视化遐想基因还是以pbmc数据为例,展示NKG7基因在不同细胞亚群中的抒发情况,推敲并展示不同分组间的显耀性
载入需要的数据#给亚群定名new.cluster.ids <- c("Naive CD4 T", "CD14+ Mono", "Memory CD4 T", "B", "CD8 T","FCGR3A+ Mono", "NK", "DC", "Platelet")names(new.cluster.ids) <- levels(pbmc)# 修改Idents均分群编号为细胞类型pbmc <- RenameIdents(pbmc, new.cluster.ids)DimPlot(pbmc, reduction = "umap", label = TRUE, repel = T,pt.size = 0.5) + NoLegend()pbmc$cluster_by_counts=Idents(pbmc)pbmc$celltype=Idents(pbmc)#推敲marker基因pbmc.markers <- FindAllMarkers(pbmc, only.pos = TRUE, min.pct = 0.25, logfc.threshold = 0.25, verbose = FALSE)top5 = pbmc.markers %>% group_by(cluster) %>% top_n(n = 5, wt = avg_log2FC)g = unique(top5$gene)可视化NKG7在不同分群抒发情况# 使用VlnPlot生成NKG7的分组小提琴图,并去掉图例p <- VlnPlot(object = pbmc, features = 'NKG7', pt.size = 0) + NoLegend() + theme(axis.text.x = element_text(angle = 90, hjust = 1))
图片
从小提琴图中不错看到NKG7基因在"CD8 T"以及"NK"中抒发较高, 在"FCGR3A+ Mono"和"DC"中抒发也较其余几个分组高,不错计整齐下这几个分组间的显耀性,然后比拟
显耀性推敲和可视化使用ggpubr包中的stat_compare_means函数在图形上清醒不同组之间的显耀性施行恶果。
调用常见的统计施行圭表(举例t施行、Wilcoxon秩和施行、ANOVA等)来比拟不同组之间的数值各异,并复返显耀性标识。
字据comparisons参数中界说的组别对来推敲两两显耀性。举例,要是comparisons = list(c("Group1", "Group2")),则只比拟“Group1”和“Group2”之间的显耀性。 若未指定具体组对,况且数据包含多个组,会默许进行全局比拟。
字据摄取的施行圭表,stat_compare_means会在数据里面实施有关的显耀性施行,复返每组对的p值。
字据推敲赢得的p值,生成对应的显耀性标识(如*、**、***、****),并字据p值限制摈弃标识清醒:
ns:暗示“不显耀”(not significant),即 p 值 > 0.05,标明两组之间的各异莫得统计学显耀性。*:暗示 p 值 ≤ 0.05,标明两组之间的各异具有统计学显耀性。**:暗示 p 值 ≤ 0.01,各异高度显耀。***:暗示 p 值 ≤ 0.001,各异极显耀。****:暗示 p 值 ≤ 0.0001,各异特别显耀。不错通过参数label = "p.signif"(仅清醒显耀性标识)或label = "p"(清醒具体的p值)进行摈弃。
1. 摄取需要比拟的分组进行显耀性推敲和展示#字据需要摄取进行比拟的分组my_comparisons <- list( c("CD8 T", "FCGR3A+ Mono"), c("FCGR3A+ Mono", "NK"), c("NK", "DC"))library(ggpubr)# 将VlnPlot转机为ggplot对象,然后添加显耀性比拟p + stat_compare_means(comparisons = my_comparisons,method = "t.test")+ ylim(-2, 15)图片
2. 用*号清醒显耀性标识,不清醒具体数值#用*号清醒显耀性标识,不清醒具体数值p + stat_compare_means(comparisons = my_comparisons,method = "t.test",label = "p.signif")+ ylim(-2, 15)
图片
3. stat_summary()将每个组的均值清醒为红点#stat_summary()将每个组的均值清醒为红点,便于对比哪个组的平均抒发水平更高。p + stat_compare_means(comparisons = my_comparisons,method = "t.test",label = "p.signif")+ ylim(-2, 15)+ stat_summary(fun = mean, geom = "point", color = "red", size = 3)
图片
stat_summary 是ggplot2包中的一个函数,可用于在图中添加统计摘抄(举例均值、圭臬差、中位数等),不错将将指定的统计推敲恶果(如平均值或中位数)径直类似到现存的图层上
要是在推敲出不同分组的显耀性之后,不成径直看出来哪个组比哪个组高,不错tat_summary()将每个组的均值清醒为红点,便于对比
文末友情宣传要是你也思作念单细胞转录组数据分析,最佳是有我方的推敲机资源哦,比如咱们的2024的分享工作器交个一又友福利价仍然是800久久99精品麻豆国产,而且还需要有基本的生物信息学基础,也不错望望咱们的生物信息学马拉松讲课,你的生物信息学初学课。
本站仅提供存储工作,系数实质均由用户发布,如发现存害或侵权实质,请点击举报。