0%

生信学习笔记07——GEO数据分析(2)

PCA图(主成分分析)

可以理解将一个多维变量(指含有非常多基因的的一个样本)降低维度,在二维平面上展示并且分组

#exp是前面的基因矩阵,将样本名字改为列名,基因名字改为行,然后更改数据格式,否则报错
dat=as.data.frame(t(exp))
library(FactoMineR)
library(factoextra) 
dat.pca <- PCA(dat, graph = FALSE)
pca_plot <- fviz_pca_ind(dat.pca,
                         geom.ind = "point", # show points only (nbut not "text")
                         col.ind = Group, # color by groups
                         palette = c("#00AFBB", "#E7B800"),
                         addEllipses = TRUE, # Concentration ellipses
                         legend.title = "Groups"
)
pca_plot

geo-1

可以看到同组的几个样本之间的相似性较高,而RA组和control组两组之间也有较好的区分度