文档介绍
可变剪切5分文章套路--生信自学网主要内容➢简介➢数据(AS、SF、clinical)➢数据整理(AS、SF、clinical)➢绘制Upset图➢单因素COX分析➢绘制火山图和气泡图➢Lasso回归➢COX模型构建➢生存分析➢ROC曲线➢绘制风险曲线➢预后分析➢AS和SF调控网络可变剪切可变剪切(alternativesplicing,AS),也叫做选择性剪切,指的是在mRNA前体到成熟mRNA的过程当中,不同的剪切方式使得同一个基因可以产生多个不同的成熟mRNA,最终产生不同的蛋白质。生不同的蛋白质。可变剪接是调节基因表达和产生蛋白质组多样性的重要可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,是导致真核生物基因和蛋白质数量较大差异的重要原因。可变剪切在肿瘤中经常发生,与肿瘤发生发展密切相关。研究发现可变剪切影响了那些在肿瘤中经常发生突变的蛋白基因,改变了肿瘤相关信号通路中的蛋白-蛋白相互作用,说明可变剪切也是驱动肿瘤发生的一种重要原因。可变剪切①可变受点(AA)②可变供点(AD)③③③可变启动子(AP)④④④可变终止子(AT)⑤外显子跳跃(ES)⑥外显子互斥(ME)⑦内含子保留(RI)可变剪切PSI值PSI(Percent-spliced-in,拼接百分比)可以针对isoform,exon,ASE进行计算,对于ASE来说,PSI=splice_in/(splice_in+splice_out),在RNA-seq数据中splice_in和splice_out分别是支持splicein和spliceout发生的reads的数目。剪接因子SF(SF(剪接因子,剪接因子,splicingfactor)参与RNA前体剪切过程的蛋白质因子。根据其功能作用,可以分为核小核糖白颗粒(snRNP)蛋白因子和非snRNP蛋白因子。剪接因子表达异常会导致基因的可变剪切发生改变,在肿瘤