術(shù)語解釋:Cox回歸:又稱比例風(fēng)險回歸模型(proportionalhazardsmodel,簡稱Cox模型),是由英國統(tǒng)計學(xué)家。該模型以生存結(jié)局和生存時間為應(yīng)變量,可同時分析多種因素對于生存期長短的影響。Cox模型能分析帶有截尾生存時間的資料,且不要求估計資料的生存分布類型,因此在醫(yī)學(xué)界被***使用。Logistic回歸:又稱邏輯回歸模型,屬于廣義線性模型。邏輯回歸是一種用于解決二分類問題的分析方法,用于估計某種事物的可能性。相較于傳統(tǒng)線性模型,邏輯回歸模型以概率形式輸出結(jié)果,可控性高且結(jié)果可解釋性強。數(shù)據(jù)要求:樣本臨床信息或生物學(xué)特征(基因突變、基因表達等)樣本的隨訪數(shù)據(jù)(總生存期,生存狀態(tài))或樣本的分組情況下游分析:1.補充相關(guān)因素的已有相關(guān)研究2.解釋相關(guān)因素對研究課題的意義。 蛋白組代謝組個性化分析。遼寧算法還原與開發(fā)數(shù)據(jù)科學(xué)口碑推薦
Inmmune gene
免疫學(xué)研究是目前科研領(lǐng)域爭相研究的熱點,**免疫細胞浸潤是其中一種。**免疫細胞浸潤是指免疫細胞從血液中移向**組織發(fā)揮作用。我們從**組織中分離出浸潤免疫細胞含量,計算基因與浸潤免疫細胞含量的相關(guān)性,篩選出影響免疫浸潤的候選基因。
基本原理:
從基因矩陣數(shù)據(jù)中提取免疫細胞含量,生成免疫細胞含量矩陣;
計算目標基因與浸潤免疫細胞含量的相關(guān)性,篩選與浸潤免疫細胞含量高度相關(guān)的基因。
術(shù)語解讀:
相關(guān)性系數(shù)(pearson,spearman, kendall)反應(yīng)兩個變量之間變化趨勢的方向以及程度。相關(guān)系數(shù)范圍為-1到+1。0表示兩個變量不相關(guān),正值表示正相關(guān),負值表示負相關(guān),值越大表示相關(guān)性越強。
數(shù)據(jù)要求:
**數(shù)據(jù)表達矩陣 遼寧算法還原與開發(fā)數(shù)據(jù)科學(xué)口碑推薦基因組數(shù)據(jù)全鏈條處理。
GeneBodyProfile(對比不同的樣品在某一區(qū)域的信號特征,不**于ChIP-seq、DNase-seq、ATAC-seq數(shù)據(jù)):GeneBodyProfile表觀遺傳修飾和對基因表達、細胞發(fā)育等過程有著深遠的影響,但相關(guān)的研究還未完善。通過對比不同的樣品在某一區(qū)域的信號特征,了解不同情況下該基因的表觀遺傳情況,幫助更好的了解其發(fā)***展過程。一般應(yīng)用場景:觀察相關(guān)基因轉(zhuǎn)錄起始位點(TSS)、轉(zhuǎn)錄終止位點(TTS)、genebody以及兩側(cè)信號特征;觀察某一功能區(qū)域(CpGi、TSS、TTS、peaksummits或enhancer區(qū))及其兩側(cè)信號特征。數(shù)據(jù)要求:ChIP-seq、DNase-seq或ATAC-seq數(shù)據(jù)。下游分析:基于展示的基因或功能情況1.補充展示部分的已有相關(guān)研究2.解釋展示部分對研究課題的意義。
survivalCurve生存分析生存分析(survivalCurve)旨在更好地分析對不同因素對患者預(yù)后的影響,從而找到影響患者疾病的關(guān)鍵因素。生存曲線(Kaplan-Meier曲線)是生存分析的基本步驟,展示分類樣本的生存曲線,從而揭示不同因素對疾病預(yù)后的影響。一般可應(yīng)用的研究方向有:患者的生存期跟基因變異的關(guān)系、藥物處理導(dǎo)致模式動物生存期變化?;驹鞬aplan-Meier法,直接用概率乘法定理估計生存率,故稱乘積極限法(product-limitmethod),是一種非參數(shù)法。相比其他方法,KM曲線能更好的處理刪失數(shù)據(jù)。先將樣本生存時間從小到大排列。若遇到非刪失值和刪失值相同時,非截刪失****。在生存時間后列出與時間相應(yīng)的死亡人數(shù),期初病例數(shù)(即生存期為某時間時尚存活的病例數(shù))。然后計算活過每個時間點的生存率。以生存時間為橫坐標,生存率為縱坐標所作的曲線,即為Kaplan-Meier曲線。術(shù)語解釋風(fēng)險比(HazardRatio,HR):Kaplan-Meier方法中計算的風(fēng)險比HR為兩分組對生存期影響的比例,用來描述該基因高表達對生存期的危險程度。該方法中的假設(shè)檢驗為兩組中樣本的生存期是否存在差異,即該因素是否會導(dǎo)致生存期的改變。刪失(censored):在生存分析中。 指導(dǎo)科研方案糾偏,更好更快發(fā)表文章。
術(shù)語解讀:中位數(shù)Q2:二分之一分位數(shù)上四分位數(shù)Q1:序列由小到大排序后第(n+1)/4所在位置的數(shù)值下四分位數(shù)Q3:序列由小到大排序后第3(n+1)/4所在位置的數(shù)值**值:非異常范圍內(nèi)的**值,四分位距IQR=Q3-Q1,上限=Q3+最小值:非異常范圍內(nèi)的最小值,下限=數(shù)據(jù)要求:某一基因在各**及對應(yīng)的正常組織的表達數(shù)據(jù)。應(yīng)用示例1:(于2014年2月發(fā)表于Nature.,影響因子)文章研究了12種主要**類型的突變景觀和意義,它首先使用小提琴圖展示了12種**的突變頻率分布情況,然后查找確定具有***意義的突變基因。應(yīng)用示例2:(于2017年1月發(fā)表在NatCommun.,影響因子)文章研究了Pancancer建模預(yù)測體細胞突變對轉(zhuǎn)錄程序背景的特異性影響。研究人員基于開發(fā)的模型預(yù)測重要轉(zhuǎn)錄因子,然后使用預(yù)測出的突變轉(zhuǎn)錄因子的活性情況繪制泛*圖譜。 構(gòu)建新的臨床預(yù)測模型。遼寧算法還原與開發(fā)數(shù)據(jù)科學(xué)口碑推薦
在基因組上同時展示突變位點和motif,為突變影響轉(zhuǎn)錄因子結(jié)合提供量化和可視化的證據(jù)。遼寧算法還原與開發(fā)數(shù)據(jù)科學(xué)口碑推薦
RNAseqChIP根據(jù)RNA-seq表達譜分析得到的結(jié)果,繪制對應(yīng)基因啟動子區(qū)的ChIP-seq信號,觀察轉(zhuǎn)錄因子對基因的調(diào)控影響。一般可應(yīng)用場景:測了RNA-seq和ChIP-seq,結(jié)合轉(zhuǎn)錄因子結(jié)合情況分析基因表達;只測了RNA-seq,補充相關(guān)ChIP-seq公共數(shù)據(jù)。基本原理:染色質(zhì)免疫共沉淀技術(shù)(ChromatinImmunoprecipitation,ChIP)也稱結(jié)合位點分析法,是一種研究蛋白質(zhì)與染色質(zhì)結(jié)合情況的方法。將ChIP與第二代測序技術(shù)相結(jié)合的ChIP-Seq,能夠高效地在全基因組范圍內(nèi)檢測與組蛋白、轉(zhuǎn)錄因子等互作的DNA區(qū)段。轉(zhuǎn)錄組測序RNA-seq,獲取的轉(zhuǎn)錄組基因表達情況,結(jié)合ChIP-seq數(shù)據(jù),可以從更宏觀的角度分析轉(zhuǎn)錄因子調(diào)控的對基因表達的影響。數(shù)據(jù)要求:基因列表,ChIP-seq數(shù)據(jù)。 遼寧算法還原與開發(fā)數(shù)據(jù)科學(xué)口碑推薦