GSEA數(shù)據(jù)要求1、通常為表達(dá)譜芯片或測序數(shù)據(jù)(已經(jīng)過預(yù)處理),也可以是其他形式可排序的基因數(shù)據(jù)。2、具有已知生物學(xué)意義(GO、Pathway、**特征基因集等)的基因集。下游分析:得到GSEA結(jié)果之后的分析有:1.基因注釋:1、繪制基因集富集趨勢圖(Enrichmentplot)橫坐標(biāo):按差異表達(dá)差異排序的基因序列。數(shù)值越?。ㄆ蜃蠖耍┑幕?*在shICAM-1組中有越高倍數(shù)的差異表達(dá),數(shù)值越?。ㄆ蛴叶耍┑幕蛟趯φ战M中有越高倍數(shù)的差異表達(dá)??v坐標(biāo):上方的縱坐標(biāo)為富集打分ES,ES是一個動態(tài)的值,沿著基因序列,找到條目中的基因則增加評分,否則減少評分。通常用偏離0**遠(yuǎn)的值作為**終富集打分。下方的縱坐標(biāo)**基因表達(dá)與表型的關(guān)聯(lián),***值越大**關(guān)聯(lián)越強(qiáng),數(shù)值大于0**正相關(guān),小于0則**負(fù)相關(guān)。 云生物提供數(shù)據(jù)科學(xué)服務(wù)。上海生物/藥物信息學(xué)分析數(shù)據(jù)科學(xué)售后服務(wù)
sankey
?;鶊D(sankey)是一種數(shù)據(jù)流圖,每條邊**一條數(shù)據(jù)流,寬度**數(shù)據(jù)流的大小。一套數(shù)據(jù)集可能有多重屬性,每層屬性之間有交叉,就可以用這種圖來展示。一般應(yīng)用場景:分組與基因?yàn)槎鄬Χ嚓P(guān)系,展示高頻突變基因所處的分組;miRNA和靶基因的關(guān)系;人群按性別、年齡、家族史等特征分組,展示不同分組得**的規(guī)律。
數(shù)據(jù)要求:
多個分組及其關(guān)系,包括且不限于基因表達(dá)、突變。
下游分析:
1. 補(bǔ)充展示部分的已有相關(guān)研究
2. 解釋展示部分對研究課題的意義 四川算法還原與開發(fā)數(shù)據(jù)科學(xué)歡迎咨詢基因組數(shù)據(jù)全鏈條處理。
蛋白質(zhì)主要由碳、氫、氧、氮等化學(xué)元素組成,是一類重要的生物大分子。蛋白質(zhì)的功能由蛋白質(zhì)的三維結(jié)構(gòu)決定。蛋白質(zhì)三維結(jié)構(gòu)繪圖,可以直觀地展示蛋白質(zhì)三維功能結(jié)構(gòu),廣泛應(yīng)用于單核苷酸突變功能分析、藥物蛋白分子相互作用分析等研究領(lǐng)域?;驹淼鞍踪|(zhì)三維結(jié)構(gòu)繪圖主要分為蛋白質(zhì)三維結(jié)構(gòu)預(yù)測以及對結(jié)構(gòu)進(jìn)行可視化兩步。蛋白質(zhì)三維結(jié)構(gòu)預(yù)測是基于蛋白質(zhì)中氨基酸序列預(yù)測蛋白質(zhì)折疊結(jié)構(gòu)的步驟,**常用的預(yù)測方法為同源建模,同源建模的原理是序列相似的蛋白質(zhì)具有相似的蛋白質(zhì)結(jié)構(gòu),要推測一個未知結(jié)構(gòu)蛋白的三維結(jié)構(gòu),只需要找到與之序列高度相似的已知結(jié)構(gòu)模板。在無法進(jìn)行同源建模(找不到模型)的情況下,還有折疊識別及從頭建模法,但是計算量大運(yùn)行緩慢且建模準(zhǔn)確度不如同源建模。獲得蛋白質(zhì)三維結(jié)構(gòu)預(yù)測的pbd文件后還需要通過分子三維結(jié)構(gòu)軟件繪制可視化的三維圖,并分析特殊位點(diǎn)(分子對接或突變位點(diǎn)分析),常用的有pymol和DeepView等。數(shù)據(jù)要求目標(biāo)蛋白的氨基酸序列或者編碼蛋白的基因序列,突變數(shù)據(jù)等。下游分析突變位點(diǎn)靶向藥物分析等。
術(shù)語解釋:Cox回歸:又稱比例風(fēng)險回歸模型(proportionalhazardsmodel,簡稱Cox模型),是由英國統(tǒng)計學(xué)家。該模型以生存結(jié)局和生存時間為應(yīng)變量,可同時分析多種因素對于生存期長短的影響。Cox模型能分析帶有截尾生存時間的資料,且不要求估計資料的生存分布類型,因此在醫(yī)學(xué)界被***使用。Logistic回歸:又稱邏輯回歸模型,屬于廣義線性模型。邏輯回歸是一種用于解決二分類問題的分析方法,用于估計某種事物的可能性。相較于傳統(tǒng)線性模型,邏輯回歸模型以概率形式輸出結(jié)果,可控性高且結(jié)果可解釋性強(qiáng)。數(shù)據(jù)要求:樣本臨床信息或生物學(xué)特征(基因突變、基因表達(dá)等)樣本的隨訪數(shù)據(jù)(總生存期,生存狀態(tài))或樣本的分組情況下游分析:1.補(bǔ)充相關(guān)因素的已有相關(guān)研究2.解釋相關(guān)因素對研究課題的意義。 微生物多樣性分析桌面軟件。
棒棒糖圖是直觀顯示蛋白質(zhì)結(jié)構(gòu)上的突變點(diǎn)**簡單且有效的方式。許多致*基因具有比任何其他基因座更頻繁突變的優(yōu)先位點(diǎn)。這些位點(diǎn)被認(rèn)為是突變熱點(diǎn),棒棒糖圖可以用于顯示突變熱點(diǎn)以及其他突變位點(diǎn)。并可以對比不同**/亞型的突變位點(diǎn)。
基本原理
將蛋白質(zhì)結(jié)構(gòu)根據(jù)氨基酸順序繪制為長條形,以不同色塊標(biāo)注不同結(jié)構(gòu)域,在基因突變導(dǎo)致氨基酸改變的位置標(biāo)注棒棒糖,并在棒棒糖圓球標(biāo)注位點(diǎn)的突變頻數(shù)以及突變位點(diǎn)。
數(shù)據(jù)要求
基因突變或者蛋白質(zhì)突變數(shù)據(jù)
下游分析
1、突變位點(diǎn)靶向藥物分析
2、驅(qū)動基因突變分析 公共數(shù)據(jù)庫挖掘、診療軟件開發(fā)、算法還原與開發(fā)、臨床統(tǒng)計等。上海生物/藥物信息學(xué)分析數(shù)據(jù)科學(xué)售后服務(wù)
實(shí)驗(yàn)室致病類病原微生物數(shù)據(jù)分析平臺。上海生物/藥物信息學(xué)分析數(shù)據(jù)科學(xué)售后服務(wù)
survivalCurve生存分析生存分析(survivalCurve)旨在更好地分析對不同因素對患者預(yù)后的影響,從而找到影響患者疾病的關(guān)鍵因素。生存曲線(Kaplan-Meier曲線)是生存分析的基本步驟,展示分類樣本的生存曲線,從而揭示不同因素對疾病預(yù)后的影響。一般可應(yīng)用的研究方向有:患者的生存期跟基因變異的關(guān)系、藥物處理導(dǎo)致模式動物生存期變化?;驹鞬aplan-Meier法,直接用概率乘法定理估計生存率,故稱乘積極限法(product-limitmethod),是一種非參數(shù)法。相比其他方法,KM曲線能更好的處理刪失數(shù)據(jù)。先將樣本生存時間從小到大排列。若遇到非刪失值和刪失值相同時,非截刪失****。在生存時間后列出與時間相應(yīng)的死亡人數(shù),期初病例數(shù)(即生存期為某時間時尚存活的病例數(shù))。然后計算活過每個時間點(diǎn)的生存率。以生存時間為橫坐標(biāo),生存率為縱坐標(biāo)所作的曲線,即為Kaplan-Meier曲線。術(shù)語解釋風(fēng)險比(HazardRatio,HR):Kaplan-Meier方法中計算的風(fēng)險比HR為兩分組對生存期影響的比例,用來描述該基因高表達(dá)對生存期的危險程度。該方法中的假設(shè)檢驗(yàn)為兩組中樣本的生存期是否存在差異,即該因素是否會導(dǎo)致生存期的改變。刪失(censored):在生存分析中。 上海生物/藥物信息學(xué)分析數(shù)據(jù)科學(xué)售后服務(wù)