————來(lái)自血小板的講解
大家好,我是血小板,是一種小的循環(huán)無(wú)核細(xì)胞,在止血、傷口愈合和疾病進(jìn)展中起著關(guān)鍵作用。但是今天我不是來(lái)做科普講座的,最近有一伙人利用我發(fā)了一篇10+的文章,而且從投稿到發(fā)表居然只有5天!這我就坐不住了,我決定親自來(lái)介紹這篇文獻(xiàn)~
文章簡(jiǎn)介:
這篇文章【1】發(fā)表在期刊: American Journal of Hematology,是血液學(xué)中比較有質(zhì)量的期刊。在最近一年的影響因子為10.047。中科院大類(lèi): 醫(yī)學(xué) 1區(qū) 中科院小類(lèi): 2區(qū) 血液學(xué)。在中科院《國(guó)際期刊預(yù)警名單(試行)》名單( 2021年1月發(fā)布版)也沒(méi)有發(fā)現(xiàn)這個(gè)期刊
另外這本期刊還收錄了以下數(shù)據(jù)庫(kù):
Science Citation Index
Science Citation Index Expanded
Current Contents - Clinical Medicine
Current Contents - Life Sciences
BIOSIS Previews
文獻(xiàn)解讀:
當(dāng)我與其他類(lèi)型的細(xì)胞通信或在血液中循環(huán)時(shí),我的RNA圖譜可能會(huì)改變。我可能參與腫瘤的發(fā)展和轉(zhuǎn)移,被腫瘤教育過(guò)的我的RNA會(huì)改變表達(dá)特征并且能夠檢測(cè)到腫瘤。只有少數(shù)數(shù)據(jù)庫(kù)提供我的數(shù)據(jù),如PlateletWeb用來(lái)研究我的蛋白信號(hào)網(wǎng)絡(luò)和我在人類(lèi)中抗原檢測(cè),PLATELETOMICS檢測(cè)我的RNA和miRNA表達(dá)。然而,目前還缺乏對(duì)大數(shù)據(jù)對(duì)我的表達(dá)譜的系統(tǒng)研究,這就需要在不同條件下獲得高質(zhì)量的轉(zhuǎn)錄組數(shù)據(jù)。目前還沒(méi)有針對(duì)疾病的全面的血小板表達(dá)數(shù)據(jù)庫(kù)。
我目前還沒(méi)有針對(duì)疾病的全面的表達(dá)數(shù)據(jù)庫(kù),而這篇文章將對(duì)研究界非常有幫助。為了系統(tǒng)地研究血小板的RNA表達(dá)譜,他們從NCBI GEO的基因表達(dá)總集和SRA數(shù)據(jù)庫(kù)中挑選了我的表達(dá)數(shù)據(jù)集,包括來(lái)自27種疾病和健康對(duì)照的1260個(gè)RNA-seq、358個(gè)RNA微陣列、21個(gè)miRNA-seq和430個(gè)miRNA微陣列數(shù)據(jù)。當(dāng)然還有外周血單核細(xì)胞(PBMC)和全血的RNA-seq數(shù)據(jù)集。然后,他們?nèi)コ薘NA-seq表達(dá)數(shù)據(jù)的批量效應(yīng),并將其分為四組:
(1)實(shí)體瘤:結(jié)直腸癌(CRC)、乳腺癌(BRCA)、胰腺癌(PC)、肝膽癌(HCC)、膠質(zhì)母細(xì)胞瘤(GBM)、非小細(xì)胞肺癌(NSCLC)和低級(jí)別膠質(zhì)瘤(LGG)
(2)心血管疾病(CAD):不穩(wěn)定型心絞痛(UA)、ST段抬高型心肌梗死(ST段抬高型心肌梗死)、肺動(dòng)脈高壓(PH)、無(wú)明顯動(dòng)脈粥樣硬化(NSAth)、穩(wěn)定型心絞痛
(3)感染(病毒):人類(lèi)免疫缺陷病毒(HIV)、登革熱和流感(H1N1)
(4) 其他:慢性胰腺炎(CP)、癲癇、多發(fā)性硬化癥、糖尿病。
我的Reads分布分析顯示,平均約80%的Reads被映射到外顯子(39.89%)和內(nèi)含子(39.18%)區(qū)域(圖1A)。他們發(fā)現(xiàn)12.07%的片段被定位到線(xiàn)粒體DNA上,因?yàn)橥暾木€(xiàn)粒體是我發(fā)揮功能和生存的關(guān)鍵。只有8.86%的片段被定位到基因間隔區(qū)。接下來(lái),他們研究了健康樣本中我的表達(dá)情況,發(fā)現(xiàn)不同研究中表達(dá)基因的數(shù)量差異很大(圖1B)。這是有點(diǎn)奇怪的?我推測(cè)可能是由于不同的治療或處理方法所致。在健康血小板中, FPKM>3的表達(dá)基因的分布是相似的(圖1B),因此,他們認(rèn)為FPKM>3的基因是高置信度基因。結(jié)果顯示,我在健康人中平均表達(dá)4994個(gè)蛋白質(zhì)編碼基因和2168個(gè)非編碼基因,而在疾病患者中蛋白質(zhì)編碼基因和非編碼基因總數(shù)從3069個(gè)到13678個(gè)不等(圖1C)。
由于我在血管中循環(huán),他們找到了我、PBMC和全血之間基因表達(dá)譜的差異。結(jié)果發(fā)現(xiàn),我、PBMC和全血中平均表達(dá)基因數(shù)(FPKM>3)分別為7162個(gè)、10521個(gè)和9336個(gè)。在這些基因中,非編碼基因在分別約占30.27%、12.54%和12.18%(圖1D)。此外,他們還對(duì)FPKM>3的40%以上的樣本中表達(dá)的基因進(jìn)行了篩選,并在這三個(gè)來(lái)源中鑒定出4326個(gè)共同基因(編碼基因和非編碼基因分別為4168和158個(gè))。在探索三個(gè)來(lái)源的最高表達(dá)基因時(shí)(圖1E)。他們發(fā)現(xiàn)在前100個(gè)基因中有27個(gè)基因相同和前500個(gè)基因中有142個(gè)基因相同。有趣的是,37個(gè)線(xiàn)粒體基因中有35個(gè)在我的基因前100位,高表達(dá)的前10個(gè)基因中有6個(gè)來(lái)自線(xiàn)粒體(MT-RNR2、MT-RNR1、MT-ND1、MT-CO2、MT-ATP6和MT-CO3)(圖1F)。另外4個(gè)基因分別是B2M、TMSB4X、FTH1和PPBP,它們與我的形成和功能密切相關(guān)。同時(shí),PBMC和全血中表達(dá)的前10個(gè)基因同時(shí)存在于線(xiàn)粒體相關(guān)基因和血紅蛋白基因中(圖1F)。
為了研究基因在不同疾病中的功能,他們通過(guò)在基因本體論(GO)中篩選關(guān)鍵字“血小板”來(lái)排除我的相關(guān)基因,這樣就可以更好的研究我在不同疾病中作用,而不會(huì)關(guān)注到我如何產(chǎn)生、如何發(fā)揮凝血作用這類(lèi)話(huà)題了。并對(duì)剩下的前500個(gè)基因進(jìn)行GO富集分析。如圖1G所示,在健康樣本和疾病中,這些基因都富集定位于膜的蛋白、定位于內(nèi)質(zhì)網(wǎng)的蛋白和定位于膜的共翻譯蛋白。有趣的是,與健康樣本和其他疾病相比,HCC、BRCA、PC、CRC、DM、CP和病毒缺乏與核糖體生物發(fā)生相關(guān)的GO術(shù)語(yǔ)。這表明在不同的條件或疾病下,我的RNA譜是不同的。
接下來(lái),他們以差異倍數(shù)>1.5,p<0.05,F(xiàn)PKM>10為臨界值,確定了疾病和健康樣本之間的差異表達(dá)基因(DEGs)。在不同的CAD疾病中,DEG的數(shù)目差異很大(8~3298個(gè)),在感染性疾病中沒(méi)有DEGs。與健康血小板相比,CRC、BRCA、PC、HCC、GBM和NSCLC分別為1434、1414、1316、1191、1070和225,說(shuō)明非小細(xì)胞肺癌與其他腫瘤的不同之處。為了進(jìn)一步探索這一差異,他們將DEGs相交,發(fā)現(xiàn)5種腫瘤(BRCA、CRC、GBM、PC和HCC)共有716個(gè)DEG,NSCLC中有143個(gè)獨(dú)特的DEGs(圖1H)。同時(shí),他們?cè)?個(gè)腫瘤中發(fā)現(xiàn)了4個(gè)常見(jiàn)的上調(diào)基因(ITGA2B、DEFA1、DEFA3和TLN1),這四個(gè)基因已被報(bào)道與多發(fā)性癌癥的發(fā)生有關(guān)和78個(gè)常見(jiàn)的下調(diào)基因主要編碼核糖體蛋白(圖1I)。
為了探索我在癌癥診斷中的潛在價(jià)值,他們利用SEG工具鑒定了11個(gè)實(shí)體腫瘤中的特異性表達(dá)基因(SEG) (圖1J)。他們發(fā)現(xiàn)FKBP1A在NSCLC和LGG中特異性的低表達(dá),還在TCGA數(shù)據(jù)中觀察到FKBP1A在肺和腦腫瘤中的表達(dá)與健康對(duì)照相比下調(diào)。此外,NSCLC和LGG中的其余7個(gè)血小板SEG(GP1BB、PRR7、CYBA、NOP53、TYMP、STUB1和ATP5D)和LGG中的3個(gè)SEG(DUSP1、DUSP2和DDIT4)被報(bào)道與腫瘤的發(fā)生有關(guān)。
為了便于利用我的這些高質(zhì)量數(shù)據(jù)集進(jìn)行新的發(fā)現(xiàn),他們將表達(dá)數(shù)據(jù)和分析結(jié)果組織到最先進(jìn)的血小板表達(dá)數(shù)據(jù)庫(kù)中,命名為血小板表達(dá)圖譜(PEA)。PEA提供了一套完整的基因和miRNA表達(dá)譜圖譜以及每個(gè)數(shù)據(jù)集的高級(jí)分析結(jié)果:
(1)不同疾病中血小板的表達(dá)譜;
(2)特定基因(miRNA)在健康和各種疾病中的平均表達(dá);
(3)差異表達(dá)分析,包括DEGs的功能富集和蛋白質(zhì)相互作用網(wǎng)絡(luò);
(4)血小板特異性表達(dá)基因。
本文小結(jié):
總之,他們首先系統(tǒng)地研究了不同疾病的我的RNA的表達(dá)情況,并展示了其在我、PBMC和全血中的表達(dá)情況。其實(shí),他們?yōu)槲姨峁┝艘粋€(gè)完整表達(dá)數(shù)據(jù)庫(kù),我在這里要說(shuō)一句--
這可以作為研究界的基礎(chǔ)設(shè)施。但是在未來(lái),仍有幾個(gè)問(wèn)題需要解決,包括PEA的長(zhǎng)期維持等。其實(shí),我在炎癥、免疫、癌癥的發(fā)病和轉(zhuǎn)移都有作用。最近的研究表明,我還可以攜帶由功能失調(diào)細(xì)胞溢出的疾病相關(guān)生物分子(如RNA、蛋白質(zhì)和代謝物),對(duì)疾病具有診斷作用,但是這方面的研究還不是很多,大家還要繼續(xù)加油呀~
參考文獻(xiàn)
[1] G.Y. Xie, C.J. Liu, Y.R. Miao, M. Xia, Q. Zhang, A.Y. Guo, A comprehensive platelet expression atlas (PEA) resource and platelet transcriptome landscape, Am J Hematol, 97 (2022) E18-E21.