標題摘要內容

 技術前沿 

關于我們/About??
CircCode: 識別 Ribo-seq 中可翻譯的環狀 RNA
來源: | 作者:geneseed | 發布時間: 2019-11-01 | 288 次瀏覽 | 分享到:

circRNA 也有翻譯潛能的事件被報道后,circRNA 的翻譯很快就成了大家研究的熱點。然而蛋白質翻譯這個領域的研究一直比較硬核,更別說 circRNA 這一類分子背景還不夠硬。


然而,金秋十月是收獲的季節,
circRNA 翻譯研究又多了一把利刃 CircCode —— 還是基于
機器學習的,由陜西師范大學的 Peisen Sun Guanglin Li 共同開發。雖然之前也有 circRNA 翻譯相關工具,比如 CircPro circtools,但都是 mRNA 老黃歷

實際上,這款工具的研究思路很簡明,作者也為我們提供了一個非常漂亮的流程圖


1.核糖體測序 reads 質控后過濾,保留沒有比對上的 reads

2.將想要研究的 circRNA 序列以 junction 為中心提取 100nt 作為虛擬的參考基因組,然后將第一步保留的 reads 比對到參考基因組上。最后將跨 junction 位點的 reads 保留作為 RMRJs(Reads Mapped Region on a Junction),實際上是作為翻譯的候選 circRNA

3.通過機器學習工具 BASiNET 確定 RMRJ 是否可翻譯,確定可翻譯的 circRNA

4.最后用 FragGeneScan 預測 circRNA ORF 及多肽。


除了
PPT 做得好,CircCode 也需經受實際數據的考驗。

1.作者從 RPFdb 數據庫下載了人類與擬南芥的核糖體數據集,并用 CIRCPedia PlantcircBase 所有 circRNA 作為 CircCode 的輸入,最后識別到了大量可翻譯的 circRNAs(人類 3610 個,擬南芥 1569個)。

2.父基因功能富集分析表面它們參與了蛋白質加工等生物學過程。

3.為了檢驗精確性,軟件 GenRGenS 訓練了已發表的可翻譯的 circRNA 序列來測試 CircCode,最后 FDR = 0.0027

4.已發表可翻譯的人類 circRNA 中,有 60% CircCode 所識別。

5.與 CircPro 相比, SRR3495999 數據中 CircPro 識別了 44 個可翻譯的 circRNAs,而 CircCode 卻識別到了 76 個。


最后,工具是基于
Linux 系統的,源代碼及使用方法發布在
github 上。



作者雖然對軟件的準確性與敏感性作了分析與比較,然而由于目前可翻譯
circRNA 的數據太少,只能留給時間來檢驗。


總的來說,
circRNA 研究又有了新工具。


足彩进球彩奖金