您的位置:首頁>正文

一個集合了TCGA、PubMed、KEGG、transfac……的基因查詢工具 是怎樣的存在

做科研有三種痛不能忍, 一種是腦袋空空沒思路, 二是辛辛苦苦沒成果, 三是別人輕輕鬆松發文章。 今兒先和大家聊聊課題思路方面的事兒, 今天主題我們選了基因研究, 為啥?生信火, 大數據火, 這兩個都繞不開基因。

所以你的日常可能是這樣的:

1

花了老大筆錢測了序, 篩了一堆讓人傻眼的基因, 接下去怎麼做?

2

挖了資料分析了半天, 還是一堆看不出所以然的基因, 接下去呢?

3

看文獻相中了一個感興趣的基因, 那我可不可以就做這一個?

歸納一下就兩個問題:1、怎麼確定一個基因可以做;2、基因研究該怎麼做。

這兩個問題也是老生常談了, 但攻略乾貨看起來簡單, 回歸到實際問題還是得文獻資料庫來回翻。 今天就來解決點實際問題:

看看如何快速判斷一個基因是否值得做, 怎麼做。

用到的一個懶人工具——基因雷達, 非常適合文獻和資料庫不對付的親, 只要輸入你感興趣的基因, 基因的科研熱度, 相關疾病, 調控網路和在癌症中的表達值四個層面就全出來了。 似乎從此可以脫離苦海了。

1

如何省時省力確定一個基因可以做

先看差異表達

比如說你翻翻翻文獻看到了一個還不錯的基因CCL5(PMID:17914389, 乳腺癌), 也想研究下, 但自己沒有資料, 不知道這個基因在你研究中的疾病到底是個什麼情況。

不用翻TCGA, 你就可以在基因雷達中中查看CCL5在33種腫瘤中正常組織和癌組織的表達情況。 在工具中輸入CCL5, 選擇表達概況, 就可以得到下面的結果。

(點開看大圖)

PS:表達概況是基於TCGA的RNA-SEQv2資料中的標準化資料檔案中的表達值進行直接使用(資料收集時間為2016年6月)。

CCL5在乳腺癌轉移中有重要作用, 通過下面資料可以推測CCL5在某些腫瘤中高表達也可能具有轉移作用, 比如膀胱膀胱尿路上皮癌(BLCA)。

再看研究概況

好, 有資料依據了, 那CCL5別人都研究到什麼程度了呢?這時你可以通過工具中的研究熱點來看。 研究熱點根據基因在資料庫中的注釋情況, 從相關文獻、通路、功能、已驗證的靶向miRNA、和疾病五個角度來統計和評價基因研究情況。

(點開看大圖)

PS : 綠色代表目標基因, 灰色代表了資料庫中眾基因在 各個層面的中位數。

1. 相關文獻:被文獻報導的總次數;

2. 通路:即根據KEGG資料庫統計基因參與的通路的數 量;

3. 功能:即根據Go資料庫(Gene Ontology, 基因本 體學資料庫), 統計基因參與的功能(生物過程)的數 量。

4. 已驗證的靶向microRNA:已經有文獻發表驗證的 miRNA的數量。

5. 疾病:已經有文獻發表的疾病數量。

從上圖綠色包圍灰色的形勢看, 這個CCL5也算研究的熱門了。 點擊相應的內容, 可以進入到對應的資料介面。

那CCL5都在哪些疾病中研究過了呢?點擊“disease”就可以跳轉到疾病介面, 它統計了基因的研究最多的疾病TOP 20。 我們關注CCL5在癌症轉移方面的研究, 找到“癌症轉移”, 不算太多, 點擊即可進入文獻詳情頁面。

(點開看大圖)

好用不?下面解決下第二個問題。

2

確定基因後如何快速確定下一步怎麼做

現在假設CCL5是可以作為我們後續的研究物件,在基因層面,一般的思路是先做基因的功能驗證,再探討基因的作用機理。前者比較常規,在這不做過多討論,今天來看看如何用基因雷達快速挖掘出基因可能的調控網路。

畫調控網路

在機制探索中,找出關鍵基因後,會以它為中心展開,看其受到哪些基因調控,又調控了哪些基因,就是所謂的找其上下游基因/調控因數,進而摸索出一整個調控網路。

在基因裡雷達中,調控網路整合了文獻報導過的TF,miRNA,lncRNA及KEGG資料庫中的上下游基因。如CCL5的調控網路,不同色塊代表不同的基因層面和作用方式,點擊圖中的某個點可看到具體的資料資訊。

(點開看大圖)

ps:

1. 轉錄因數:已經有文獻報導的相關轉錄因數;

2. miRNA:已經有文獻報導的相關miRNA;

3. lncRNA:依據文獻挖掘可能有關的lncRNA;(準確性較弱)

4. 上下游相關基因:依據KEGG資料庫的基因上下游關係。

圖很炫,但結果這麼多,咋理出一條線來呢?這個的話就需要結合具體的研究場景去做篩選了。

如果想找新的被人沒做過的轉錄因數,可在基因雷達中的預測轉錄一因數部分查看。還是CCL5為例,CCL5預測到的TF只有三個,這樣

(點開看大圖)

Ps:基於基因的轉錄本通過Transfac資料庫進行轉錄因數預測,以推薦度來表示預測出來的轉錄因數的科研價值,推薦度越高越好。

用完只有一種感覺,專門為我這種四體不勤的人準備的嘛。求連結!

福利

【留言說說為什麼想要和對課題思路的想法】

點贊數超過5的送基因雷達1個月體驗券。

2017年8月25號18點截止哦

想瞭解更多基因雷達資訊,點這裡!

好用不?下面解決下第二個問題。

2

確定基因後如何快速確定下一步怎麼做

現在假設CCL5是可以作為我們後續的研究物件,在基因層面,一般的思路是先做基因的功能驗證,再探討基因的作用機理。前者比較常規,在這不做過多討論,今天來看看如何用基因雷達快速挖掘出基因可能的調控網路。

畫調控網路

在機制探索中,找出關鍵基因後,會以它為中心展開,看其受到哪些基因調控,又調控了哪些基因,就是所謂的找其上下游基因/調控因數,進而摸索出一整個調控網路。

在基因裡雷達中,調控網路整合了文獻報導過的TF,miRNA,lncRNA及KEGG資料庫中的上下游基因。如CCL5的調控網路,不同色塊代表不同的基因層面和作用方式,點擊圖中的某個點可看到具體的資料資訊。

(點開看大圖)

ps:

1. 轉錄因數:已經有文獻報導的相關轉錄因數;

2. miRNA:已經有文獻報導的相關miRNA;

3. lncRNA:依據文獻挖掘可能有關的lncRNA;(準確性較弱)

4. 上下游相關基因:依據KEGG資料庫的基因上下游關係。

圖很炫,但結果這麼多,咋理出一條線來呢?這個的話就需要結合具體的研究場景去做篩選了。

如果想找新的被人沒做過的轉錄因數,可在基因雷達中的預測轉錄一因數部分查看。還是CCL5為例,CCL5預測到的TF只有三個,這樣

(點開看大圖)

Ps:基於基因的轉錄本通過Transfac資料庫進行轉錄因數預測,以推薦度來表示預測出來的轉錄因數的科研價值,推薦度越高越好。

用完只有一種感覺,專門為我這種四體不勤的人準備的嘛。求連結!

福利

【留言說說為什麼想要和對課題思路的想法】

點贊數超過5的送基因雷達1個月體驗券。

2017年8月25號18點截止哦

想瞭解更多基因雷達資訊,點這裡!

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示