您的位置:首頁>正文

基礎掃盲貼:如雷貫耳的BLAST到底是啥?

作者:麥子

Blast(Basic Local Alignment Search Tool), 可謂生信領域最常用的工具, 拿到一段序列(測序結果, 或設計好的引物等等), 一般都會去blast一下, 查找相似序列。 在查找相似序列的基礎上衍生出了各種作用,

比如鑒別基因組, 蛋白質, 查找特定靶區, 檢驗引物特異性等等。 自打1990年由Altschul SF等人開發出來, NCBI引進, 至今還在改善, 更新演算法。

量身選用資料庫

網址:https://blast.ncbi.nlm.nih.gov/Blast.cgi

做BLAST不僅要考慮選擇哪種演算法, 還要考慮選哪個資料庫來比對。 我們最常用的可能就人類或小鼠基因組+轉錄組, 但仍可根據自身情況選擇合適的資料庫, 能大大節省檢索時間, 並提高返回的結果的品質和特異性。

不過這麼多庫怎麼選呢, 可以點一下旁邊的問號(Help), 查看選所的資料庫的說明:

再者, 如果你已經知道你要查的序列來自哪個物種, 或你要跟哪個物種比對, 也可以在Organism選項框中輸入, 也可以減少BLAST的操作程式, 節省時間。

不同的序列要用不同的演算法

BLAST工具跟一套手術器械似的, 不同的演算法幹不同的活, 得根據自己需要的資訊, 選擇需要的工具。 可以看到檢索頁面上方有5個選項卡, 分別代表5種查詢類型。

各大類之下可能還有幾個小分類可選:

它們的功能要點總結如下:

結果解讀

找一小段蛋白序列來試一下那個新演算法Quickblastp。 可能是我的序列太短了, 並沒有感覺到Quick (0.0) 如果你的序列夠長可以體會一下。

首先會看到一個表頭, 展示這次比對的基本資訊, 如比對類型、序列長度、所選的資料庫等等, 就不貼圖了。

接下來就是圖形描述(Graphic Summary)。

第一部分是保守域, 當檢測到時才會顯示。

第二部分是比對上的序列(hit)在查詢序列上的分佈。 有刻度的條帶是序列的座標, 其下的每一個細條帶代表一段hit, 其顏色是按上方的顏色尺規顯示比例得分(alignment score), 得分越高, 相似度越高。 另外還可注意E value, E值越低,

相似度越高, 點擊可顯示詳細資訊。

保守域也可點開查看詳情, 在每個hit上懸浮滑鼠可看到它編碼的蛋白的3D結構圖以及功能等詳細說明, 在下方的列表中點開+號還可看到具體的序列。

這樣便可對你的序列特徵和功能有個大致的瞭解。

參考資料:

1.http://bitesizebio.com/21223/how-does-blast-work/

2.http://bitesizebio.com/26522/blast-off-the-basic-local-alignment-search-tool-explained/

3.ftp://ftp.ncbi.nlm.nih.gov/pub/factsheets/HowTo_BLASTGuide.pdf

投稿郵箱: tougao@helixlife.com.cn

1.http://bitesizebio.com/21223/how-does-blast-work/

2.http://bitesizebio.com/26522/blast-off-the-basic-local-alignment-search-tool-explained/

3.ftp://ftp.ncbi.nlm.nih.gov/pub/factsheets/HowTo_BLASTGuide.pdf

投稿郵箱: tougao@helixlife.com.cn

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示