UniProt是(shi)Universal Protein的(de)英(ying)文(wen)縮寫,是(shi)信(xin)息最豐(feng)富、資(zi)源(yuan)最廣的(de)蛋白質數(shu)據庫。它由(you)整合Swiss-Prot、TrEMBL和 PIR-PSD三大(da)數(shu)據庫的(de)數(shu)據而成。他的(de)數(shu)據主要來自(zi)于(yu)基(ji)因組測序項目完成后,后續獲(huo)得的(de)蛋白質序列(lie)。它包含了大(da)量來自(zi)文(wen)獻(xian)的(de)蛋白質的(de)生(sheng)物功(gong)能的(de)信(xin)息。
UniProtKB全稱UniProt Knowledgebase(UniProt知識(shi)庫)它是經過(guo)專家校(xiao)(xiao)驗的(de)(de)數據集(ji),主(zhu)要由(you)兩部分組成:UniProtKB/Swiss-Prot(包含(han)檢查過(guo)的(de)(de)、手工注(zhu)釋(shi)(shi)的(de)(de)條(tiao)目(mu))和UniProtKB/TrEMBL(包含(han)未校(xiao)(xiao)驗的(de)(de)、自動注(zhu)釋(shi)(shi)的(de)(de)條(tiao)目(mu)),在2010年8月是10日發布(bu)的(de)(de)版本中,UniProtKB/Swiss-Prot包含(han)519,348條(tiao)注(zhu)釋(shi)(shi)條(tiao)目(mu),UniProtKB/TrEMBL包含(han)11,636,205條(tiao)注(zhu)釋(shi)(shi)條(tiao)目(mu)。
UniProtKB/Swiss-Prot
高質量(liang)的(de)(de)、手工注釋的(de)(de)、非冗余的(de)(de)數(shu)(shu)據(ju)集(ji);主要來(lai)自文獻(xian)中的(de)(de)研究成果和E-value校驗過計算分析結果。有質量(liang)保證的(de)(de)數(shu)(shu)據(ju)才被加入該數(shu)(shu)據(ju)庫。
UniProtKB/TrEMBL
該數據(ju)集包含高(gao)質(zhi)量的(de)計算分析結果,一(yi)般都(dou)在(zai)(zai)自(zi)動(dong)注釋中(zhong)富集,主要應(ying)對基(ji)因組(zu)項(xiang)目獲(huo)得的(de)大(da)量數據(ju)流(liu)以(yi)人(ren)工(gong)校(xiao)驗在(zai)(zai)時間上和(he)人(ren)力(li)上的(de)不足(zu)。他能(neng)注釋所有(you)可用的(de)蛋白序列(lie)(lie)。在(zai)(zai)三(san)大(da)核酸數據(ju)庫(EMBL-Bank/GenBank/DDBJ)中(zhong)注釋的(de)編碼序列(lie)(lie)都(dou)被自(zi)動(dong)翻譯(yi)并加入(ru)該數據(ju)庫中(zhong)。它也有(you)來自(zi)PDB數據(ju)庫的(de)序列(lie)(lie),以(yi)及Ensembl、Refeq和(he)CCDS基(ji)因預測的(de)序列(lie)(lie)。
UniParc
UniParc全(quan)稱是UniProt Archive,他(ta)是一(yi)個綜合(he)性的(de)(de)(de)非(fei)冗余數(shu)據庫(ku),他(ta)包含(han)了(le)所有主要的(de)(de)(de)、公開的(de)(de)(de)數(shu)據庫(ku)的(de)(de)(de)蛋白質(zhi)序(xu)列(lie)。 由于蛋白質(zhi)可能在不同(tong)的(de)(de)(de)數(shu)據庫(ku)中(zhong)存(cun)在,并且可能在同(tong)一(yi)個數(shu)據庫(ku)中(zhong)有多個版本(ben),為了(le)去冗余,UniaraParc對(dui)每條唯(wei)一(yi)的(de)(de)(de)序(xu)列(lie)只存(cun)一(yi)次。無(wu)論(lun)是否為同(tong)一(yi)物種的(de)(de)(de)序(xu)列(lie),只要序(xu)列(lie)相同(tong)就被合(he)并為一(yi)條,每條序(xu)列(lie)提供穩定的(de)(de)(de)、唯(wei)一(yi)的(de)(de)(de)編號(hao)UPI。該數(shu)據庫(ku)只含(han)有蛋白質(zhi)的(de)(de)(de)序(xu)列(lie)信息,而沒有注釋數(shu)據。