UniProt是Universal Protein的(de)(de)(de)(de)英文(wen)縮寫,是信(xin)息(xi)最(zui)豐富、資源最(zui)廣的(de)(de)(de)(de)蛋白(bai)質數據(ju)庫。它由整合Swiss-Prot、TrEMBL和 PIR-PSD三大數據(ju)庫的(de)(de)(de)(de)數據(ju)而成(cheng)。他的(de)(de)(de)(de)數據(ju)主要來自(zi)于基因組測序(xu)項目完(wan)成(cheng)后(hou),后(hou)續獲(huo)得的(de)(de)(de)(de)蛋白(bai)質序(xu)列。它包(bao)含了(le)大量來自(zi)文(wen)獻的(de)(de)(de)(de)蛋白(bai)質的(de)(de)(de)(de)生物功能的(de)(de)(de)(de)信(xin)息(xi)。
UniProtKB全稱(cheng)UniProt Knowledgebase(UniProt知識庫)它是(shi)(shi)經過專家校驗的(de)(de)數據集,主要由兩部分組成(cheng):UniProtKB/Swiss-Prot(包(bao)含(han)檢查過的(de)(de)、手(shou)工注釋的(de)(de)條目(mu))和UniProtKB/TrEMBL(包(bao)含(han)未校驗的(de)(de)、自動(dong)注釋的(de)(de)條目(mu)),在2010年8月(yue)是(shi)(shi)10日發(fa)布的(de)(de)版(ban)本中,UniProtKB/Swiss-Prot包(bao)含(han)519,348條注釋條目(mu),UniProtKB/TrEMBL包(bao)含(han)11,636,205條注釋條目(mu)。
UniProtKB/Swiss-Prot
高(gao)質量的(de)(de)、手(shou)工注釋(shi)的(de)(de)、非冗余的(de)(de)數(shu)據(ju)集;主要來自文(wen)獻中(zhong)的(de)(de)研究成(cheng)果(guo)(guo)和(he)E-value校驗過計算(suan)分析結果(guo)(guo)。有質量保(bao)證(zheng)的(de)(de)數(shu)據(ju)才被加入(ru)該數(shu)據(ju)庫。
UniProtKB/TrEMBL
該數(shu)(shu)據(ju)集包含高質量的(de)計算分析結果,一(yi)般都(dou)(dou)在(zai)自(zi)動注釋(shi)(shi)中(zhong)富集,主要應對基(ji)因(yin)組項(xiang)目獲(huo)得的(de)大量數(shu)(shu)據(ju)流以(yi)人(ren)工校驗在(zai)時(shi)間上和人(ren)力(li)上的(de)不(bu)足。他能注釋(shi)(shi)所有(you)可(ke)用的(de)蛋白序列(lie)。在(zai)三大核酸(suan)數(shu)(shu)據(ju)庫(EMBL-Bank/GenBank/DDBJ)中(zhong)注釋(shi)(shi)的(de)編(bian)碼序列(lie)都(dou)(dou)被(bei)自(zi)動翻譯并加(jia)入該數(shu)(shu)據(ju)庫中(zhong)。它也(ye)有(you)來自(zi)PDB數(shu)(shu)據(ju)庫的(de)序列(lie),以(yi)及Ensembl、Refeq和CCDS基(ji)因(yin)預測的(de)序列(lie)。
UniParc
UniParc全稱是(shi)UniProt Archive,他(ta)是(shi)一(yi)(yi)個(ge)(ge)綜合性的(de)(de)(de)非冗余(yu)數(shu)(shu)據(ju)庫,他(ta)包含(han)了所有主要的(de)(de)(de)、公開(kai)的(de)(de)(de)數(shu)(shu)據(ju)庫的(de)(de)(de)蛋白質序(xu)列(lie)。 由于蛋白質可能(neng)在不同(tong)的(de)(de)(de)數(shu)(shu)據(ju)庫中存在,并且可能(neng)在同(tong)一(yi)(yi)個(ge)(ge)數(shu)(shu)據(ju)庫中有多個(ge)(ge)版本,為了去冗余(yu),UniaraParc對每條唯一(yi)(yi)的(de)(de)(de)序(xu)列(lie)只存一(yi)(yi)次。無論是(shi)否為同(tong)一(yi)(yi)物種的(de)(de)(de)序(xu)列(lie),只要序(xu)列(lie)相同(tong)就被合并為一(yi)(yi)條,每條序(xu)列(lie)提供穩定的(de)(de)(de)、唯一(yi)(yi)的(de)(de)(de)編號UPI。該數(shu)(shu)據(ju)庫只含(han)有蛋白質的(de)(de)(de)序(xu)列(lie)信(xin)息,而沒有注(zhu)釋數(shu)(shu)據(ju)。