UniProt是(shi)Universal Protein的(de)(de)英文(wen)縮寫,是(shi)信(xin)息最(zui)豐富(fu)、資源最(zui)廣的(de)(de)蛋(dan)白(bai)質(zhi)數據庫。它由(you)整合Swiss-Prot、TrEMBL和(he) PIR-PSD三大(da)數據庫的(de)(de)數據而成(cheng)。他的(de)(de)數據主(zhu)要來自于基(ji)因組(zu)測序項目(mu)完成(cheng)后(hou),后(hou)續(xu)獲(huo)得的(de)(de)蛋(dan)白(bai)質(zhi)序列。它包含了(le)大(da)量(liang)來自文(wen)獻的(de)(de)蛋(dan)白(bai)質(zhi)的(de)(de)生(sheng)物功(gong)能的(de)(de)信(xin)息。
UniProtKB全稱UniProt Knowledgebase(UniProt知識庫)它是經過專家校(xiao)驗的(de)(de)(de)數(shu)據集,主要由兩部分組成:UniProtKB/Swiss-Prot(包含(han)(han)檢查過的(de)(de)(de)、手工注釋(shi)的(de)(de)(de)條目)和UniProtKB/TrEMBL(包含(han)(han)未校(xiao)驗的(de)(de)(de)、自動注釋(shi)的(de)(de)(de)條目),在(zai)2010年8月是10日發布的(de)(de)(de)版本中(zhong),UniProtKB/Swiss-Prot包含(han)(han)519,348條注釋(shi)條目,UniProtKB/TrEMBL包含(han)(han)11,636,205條注釋(shi)條目。
UniProtKB/Swiss-Prot
高(gao)質量(liang)的(de)、手工注(zhu)釋(shi)的(de)、非冗(rong)余的(de)數據集;主要來(lai)自文獻中的(de)研究(jiu)成果和E-value校驗(yan)過(guo)計算(suan)分析結果。有質量(liang)保證的(de)數據才被加入(ru)該數據庫(ku)。
UniProtKB/TrEMBL
該(gai)數據集包(bao)含高質(zhi)量(liang)的計(ji)算分(fen)析結果,一般都在自(zi)(zi)動注(zhu)釋(shi)中(zhong)富集,主要(yao)應對基因(yin)組項(xiang)目(mu)獲得(de)的大量(liang)數據流以人工校(xiao)驗在時間上和人力上的不足。他(ta)能(neng)注(zhu)釋(shi)所有可用(yong)的蛋白(bai)序(xu)列(lie)(lie)(lie)。在三大核酸數據庫(EMBL-Bank/GenBank/DDBJ)中(zhong)注(zhu)釋(shi)的編碼序(xu)列(lie)(lie)(lie)都被(bei)自(zi)(zi)動翻譯并(bing)加入該(gai)數據庫中(zhong)。它也有來(lai)自(zi)(zi)PDB數據庫的序(xu)列(lie)(lie)(lie),以及Ensembl、Refeq和CCDS基因(yin)預(yu)測的序(xu)列(lie)(lie)(lie)。
UniParc
UniParc全(quan)稱是(shi)UniProt Archive,他是(shi)一(yi)個(ge)(ge)綜(zong)合性的(de)(de)(de)非冗(rong)余數(shu)(shu)據(ju)(ju)庫(ku),他包(bao)含(han)(han)了(le)所有(you)主要(yao)的(de)(de)(de)、公開的(de)(de)(de)數(shu)(shu)據(ju)(ju)庫(ku)的(de)(de)(de)蛋(dan)白質(zhi)序(xu)(xu)(xu)列(lie)。 由于(yu)蛋(dan)白質(zhi)可能(neng)在(zai)(zai)不(bu)同(tong)的(de)(de)(de)數(shu)(shu)據(ju)(ju)庫(ku)中(zhong)存在(zai)(zai),并且可能(neng)在(zai)(zai)同(tong)一(yi)個(ge)(ge)數(shu)(shu)據(ju)(ju)庫(ku)中(zhong)有(you)多(duo)個(ge)(ge)版本,為了(le)去冗(rong)余,UniaraParc對每(mei)條(tiao)唯一(yi)的(de)(de)(de)序(xu)(xu)(xu)列(lie)只(zhi)存一(yi)次。無論是(shi)否為同(tong)一(yi)物種的(de)(de)(de)序(xu)(xu)(xu)列(lie),只(zhi)要(yao)序(xu)(xu)(xu)列(lie)相同(tong)就被合并為一(yi)條(tiao),每(mei)條(tiao)序(xu)(xu)(xu)列(lie)提供穩(wen)定的(de)(de)(de)、唯一(yi)的(de)(de)(de)編號UPI。該數(shu)(shu)據(ju)(ju)庫(ku)只(zhi)含(han)(han)有(you)蛋(dan)白質(zhi)的(de)(de)(de)序(xu)(xu)(xu)列(lie)信息,而沒有(you)注釋數(shu)(shu)據(ju)(ju)。