傳統(tǒng)的蛋白鑒定方法,如免疫印跡法、內(nèi)肽的化學(xué)測(cè)序、已知或未知蛋白的comigration分析,或者在一個(gè)有機(jī)體中有意義的基因的過表達(dá)通常耗時(shí)、耗力,不適合高流通量的篩選。 目前,所選用的技術(shù)包括對(duì)于蛋白鑒定的圖象分析、微量測(cè)序、進(jìn)一步對(duì)肽片段進(jìn)行鑒定的氨基酸組分分析和與質(zhì)譜相關(guān)的技術(shù)。
1 圖象分析技術(shù)(Image analysis)
“滿天星”式的2-DE圖譜分析不能依靠本能的直覺,每一個(gè)圖象上斑點(diǎn)的上調(diào)、下調(diào)及出現(xiàn)、消失,都可能在生理和病理狀態(tài)下產(chǎn)生,必須依靠計(jì)算機(jī)為基礎(chǔ)的數(shù)據(jù)處理,進(jìn)行定量分析。 在一系列高質(zhì)量的2-DE凝膠產(chǎn)生(低背景染色,高度的重復(fù)性)的前提下,圖象分析包括斑點(diǎn)檢測(cè)、背景消減、斑點(diǎn)配比和數(shù)據(jù)庫構(gòu)建。 首先,采集圖象通常所用的系統(tǒng)是電荷耦合CCD(charge coupled device)照相機(jī);激光密度儀(laser densitometers)和Phospho或Fluoro?imagers,對(duì)圖象進(jìn)行數(shù)字化。 并成為以象素(pixels)為基礎(chǔ)的空間和網(wǎng)格。 其次,在圖象灰度水平上過濾和變形,進(jìn)行圖象加工,以進(jìn)行斑點(diǎn)檢測(cè)。 利用Laplacian,Gaussian,DOG(difference of Gaussians) opreator使有意義的區(qū)域與背景分離,精確限定斑點(diǎn)的強(qiáng)度、面積、周長(zhǎng)和方向。
圖象分析檢測(cè)的斑點(diǎn)須與肉眼觀測(cè)的斑點(diǎn)一致。 在這一原則下,多數(shù)系統(tǒng)以控制斑點(diǎn)的重心或最高峰來分析,邊緣檢測(cè)的軟件可精確描述斑點(diǎn)外觀,并進(jìn)行邊緣檢測(cè)和鄰近分析,以增加精確度。 通過閾值分析、邊緣檢測(cè)、銷蝕和擴(kuò)大斑點(diǎn)檢測(cè)的基本工具還可恢復(fù)共遷移的斑點(diǎn)邊界。 以PC機(jī)為基礎(chǔ)的軟件Phoretix-2D正挑戰(zhàn)古老的Unix為基礎(chǔ)的2-D分析軟件包。 第三,一旦2-DE圖象上的斑點(diǎn)被檢測(cè),許多圖象需要分析比較、增加、消減或均值化。 由于在2-DE中出現(xiàn)100%的重復(fù)性是很困難的,由此凝膠間的蛋白質(zhì)的配比對(duì)于圖象分析系統(tǒng)是一個(gè)挑戰(zhàn)。 IPG技術(shù)的出現(xiàn)已使斑點(diǎn)配比變得容易。 因此,較大程度的相似性可通過斑點(diǎn)配比向量算法在長(zhǎng)度和平行度觀測(cè)。 用來配比的著名軟件系統(tǒng)包括Quest,Lips,Hermes,Gemini等,計(jì)算機(jī)方法如相似性、聚類分析、等級(jí)分類和主要因素分析已被采用,而神經(jīng)網(wǎng)絡(luò)、子波變換和實(shí)用分析在未來可被采用。 配比通常由一個(gè)人操作,其手工設(shè)定大約50個(gè)突出的斑點(diǎn)作為“路標(biāo)”,進(jìn)行交叉配比。 之后,擴(kuò)展至整個(gè)膠。
例如:精確的PI和MW(分子量)的估計(jì)通過參考圖上20個(gè)或更多的已知蛋白所組成的標(biāo)準(zhǔn)曲線來計(jì)算未知蛋白的PI和MW。 在凝膠圖象分析系統(tǒng)依據(jù)已知蛋白質(zhì)的pI值產(chǎn)生PI網(wǎng)絡(luò),使得凝膠上其它蛋白的PI按此分配。 所估計(jì)的精確度大大依賴于所建網(wǎng)格的結(jié)構(gòu)及標(biāo)本的類型。 已知的未被修飾的大蛋白應(yīng)該作為標(biāo)志,變性的修飾的蛋白的PI估計(jì)約在±0。25個(gè)單位。 同理,已知蛋白的理論分子量可以從數(shù)據(jù)庫中計(jì)算,利用產(chǎn)生的表觀分子量的網(wǎng)格來估計(jì)蛋白的分子量。 未被修飾的小蛋白的錯(cuò)誤率大約30%,而翻譯后蛋白的出入更大。 故需聯(lián)合其他的技術(shù)完成鑒定。
2 微量測(cè)序(microsequencing)
蛋白質(zhì)的微量測(cè)序已成為蛋白質(zhì)分析和鑒定的基石,可以提供足夠的信息。 盡管氨基酸組分分析和肽質(zhì)指紋譜(PMF)可鑒定由2-DE分離的蛋白,但最普通的N-末端Edman降解仍然是進(jìn)行鑒定的主要技術(shù)。 目前已實(shí)現(xiàn)蛋白質(zhì)微量測(cè)序的自動(dòng)化。 首先使經(jīng)凝膠分離的蛋白質(zhì)直接印跡在PVDF膜或玻璃纖維膜上,染色、切割,然后直接置于測(cè)序儀中,可用于subpicomole水平的蛋白質(zhì)的鑒定。 但有幾點(diǎn)需注意:Edman降解很緩慢,序列以每40 min 1個(gè)氨基酸的速率產(chǎn)生;與質(zhì)譜相比,Edman降解消耗大;試劑昂貴,每個(gè)氨基酸花費(fèi)3~4$。 這都說明泛化的Edman降解蛋白質(zhì)不適合分析成百上千的蛋白質(zhì)。 然而,如果在一個(gè)凝膠上僅有幾個(gè)有意義的蛋白質(zhì),或者如果其他技術(shù)無法測(cè)定而克隆其基因是必需的,則需要進(jìn)行泛化的Edman降解測(cè)序。
近來,應(yīng)用自動(dòng)化的Edman降解可產(chǎn)生短的N-末端序列標(biāo)簽,這是將質(zhì)譜的序列標(biāo)簽概念用于Edman降解,業(yè)已成為一種強(qiáng)有力的蛋白質(zhì)鑒定。 當(dāng)對(duì)Edman的硬件進(jìn)行簡(jiǎn)單改進(jìn),以迅速產(chǎn)生N-末端序列標(biāo)簽達(dá)10~20個(gè)/d,序列檢簽將適于在較小的蛋白質(zhì)組中進(jìn)行鑒定。若聯(lián)合其他的蛋白質(zhì)屬性,如氨基酸組分分析、肽質(zhì)質(zhì)量、表現(xiàn)蛋白質(zhì)分子量、等電點(diǎn),可以更加可信地鑒定蛋白質(zhì)。 選擇BLAST程序,可與數(shù)據(jù)庫相配比。 目前,采用一種Tagldent的檢索程序,還可以進(jìn)行種間比較鑒定,又提高了其在蛋白質(zhì)組研究中的作用。
3 與質(zhì)譜(mass spectrometry)相關(guān)的技術(shù)
質(zhì)譜已成為連接蛋白質(zhì)與基因的重要技術(shù),開啟了大規(guī)模自動(dòng)化的蛋白質(zhì)鑒定之門。 用來分析蛋白質(zhì)或多肽的質(zhì)譜有兩個(gè)主要的部分,1)樣品入機(jī)的離子源,2)測(cè)量被介入離子的分子量的裝置。 首先是基質(zhì)輔助激光解吸附電離飛行時(shí)間質(zhì)譜(MALDI-TOF)為一脈沖式的離子化技術(shù)。 它從固相標(biāo)本中產(chǎn)生離子,并在飛行管中測(cè)其分子量。 其次是電噴霧質(zhì)譜(ESI-MS),是一連續(xù)離子化的方法,從液相中產(chǎn)生離子,聯(lián)合四極質(zhì)譜或在飛行時(shí)間檢測(cè)器中測(cè)其分子量。 近年來,質(zhì)譜的裝置和技術(shù)有了長(zhǎng)足的進(jìn)展。
在MALDI-TOF中,最重要的進(jìn)步是離子反射器(ion reflectron)和延遲提。╠elayed ion extraction),可達(dá)相當(dāng)精確的分子量。 在ESI-MS中,納米級(jí)電霧源(nano-electrospray source)的出現(xiàn)使得微升級(jí)的樣品在30~40 min內(nèi)分析成為可能。
將反相液相色譜和串聯(lián)質(zhì)譜(tandem MS)聯(lián)用,可在數(shù)十個(gè)picomole的水平檢測(cè);若利用毛細(xì)管色譜與串聯(lián)質(zhì)譜聯(lián)用,則可在低picomole到高femtomole水平檢測(cè);當(dāng)利用毛細(xì)管電泳與串聯(lián)質(zhì)譜連用時(shí),可在小于femtomole的水平檢測(cè)。 甚至可在attomole水平進(jìn)行。 目前多為酶解、液相色譜分離、串聯(lián)質(zhì)譜及計(jì)算機(jī)算法的聯(lián)合應(yīng)用鑒定蛋白質(zhì)。 下面以肽質(zhì)指紋術(shù)和肽片段的測(cè)序來說明怎樣通過質(zhì)譜來鑒定蛋白質(zhì)。
(1)肽質(zhì)指紋術(shù)(peptide mass fingerprint, PMF)
由Henzel等人于1993年提出。 用酶(最常用的是胰酶)對(duì)由2-DE分離的蛋白在膠上或在膜上于精氨酸或賴氨酸的C-末端處進(jìn)行斷裂,斷裂所產(chǎn)生的精確的分子量通過質(zhì)譜來測(cè)量(MALDI-TOF-MS,或?yàn)镋SI-MS),這一技術(shù)能夠完成的肽質(zhì)量可精確到0。1個(gè)分子量單位。 所有的肽質(zhì)量最后與數(shù)據(jù)庫中理論肽質(zhì)量相配比(理論肽是由實(shí)驗(yàn)所用的酶來“斷裂”蛋白所產(chǎn)生的)。 配比的結(jié)果是按照數(shù)據(jù)庫中肽片段與未知蛋白共有的肽片段數(shù)目作一排行榜,“冠軍”肽片段可能代表一個(gè)未知蛋白。若冠亞軍之間的肽片段存在較大差異,且這個(gè)蛋白可與實(shí)驗(yàn)所示的肽片段覆蓋良好,則說明正確鑒定的可能性較大。
(2)肽片段(peptide fragment)的部分測(cè)序
肽質(zhì)指紋術(shù)對(duì)其自身而言,不能揭示所衍生的肽片段或蛋白質(zhì)。 為進(jìn)一步鑒定蛋白質(zhì),出現(xiàn)了一系列的質(zhì)譜方法用來描述肽片段。 用酶或化學(xué)方法從N-或C-末端按順序除去氨基酸,形成梯形肽片段(ladder peptide)。 首先以一種可控制的化學(xué)模式從N-末端降解,可產(chǎn)生大小不同的一系列的梯形肽片段,所得一定數(shù)目的肽質(zhì)量由MALDI-TOF-MS測(cè)量。 另一種方法涉及羧基肽酶的應(yīng)用,從C-末端除去不同數(shù)目的氨基酸形成肽片段。 化學(xué)法和酶法可產(chǎn)生相對(duì)較長(zhǎng)的序列,其分子量精確至以區(qū)別賴氨酸(128。09)和谷氨酰胺(128。06)。 或者,在質(zhì)譜儀內(nèi)應(yīng)用源后衰變(post-source decay, PSD)和碰撞誘導(dǎo)解離(collision-induced dissociation, CID),目的是產(chǎn)生包含有僅異于一個(gè)氨基酸殘基質(zhì)量的一系列肽峰的質(zhì)譜。 因此,允許推斷肽片段序列。 肽片段PSD的分析在MALDI反應(yīng)器上能產(chǎn)生部分序列信息。 首先進(jìn)行肽質(zhì)指紋鑒定。 之后,一個(gè)有意義的肽片段在質(zhì)譜儀被選作“母離子”,在飛行至離子反應(yīng)器的過程中降解為“子離子”。 在反應(yīng)器中,用逐漸降低的電壓可測(cè)量至檢測(cè)器的不同大小的片段。 但經(jīng)常產(chǎn)生不完全的片段。 現(xiàn)在用肽片段來測(cè)序的方法始于70年代末的CID,可以一個(gè)三聯(lián)四極質(zhì)譜ESI-MS或MALDI-TOF-MS聯(lián)合碰撞器內(nèi)來完成。 在ESI-MS中,由電霧源產(chǎn)生的肽離子在質(zhì)譜儀的第一個(gè)四極質(zhì)譜中測(cè)量,有意義的肽片段被送至第二個(gè)四極質(zhì)譜中,惰性氣體轟擊使其成為碎片,所得產(chǎn)物在第三個(gè)四極質(zhì)譜中測(cè)量。 與MALDI-PSD相比,CID穩(wěn)定、強(qiáng)健、普遍,肽離子片段基本沿著酰胺鍵的主架被轟擊產(chǎn)生梯形序列。 連續(xù)的片段間差異決定此序列在那一點(diǎn)的氨基酸的質(zhì)量。 由此,序列可被推測(cè)。 由CID圖譜還可獲得的幾個(gè)序列的殘基,叫做“肽序列標(biāo)簽”。 這樣,聯(lián)合肽片段母離子的分子量和肽片段距N- C端的距離將足以鑒定一個(gè)蛋白質(zhì)。
4 氨基酸組分分析
1977年首次作為鑒定蛋白質(zhì)的一種工具,是一種獨(dú)特的“腳印”技術(shù)。 利用蛋白質(zhì)異質(zhì)性的氨基酸組分特征,成為一種獨(dú)立于序列的屬性,不同于肽質(zhì)量或序列標(biāo)簽。 Latter首次表明氨基酸組分的數(shù)據(jù)能用于從2-DE凝膠上鑒定蛋白質(zhì)。 通過放射標(biāo)記的氨基酸來測(cè)定蛋白質(zhì)的組分,或者將蛋白質(zhì)印跡到PVDF膜上,在155℃進(jìn)行酸性水解1 h,通過這一簡(jiǎn)單步驟的氨基酸的提取,每一樣品的氨基酸在40min內(nèi)自動(dòng)衍生并由色譜分離,常規(guī)分析為100個(gè)蛋白質(zhì)/周。 依據(jù)代表兩組分間數(shù)目差異的分?jǐn)?shù),對(duì)數(shù)據(jù)庫中的蛋白質(zhì)進(jìn)行排榜,“冠軍”蛋白質(zhì)具有與未知蛋白質(zhì)最相近的組分,考慮冠亞軍蛋白質(zhì)分?jǐn)?shù)之間的差異,僅處于冠軍的蛋白質(zhì)的可信度大。 Internet上存在多個(gè)程序可用于氨基酸組分分析,如AACompIdent,ASA,F(xiàn)INDER,AAC-PI,PROP-SEARCH等,其中,在PROP-SEARCH中,組分、序列和氨基酸的位置被用來檢索同源蛋白質(zhì)。 但仍存在一些缺點(diǎn),如由于不足的酸性水解或者部分降解會(huì)產(chǎn)生氨基酸的變異。 故應(yīng)聯(lián)合其他的蛋白質(zhì)屬性進(jìn)行鑒定。