單克隆抗體已成為了當(dāng)今發(fā)展最為迅速的治療藥物之一。據(jù)預(yù)測(cè),到 2028 年其全球銷售額將達(dá)到 3466 億美元。在抗體工程及研發(fā)領(lǐng)域的不斷推進(jìn)下,基于抗體的治療藥物結(jié)構(gòu)變得愈發(fā)復(fù)雜精密(例如雙特異性抗體和CAR-T)。近年來,隨著高通量單 B 細(xì)胞測(cè)序以及血清抗體蛋白質(zhì)組學(xué)方面的技術(shù)突破,直接從內(nèi)源 B 細(xì)胞或循環(huán)抗體中鑒定出高親和力抗體已成為現(xiàn)實(shí)。此外,人工智能領(lǐng)域的發(fā)展也為抗體發(fā)現(xiàn)和設(shè)計(jì)注入了強(qiáng)大動(dòng)力。本文介紹了這些技術(shù)在抗體組庫(antibody repertoire)分析中的應(yīng)用進(jìn)展及發(fā)展趨勢(shì)。
抗體組庫的組成
體液免疫的保護(hù)能力依賴于復(fù)雜且多變的抗體組庫,這些抗體可以特異性識(shí)別抗原并介導(dǎo)免疫應(yīng)答。B 細(xì)胞受體(BCR)是分泌型抗體的膜蛋白前體形式,每個(gè)B細(xì)胞產(chǎn)生一個(gè)獨(dú)特的BCR。在抗原識(shí)別后,一部分 B 細(xì)胞可分化為漿細(xì)胞,主動(dòng)分泌可溶性抗體,這些抗體能夠結(jié)合病原體并促進(jìn)其被清除。因此,個(gè)體的抗體組庫被定義為完整BCR庫以及分泌型抗體庫的集合,它包含了兩個(gè)在克隆和功能上有所不同但相互關(guān)聯(lián)的部分(圖1)。據(jù)估算,人類的抗體組庫包含約 1015個(gè)獨(dú)特序列,因此深入描繪這一復(fù)雜群體的全貌面臨著極大的挑戰(zhàn)。借助先進(jìn)技術(shù)手段對(duì)抗體組庫的轉(zhuǎn)錄、選擇機(jī)制,以及抗原-抗體相互作用展開研究,將極大地加快抗體藥物的研究、開發(fā)以及臨床轉(zhuǎn)化進(jìn)程。
圖1 人類抗體組庫的分析。(左下)基于基因測(cè)序方法分析B細(xì)胞表達(dá)的BCR庫;(左上)基于蛋白組學(xué)方法分析生物體液中的分泌型抗體庫;(右方)人工智能(AI)工具加速抗體研發(fā)[1]
基于BCR測(cè)序的抗體組庫研究
基于基因測(cè)序的抗體組庫分析長(zhǎng)期以來依賴第二代短讀長(zhǎng)平臺(tái)(讀長(zhǎng)小于600個(gè)堿基對(duì)),例如由Illumina開發(fā)的測(cè)序儀是 BCR測(cè)序的金標(biāo)準(zhǔn)。目前發(fā)展的第三代長(zhǎng)讀長(zhǎng)測(cè)序平臺(tái)(如Pacific Biosciences 和 Oxford Nanopore Technologies)可提供更長(zhǎng)的讀長(zhǎng)(大于1萬個(gè)堿基對(duì)),隨著其在準(zhǔn)確性、通量以及成本降低方面取得的進(jìn)展,正在逐步成為抗體組庫分析的有力替代選擇。例如,長(zhǎng)讀長(zhǎng)測(cè)序可以分析不同個(gè)體之間免疫球蛋白重鏈(IGH)的基因組變異;可以可靠地對(duì)抗體進(jìn)行同種型和亞型鑒定;還可以揭示在諸如癌癥等各類病癥中,抗體同種型亞型存在的偏好性。長(zhǎng)讀長(zhǎng)測(cè)序可以提高輕重鏈可變區(qū)配對(duì)的準(zhǔn)確性和可靠性,通過分析基因的使用情況和功能,可以發(fā)現(xiàn)不同疾病狀態(tài)下的“公共抗體”,能夠作為評(píng)估疫苗有效性的可靠生物標(biāo)志物。
單細(xì)胞分析領(lǐng)域的技術(shù)突破使得大量的BCR庫數(shù)據(jù)能夠與基于多組學(xué)的各類數(shù)據(jù)集相整合。單細(xì)胞轉(zhuǎn)錄組學(xué)平臺(tái)在剖析接種疫苗、感染以及自身免疫應(yīng)答等情形下 B 細(xì)胞亞群之間的表型及功能差異方面發(fā)揮著關(guān)鍵作用。通過一項(xiàng)LIBRA-seq技術(shù),可以結(jié)合抗原特異性評(píng)估和BCR測(cè)序。它利用流式細(xì)胞術(shù)分離出與帶有熒光標(biāo)記和條形碼的抗原相結(jié)合的 B 細(xì)胞,通過測(cè)序獲得它們的BCR序列,同時(shí)獲得每個(gè)細(xì)胞相結(jié)合的抗原信息。對(duì)于不表達(dá)BCR的抗體分泌細(xì)胞(ASCs),通過一種名為TRAPnSeq的技術(shù),可以在ASCs表面捕獲其分泌的抗體,結(jié)合帶條形碼及熒光標(biāo)記的抗原分選和單細(xì)胞測(cè)序,獲得對(duì)應(yīng)的抗原-抗體信息。整合功能篩選和BCR測(cè)序的各項(xiàng)技術(shù)發(fā)展,目前正推動(dòng)以高通量的方式識(shí)別分泌型抗體庫中具有功能的克隆,助力深入理解BCR特性、實(shí)現(xiàn)對(duì)適應(yīng)性B細(xì)胞應(yīng)答的精準(zhǔn)調(diào)控?!?/p>
基于蛋白組學(xué)方法的免疫組庫研究
盡管基于BCR測(cè)序的免疫組庫研究已取得許多進(jìn)展,然而不可忽視的是,外周血中存在的BCR并不能保證其會(huì)以分泌型抗體的形式存在。這一客觀事實(shí)導(dǎo)致僅通過BCR測(cè)序不能深入了解血漿和黏膜分泌物中抗體的真實(shí)組成和豐度。隨著蛋白質(zhì)組學(xué)策略的進(jìn)步,可以以全新的視角和方式,實(shí)現(xiàn)人體內(nèi)抗體的特性、功能及作用靶點(diǎn)分析。
自下而上蛋白組學(xué)
自下而上蛋白質(zhì)組學(xué)方法通過將抗體酶切成肽段,通過液質(zhì)聯(lián)用(LC-MS/MS)進(jìn)行分析,與BCR測(cè)序數(shù)據(jù)庫進(jìn)行對(duì)比實(shí)現(xiàn)鑒定。該方法可以直接從多抗混合物中鑒定并定量數(shù)百種抗體譜系,但能否可靠地鑒定抗體譜系往往取決于能否檢測(cè)到獨(dú)特的互補(bǔ)決定區(qū)-H3(CDR-H3)肽段。這種傳統(tǒng)的基于數(shù)據(jù)庫比對(duì)的方法盡管已取得一定突破,但是在獲得輕重鏈正確配對(duì)抗體的精準(zhǔn)全長(zhǎng)序列方面仍面臨挑戰(zhàn)。
自上而下和自中而下蛋白質(zhì)組學(xué)
與自下而上蛋白質(zhì)組學(xué)不同,自上而下方法不對(duì)蛋白進(jìn)行酶切,而是將其直接通過LC-MS/MS進(jìn)行分析,從而實(shí)現(xiàn)更好的序列覆蓋度,改善抗體鑒定效果。然而完整抗體分子量較大(約150kda),且電荷數(shù)多,使得該方法面臨重大挑戰(zhàn)。目前該方法主要被用于高度純化的單抗分析,例如糖基化、氧化、脫酰胺等分析。自中而下蛋白組學(xué)方法,是將抗體酶切成50-100 Kda的片段(Fab 或 F (ab’) 2),實(shí)現(xiàn)降低樣本復(fù)雜程度,提高鑒定效率。該方法可以產(chǎn)生覆蓋CDRs的碎片離子,從而保留輕重鏈可變區(qū)的配對(duì)信息。自上而下/自中而下蛋白質(zhì)組學(xué)相結(jié)合的方法,能夠?qū)碜匝獫{的內(nèi)源性抗體進(jìn)行檢測(cè)。通過結(jié)合這些方法,也有研究實(shí)現(xiàn)了單種血漿抗體的從頭測(cè)序。
整合抗體序列、結(jié)構(gòu)與特異性的計(jì)算工具
隨著人工智能模型的發(fā)展,其為理解抗體-抗原相互作用提供了有力工具。但它們?nèi)悦媾R如CDRs結(jié)構(gòu)預(yù)測(cè)、抗體-抗原相互作用、結(jié)合親和力與中和活性優(yōu)化、抗體可開發(fā)性等挑戰(zhàn)。例如AlphaFold 2在單體蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面極為成功,而對(duì)多聚蛋白,如對(duì)抗體-抗原復(fù)合物預(yù)測(cè)成功率較低。除直接結(jié)構(gòu)預(yù)測(cè)外,其他計(jì)算工具也被開發(fā)用于血清多抗中抗原特異性抗體的高分辨率結(jié)構(gòu)表征,如從冷凍電鏡圖譜預(yù)測(cè)抗體序列的工具可預(yù)測(cè)抗體的特性及表位。隨著冷凍電鏡解析的抗體結(jié)構(gòu)數(shù)量不斷增加和人工智能技術(shù)發(fā)展,目前的計(jì)算模型已具備從頭設(shè)計(jì)抗體的能力,但其優(yōu)化依賴于整合全面理解抗體組庫的數(shù)據(jù)。血漿抗體具備體內(nèi)可分泌性、穩(wěn)定性、溶解性、免疫原性最小化等特征,因此相關(guān)數(shù)據(jù)可為從頭設(shè)計(jì)抗體提供有利信息并可能減少抗體開發(fā)過程中的瓶頸問題。
關(guān)鍵點(diǎn)
1. 對(duì)抗體組庫的深入研究將助力抗體開發(fā)、增進(jìn)免疫應(yīng)答機(jī)制理解、促進(jìn)人工智能技術(shù)在抗體研究領(lǐng)域中的應(yīng)用。
2. 免疫組庫由BCR和分泌型抗體,這兩個(gè)在克隆和功能上不同但相互關(guān)聯(lián)的抗體庫組成,僅通過基因測(cè)序的方法無法洞察免疫組庫的全貌。
3. Rapid Novor(快序生物)的REpAb(圖2)是全球唯一實(shí)現(xiàn)直接對(duì)血清多抗測(cè)序,獲得輕重鏈正確配對(duì),經(jīng)親和力驗(yàn)證的抗體序列的技術(shù),可以用于治療性抗體發(fā)現(xiàn)、揭秘分泌型抗體庫組成、促進(jìn)對(duì)免疫組庫的深入理解、助力抗體行業(yè)蓬勃發(fā)展[2]。
圖2 REpAb抗體發(fā)現(xiàn)技術(shù)可以對(duì)人血清多抗測(cè)序獲得優(yōu)質(zhì)中和抗體[2]
參考文獻(xiàn)
[1]Townsend DR, Towers DM, Lavinder JJ, Ippolito GC. Innovations and trends in antibody repertoire analysis. Curr Opin Biotechnol. 2024 Apr;86:103082. doi: 10.1016/j.copbio.2024.103082.
[2] Le Bihan T, Nunez de Villavicencio Diaz T, Reitzel C, Lange V, Park M, Beadle E, Wu L, Jovic M, Dubois RM, Couzens AL, Duan J, Han X, Liu Q, Ma B. De novo protein sequencing of antibodies for identification of neutralizing antibodies in human plasma post SARS-CoV-2 vaccination. Nat Commun. 2024 Oct 10;15(1):8790. doi: 10.1038/s41467-024-53105-8.