BERT模型在2018年一問世便引起了轟動。之後,各種改進版本的預訓練模型(Pre-Training Model,PTM)如過江之鯽,層出不窮,它們在 NLP 各個領域攻城略地,所向披靡,頻頻登榜於多種 NLP 數據集競賽榜單,個別模型的能力已超過人類。
BERT模型在刷新傳統NLP指標的同時,也給NLP領域的技術帶來革命性的變革。它使用帶有注意力模型的深度神經網絡所實現的效果,優於一大批使用傳統的NLP方法所實現的效果,這使得NLP工作人員不得不向BERT模型的技術體繫靠攏。
與此同時,近年來,圖神經網絡的崛起也為深度學習領域指明了前進的方向——BERT模型結合圖深度學習將是未來NLP的主流趨勢。
本書從零基礎開始,介紹了與BERT模型相關的一繫列知識與實現方法,包括神經網絡的原理、NLP基礎、PyTorch的使用、BERT模型的原理及實現、BERTology繫列模型的原理及實現,以及BERT模型與圖神經網絡的結合。
本書適合於即將從事NLP工作,以及正在從事NLP工作並打算向BERT模型技術體繫靠攏的讀者閱讀。
總的來說,本書具有以下特色。
1.知識繫統,逐層遞進
本書涵蓋了BERT模型的完整技術體繫:
從神經網絡的基礎知識,到NLP的基礎知識,再到BERT模型的原理及應用;
從BERTology繫列模型的原理,到BERT模型與圖神經網絡的結合,再到多種場景下BERT模型的應用。
2.內容緊跟技術趨勢
本書所介紹的知識與近年來學術領域發表的論文技術基本同步。為了拓展讀者的學習視野,本書在介紹一些知識的原理和應用的同時,還附有相關的論文索引,方便讀者對感興趣的知識擴展閱讀。
3.圖文結合,化繁為簡。
本書在介紹模型的結構和原理的同時,還穿插了大量的圖片。這些圖片有的可視化了模型中的數據流向,有的展示了模型的擬合能力,有的細化了某種技術的內部原理,有的直觀化了模型的內部結構,從而讓讀者更容易、更快捷地理解和掌握知識。
4.站在入門者的角度講解,內容更繫統、更易學
考慮到初學者知識儲備的不足,凡是書中涉及的知識點,都從零開始進行繫統介紹:從PyTorch框架的安裝、使用;到向量、矩陣、張量的基礎變換;再到神經網絡及圖神經網絡的繫統介紹;從NLP基礎,到BERT模型的原理剖析,再到BERT模型的多場景實戰。這樣可以消除讀者學習中的跳躍感。