《計算語言學研究繫列:先秦文獻信息處理》研究先秦文獻的信息處理,包括先秦文獻的詞彙處理、歷史知識處理以及詞彙與歷史知識的智能檢索。對先秦文獻做詞彙處理,目的在於追本溯源,了解先秦漢語詞彙的基本面貌。用計算語言學方法梳理這一時期的歷史事件、人名、地名等知識,有助於更好地理解先秦文獻。與現當代中文文獻相比,先秦傳世文獻規模很小,但相關的注疏文獻十分豐富。因此《計算語言學研究繫列:先秦文獻信息處理》采用了與一般中文信息處理不同的方法——基於注疏文獻的方法。對比實驗表明,這種方法在先秦文獻信息處理中具有顯著優勢。