對于人文研究來說,計算方法以往只是作為輔助手段而存在的,而今天已取得了不可替代的地位。一種新的人文研究形態(tài)應運而生,這就是“數(shù)字人文”。學者莫萊蒂曾設想一種建立在全部文學文本之上的世界文學研究,人們必須借助計算機對大規(guī)模的文學文本集合進行采樣、統(tǒng)計、圖繪、分類,描述文學史的總體特征,然后再做文學評論式的解讀。為此,他提出了與“細讀”相對的“遠讀”作為方法論。弄清計算機的遠讀與人的細讀之間的差別,不僅能使我們清晰地界定計算方法在人文研究中的作用,而且可以幫助我們重新確立人的閱讀的價值。
計算機是為科學計算而創(chuàng)造出來的,擅長的是“計數(shù)”,而非“理解”。要處理自然語言文本,計算機必須先將文本置換成便于計數(shù)的詞匯集合,或者用更復雜的代數(shù)模型和概率模型來表示文本,這一過程被稱為“數(shù)據(jù)化”。數(shù)據(jù)化之后所得到的文本替代物(集合、向量、概率)雖然損失了原始文本的豐富語義,但終究是可以計算的了,不過,盡管計算機能處理海量的語料,執(zhí)行復雜的統(tǒng)計、分類、查詢等任務,但它并不能理解文本的內(nèi)容。
遠讀是數(shù)字人文的基石,大規(guī)模的文本集合上的遠讀,基本可以歸為兩類:一是對文本集合整體統(tǒng)計特征的描述,一是對文本集合內(nèi)在結構特征的揭示。例如,數(shù)字人文學者米歇爾等人對數(shù)百萬冊數(shù)字化圖書進行多種詞匯和詞頻統(tǒng)計,以分析英語世界的語言演變,這屬于前者;莫萊蒂用地圖、樹結構來分別展示文學作品的地理特征和偵探故事的類型結構,這屬于后者。無論是宏觀統(tǒng)計描述還是內(nèi)在結構揭示,都是超越文本具體內(nèi)容的抽象表示,所得結果都是需要解讀的。正如米歇爾所說,在巨量文本集合上得到的統(tǒng)計分析結果,為人文材料的宏觀研究提供了證據(jù);但是要解讀這些證,就像分析古代生物化石一樣,是有挑戰(zhàn)性的。對遠讀結果的解讀,仍然要依賴學者在細讀文本礎上所建立起來的對本領域的認知和理解,一句話,人的閱讀不可替代。
需要補充的是,當考察單篇文本的.文本特征(例如計算一篇文檔中所有單字的出現(xiàn)頻率),或者分析其內(nèi)部結構(例如提取一部小說中所有人物的對話網(wǎng)絡)時,數(shù)據(jù)量也會增長到個人無法處理的程度,所以,上述對文本集合所做的討論在單篇文本層面也是成立的。
一個普遍存在的對數(shù)字人文的評判依據(jù),是看數(shù)字人文能不能更好地回答傳統(tǒng)人文學者所關心的問題。嚴格說來,只有當數(shù)據(jù)量或者數(shù)據(jù)精度超出了個人閱讀理解的能力范圍時,才有理由借助計算機來對文本或者文本集合的特征予以量化描述,進而提供給人去進行深入解讀,數(shù)字人文不僅僅是新的手段和方法,更重要的是,它賦予我們提出新問題的能力。我們現(xiàn)在可以問,五千年來全人類使用最頻繁的詞是什么,透過這類問題,可以獲得觀察超長歷史時段文化現(xiàn)象的新視角。
。ㄕ幾酝踯姟稄娜宋挠嬎愕娇梢暬獢(shù)字人文的發(fā)展脈絡梳理》)
1.下列關于原文內(nèi)容的理解和分析,不正的一項是(3分)
A.在數(shù)字人文的概念提出之前,計算方法已被引入人文領域,在研究中發(fā)揮作用。
B.要實現(xiàn)莫萊蒂設想的世界文學研究,首先應進行大規(guī)模的文學文本集合的數(shù)據(jù)化。
C.選擇遠讀還是細讀的方法,取決于閱讀的對象是大規(guī)模的文本集合還是單篇文本。
D.數(shù)字人文不僅為文本處理提供了新的手段和方法,而且為人文研究提供了新視角。
2.下列對原文論證的相關分析,不正確的一項是(3分)
A.文章區(qū)分“計數(shù)”與“理解”,是為了論證計算機不能處理某些特定類型的文本。
B.文章轉述數(shù)字人文學者米歇爾本人的說法,有助于論證應該更全面地看待遠讀。
C.文章第四段討論單篇文本層面的問題,對前文補充論證,使得論證更加周密。
D.文章同時肯定計算機遠讀和人的細讀的作用,有助于避免人們對遠讀的誤解。
3.根據(jù)原文內(nèi)容,下列說法正確的一項是(3分)
A.人文研究的主體,在數(shù)字人文中實現(xiàn)了從具體的學者個人向計算機的轉變。
B.遠讀不是要深化對文本內(nèi)容的理解,而是要發(fā)掘文本集合的共同形式特征。
C.數(shù)字人文的價值,在于將歷史上未被注意和閱讀的文本都進行數(shù)據(jù)化并做研究。
D.和人的細讀相比,遠讀的理念和做法體現(xiàn)出大數(shù)據(jù)時代文理融合的跨學科取向。
答案:
(一)
1. C2.A3.D
【《從人文計算到可視化——數(shù)字人文的發(fā)展脈絡梳理》閱讀練習及答案】相關文章:
2.閱讀練習及答案