什麼是「語料庫語言學,語料庫語言學中的coding是什麼意思

2022-12-19 10:10:12 字數 4776 閱讀 4043

1樓:匿名使用者

語料庫語言學以語料庫為手段研究語言 ,是一門獨具特色的語言研究學科。語料庫是大量可用計算機處理的語料的集合。

2樓:吳蕙孝優樂

語料庫語言學是20世紀80年代才嶄露頭角的一門交叉學科,它研究自然語言文字的採集、儲存、加工和統計分析,目的是憑藉大規模語料庫提供的客觀翔實的語言證據來從事語言學研究和指導自然語言資訊處理系統的開發。

語料庫顧名思義就是放語言材料的倉庫。現在人們談起語料庫,不言而喻是指存放在計算機裡的原始文字或經過加工後帶有語言學資訊標註的語料文字。現在世界上已經有了不少規模較大的語料庫,有些是國家級的,有些由大學和詞典出版商聯合建設。

另外,由於個人微機的迅猛發展和存貯資料的硬碟造價持續下降,研究者個人也開始建立適合於自己研究的小型語料庫。

語料庫語言學(英文corpuslinguistics)這個術語有兩層主要含義。一是利用語料庫對語言的某個方面進行研究,即「語料庫語言學」不是一個新學科的名稱,而僅僅反映了一個新的研究手段。二是依據語料庫所反映出來的語言事實對現行語言學理論進行批判,提出新的觀點或理論。

只有在這個意義上「語料庫語言學」才是一個新學科的名稱。從現有文獻來看,屬於後一類的研究還是極個別的。所以,嚴格地說,現在不能把語料庫語言學跟語言學的分支,如社會語言學、心理語言學、語用學等相提並論。

近年來,隨著我國經濟的發展,科研經費的增加,漢語語料庫的建設得到了開展。2023年我院把建立漢語語料庫列為院重大課題。目前語言所正在構建三個大規模的語料庫:

現場即席話語語料庫,主要方言口語庫和現代漢語文字語料庫。在世界範圍內,我國的語料庫建設在規模上還趕不上歐洲的一些發達國家,特別是英國。然而,在語料庫語言學的研究上,以及語料庫的實際運用上,我國已經進入世界前沿的行列。

20世紀語言研究的總特點可以用四個字概括———高度抽象。最近幾十年來,語言研究的高度抽象傾向已經失去主導地位。這主要緣於兩個方面的因素:

一是計算機技術,特別是基於計算機處理的多**技術的飛速發展;二是社會語言學、語用學、會話分析、人類語言學、計算語言學、人機對話研究、語音識別與合成等研究取得令人矚目的成就。先前難以抓住並進行有效處理的五花八門的實際語料,現在可以對其進行大規模地的、自動的或人機配合的處理。比如個人發音特徵,先前認為這跟語言學毫無關係,現在成了偵破語音學的重要內容。

偵破語音學家首先建立個人發音特徵語料庫,這個語料庫可以用來鑑別嫌疑犯。概言之,當今的語言研究由先前的高度抽象逐步走向最具體的語言的實際活動,其中包括神經元的運動。比如神經語言學就是要揭開人類大腦神經是如何處理語言這個祕密的學科。

語料庫和語料庫語言學在當今語言研究由高度抽象轉向語言的實際使用這個過渡中起著十分重要的作用:一是提供真實語料;二是提供統計資料;三是驗證現行的理論;四是構建新的理論。這些可以說是語料庫和語料庫語言學的實用價值。

提供真實語料可以說是詞典編纂的生命線。現在流行的英語詞典幾乎全部是基於大規模語料庫編纂而成的。基於大規模語料庫的英語語法書也已經問世。

通過大規模語料庫建立統計模型成為語言資訊處理和加工的主流模式。先前基於規則的機器翻譯、語音合成與識別、文語轉換等如沒有大規模語料庫的資料支援,要取得好成果是不可能的。在理論建設上,基於英國國家語料庫英語口語庫的研究表明,基於真實英語口語語料的英語口語語法跟基於書面語的語法大不相同,甚至可以誇張地說,是不同的語法。

在歐洲,語料庫語言學已經成為語言學的主流分支。相信在注重語言實際的我國,語料庫語言學也將受到越來越多的研究者的重視,取得豐碩的成果。

參考資料:中國社會科學院院報

語料庫語言學中的coding是什麼意思

3樓:平常心新號

coding

編碼例如:

you'll also notice a bit of color coding on the maps.

你同樣會注意到地圖上有一些彩色編碼。

must be able to design and set up the page, including any necessary codingwork.

必須能夠設計和建立網頁,包括任何必要的編碼工作。

however, if accompanied by a physician, up to three office coding staff mayalso attend.

但是,如果由醫生陪同下,最多三個辦公室編碼人員也可參加。

什麼是語料庫?

4樓:讓勾子飛一會

語料庫中存放的是在語言的實際使用中真實出現過的語言材料。

1、語料庫

是語料庫語言學研究的基礎資源,也是經驗主義語言研究方法的主要資源。應用於詞典編纂,語言教學,傳統語言研究,自然語言處理中基於統計或例項的研究等方面。

2、語料庫分類

異質的、同質的、系統的、專用的。

3、語料庫特徵

語料庫中存放的是在語言的實際使用中真實出現過的語言材料,因此例句庫通常不應算作語料庫;語料庫是承載語言知識的基礎資源,但並不等於語言知識;真實語料需要經過加工(分析和處理),才能成為有用的資源。

5樓:匿名使用者

語料庫語言學

語料庫語言學是20世紀80年代才嶄露頭角的一門交叉學科,它研究自然語言文字的採集、儲存、加工和統計分析,目的是憑藉大規模語料庫提供的客觀翔實的語言證據來從事語言學研究和指導自然語言資訊處理系統的開發。

語料庫顧名思義就是放語言材料的倉庫。現在人們談起語料庫,不言而喻是指存放在計算機裡的原始文字或經過加工後帶有語言學資訊標註的語料文字。現在世界上已經有了不少規模較大的語料庫,有些是國家級的,有些由大學和詞典出版商聯合建設。

另外,由於個人微機的迅猛發展和存貯資料的硬碟造價持續下降,研究者個人也開始建立適合於自己研究的小型語料庫。

語料庫語言學(英文corpuslinguistics)這個術語有兩層主要含義。一是利用語料庫對語言的某個方面進行研究,即「語料庫語言學」不是一個新學科的名稱,而僅僅反映了一個新的研究手段。二是依據語料庫所反映出來的語言事實對現行語言學理論進行批判,提出新的觀點或理論。

只有在這個意義上「語料庫語言學」才是一個新學科的名稱。從現有文獻來看,屬於後一類的研究還是極個別的。所以,嚴格地說,現在不能把語料庫語言學跟語言學的分支,如社會語言學、心理語言學、語用學等相提並論。

近年來,隨著我國經濟的發展,科研經費的增加,漢語語料庫的建設得到了開展。2023年我院把建立漢語語料庫列為院重大課題。目前語言所正在構建三個大規模的語料庫:

現場即席話語語料庫,主要方言口語庫和現代漢語文字語料庫。在世界範圍內,我國的語料庫建設在規模上還趕不上歐洲的一些發達國家,特別是英國。然而,在語料庫語言學的研究上,以及語料庫的實際運用上,我國已經進入世界前沿的行列。

20世紀語言研究的總特點可以用四個字概括———高度抽象。最近幾十年來,語言研究的高度抽象傾向已經失去主導地位。這主要緣於兩個方面的因素:

一是計算機技術,特別是基於計算機處理的多**技術的飛速發展;二是社會語言學、語用學、會話分析、人類語言學、計算語言學、人機對話研究、語音識別與合成等研究取得令人矚目的成就。先前難以抓住並進行有效處理的五花八門的實際語料,現在可以對其進行大規模地的、自動的或人機配合的處理。比如個人發音特徵,先前認為這跟語言學毫無關係,現在成了偵破語音學的重要內容。

偵破語音學家首先建立個人發音特徵語料庫,這個語料庫可以用來鑑別嫌疑犯。概言之,當今的語言研究由先前的高度抽象逐步走向最具體的語言的實際活動,其中包括神經元的運動。比如神經語言學就是要揭開人類大腦神經是如何處理語言這個祕密的學科。

語料庫和語料庫語言學在當今語言研究由高度抽象轉向語言的實際使用這個過渡中起著十分重要的作用:一是提供真實語料;二是提供統計資料;三是驗證現行的理論;四是構建新的理論。這些可以說是語料庫和語料庫語言學的實用價值。

提供真實語料可以說是詞典編纂的生命線。現在流行的英語詞典幾乎全部是基於大規模語料庫編纂而成的。基於大規模語料庫的英語語法書也已經問世。

通過大規模語料庫建立統計模型成為語言資訊處理和加工的主流模式。先前基於規則的機器翻譯、語音合成與識別、文語轉換等如沒有大規模語料庫的資料支援,要取得好成果是不可能的。在理論建設上,基於英國國家語料庫英語口語庫的研究表明,基於真實英語口語語料的英語口語語法跟基於書面語的語法大不相同,甚至可以誇張地說,是不同的語法。

在歐洲,語料庫語言學已經成為語言學的主流分支。相信在注重語言實際的我國,語料庫語言學也將受到越來越多的研究者的重視,取得豐碩的成果。

參考資料:中國社會科學院院報

6樓:匿名使用者

corpus linguistics

語料庫語言學(corpus linguistics)就是一門與語料庫直接有關的語言學科。但是語料庫語言學與其它各種加修飾語的語言學科不同:別的語言學科基本上都是研究有關領域...

語料庫語言學(corpus linguistics)就是一門與語料庫直接有關的語言學科。但是語料庫語言學與其它各種加修飾語的語言學科不同:別的語言學科基本上都是研究有關領域與語言之間的關係,例如,社會語言學研究的是社會與語言的關係,心理語言學研究的是人的心理活動與語言之間的關係。

而語料庫語言學則不同,它只是以語料庫為手段來研究語言。語料庫是載有語言資訊的大量語言資料的集合。語料庫中的語料可以是為了特定目的而收集的語言資料(如對講母語的發音合作人的採訪記錄,也可以是某一特定範圍的書面材料,如中古英語語料),也可以是為了一般語言研究的目的而收集的語言資料(如自然會話的轉寫資料和報刊雜誌書籍的文字資料)。

如何評價語料庫語言學的研究方法

7樓:那時咱倆正好

通過定性與定量相結合的研究發現,網路體育英語新聞標題在詞彙、結構、時態和修辭方面具有自身獨特文體特徵:新聞標題的平均詞長比一般文體稍長,並常通過省略虛詞、使用縮略語、短小詞彙、複合詞、詞性轉換、大量動詞片語、一般現在時態以及暗喻、換喻和雙關等多種修辭手法來豐富新聞的描寫。

語言學概論語言學是一門什麼學問,語言學概論學什麼以及考試內容

語言學概論 是漢語言文學專業的一門必修的專業基礎課,本課程介紹有關人類語言的性質 結構規律 發展演變規律以及語言與文字的關係等方面的基礎理論知識。語言學概論 是 普通語言學 理論語言學 的基礎課,它注重考察人類語言的共同規律和普遍特徵,而不是學習研究某一具體語言。這是它與現代漢語 古代漢語和現代英語...

語言學和應用語言學是學什麼的呢,語言學和應用語言學是學什麼的呢?

語言學 linguistics 是以人類語言為研究物件的學科,探索範圍包括語言的性質 功能 結構 運用和歷史發展,以及其他與語言有關的問題。語言學被普遍定義為對語言的一種科學化 系統化的理論研究。並且語言是人類最重要的交際工具 是思想的直接現實。主幹學科 中國語言文學 主要課程 語言學概論 古代漢語...

認知語言學的哲學是什麼,什麼是認知語言學

認知語bai言學的哲學基礎是體驗哲學 duembodiment philosophy 綜觀zhi認知語言學的各種重要dao 理論 原型理論 概 內念隱喻容 概念轉喻 基本層次範疇 心理空間 色彩範疇 理想化認知模型 它們都是以 體驗性假說 為哲學基礎的。johnson lakoff這樣概括道 從最深...