Розмір шрифту

A

Корпусна лінгвістика

КО́РПУСНА ЛІНГВІ́СТИКА  — галузь мовознавства, предме­­том дослідження якої є принципи та методи формування корпусів текстів, а також розроб­­лення комп’ютерних систем для їхнього опрацювання. Корпус розглядають як модель мовної системи, реалізовану в текстах різних функціонал. стилів, струк­­тури, тематики, призначення, території та часу їх створення. Залежно від призначення виділяють фундам. і пошукові (дослідн.) корпуси, для роботи з якими створюють спец. текстові процесори — системи опрацювання інформації про мовні оди­­ниці морфол., синтаксич., логіко-семантич. структур. рівнів тексту. Такі системи зорієнтовані на анотацію (розмічення) тексту, яка передбачає формаліз. виділення у ньому мовних одиниць певних типів. Завдяки наявності автоматиз. засобів аналізу інформації корпуси при­­датні для виконання за допомогою комп’ютера теор. і практ. завдань мовознавства. За повнотою подання текстів, їхнім структуруванням та наявністю засобів автоматиз. аналізу корпуси відрізняють від електрон. б-к, картотек і баз цитат. Сучасні нац. корпуси мають здебільшого фундам. характер, їхній обсяг сягає 200 і більше млн слововживань. Такими є, напр., Британ. нац. корпус (British Na­­tional Corpus), Нац. корпус рус. языка, Narodowy Korpus Ję­­zy­ka Polskiego або корпус текстів (Frantext) для укладення словника «Trésor de la langue fran­­çaise» («Скарбниця французької мови»). Корпуси текстів різних типів та призначення мають естон., італ., китай., нім., польс., рос., серб., словен., словац., турец., укр. і чес. мови. В Україні перші корпуси україномовних текстів з’явилися у 1990-х pp., зокрема корпус наук.-реферат. та публіцист. текстів, на базі якого співроб. відділу структурно-матем. лінгвістики (нині у скла­­ді Інституту української мови НАНУ, Київ) створили систему автомат. орфогр. контролю тексту «Рута» та систему машинного рос.-укр. і укр.-рос. перекладу «Плай», а також корпус укр. худож., публіцист. і наук. текстів, сформов. у лаб. комп’ютер. лінгвістики Ки­­їв. університету. Над укладанням фундам. нац. корпусів україномовних текстів працюють науковці Укр. мовно-інформ. фонду НАНУ (Київ) та Інституту української мови НАНУ. Від 2009 при Міжнар. комітеті сла­­вістів працює Комісія з корпус. лінгвістики на чолі з М. Лазинським (Варшава), яка координує діяльність розробників корпусів слов’ян. мов. Від 1996 ви­­ходить «International Journal of Corpus Linguistics».

Рекомендована література

Іконка PDF Завантажити статтю

Інформація про статтю


Автор:
Статтю захищено авторським правом згідно з чинним законодавством України. Докладніше див. розділ Умови та правила користування електронною версією «Енциклопедії Сучасної України»
Дата останньої редакції статті:
груд. 2014
Том ЕСУ:
14
Дата виходу друком тому:
Тематичний розділ сайту:
Мова і література
EMUID:ідентифікатор статті на сайті ЕСУ
5251
Вплив статті на популяризацію знань:
990
Бібліографічний опис:

Корпусна лінгвістика / Є. А. Карпіловська // Енциклопедія Сучасної України [Електронний ресурс] / редкол. : І. М. Дзюба, А. І. Жуковський, М. Г. Железняк [та ін.] ; НАН України, НТШ. – Київ: Інститут енциклопедичних досліджень НАН України, 2014. – Режим доступу: https://esu.com.ua/article-5251.

Korpusna linhvistyka / Ye. A. Karpilovska // Encyclopedia of Modern Ukraine [Online] / Eds. : I. М. Dziuba, A. I. Zhukovsky, M. H. Zhelezniak [et al.] ; National Academy of Sciences of Ukraine, Shevchenko Scientific Society. – Kyiv : The NASU institute of Encyclopedic Research, 2014. – Available at: https://esu.com.ua/article-5251.

Завантажити бібліографічний опис

ВСІ СТАТТІ ЗА АБЕТКОЮ

Нагору нагору