Розмір шрифту

A

Комп’ютерна лінгвістика

КОМПʼЮ́ТЕРНА ЛІНГВІ́СТИКА — галузь мовознавства, що ви­вчає мову за допомогою компʼю­тера, а також створює лінгвістичне забезпече­н­ня для компʼю­терних систем опрацюва­н­ня ін­­формації. Як самост. наук. напрям сформувалася в 1960-і рр. на базі досягнень структур., матем. та приклад. лінгвістики, лінгвосеміотики, а також обчислюв. техніки, кібернетики й інформатики. Появу К. л. спричинила потреба су­спільства в нових оператив. способах опрацюван­­ня мовної інформації, зокрема необхідність створе­н­ня систем машин. пере­кладу, в основу яких покладено формал. аналоги мо­ви. У світ. науці сформувалося широке ро­зумі­н­ня обʼєкта й пред­мета ви­вче­н­ня К. л., що роз­вʼязує як фундам. теор., так і прикладні зав­да­н­ня сучас. мо­­во­­знавства. До фундам. зав­­дань належить створе­н­ня моделей мовних явищ і процесів, придат. для опрацюва­н­ня ком­пʼю­тером, що перед­бачає виявле­н­ня таких закономірностей будови та функціонува­н­ня мови, які можна описати з викори­ста­н­ням формал.-логіч. і матем. методів. Різнотипні моделі мови — статичні й динам., дедуктивні й індуктивні, аналіт. (інтер­претац.) й синтетичні (генеративні, поро­джувальні) — закладають основу для роз­вʼяза­н­ня практич. зав­­дань компʼютер. опрацюва­н­ня мовної інформації: автоматич. укла­да­н­ня словників, створе­н­ня систем машин. пере­кладу, ін­­форм.-пошук., навч. та екс­перт. систем, корпусів мови, аналіза­­торів і синтезаторів усного мов­ле­н­ня. Провід. напрямами сучас. К. л. є компʼютерна лексико­графія, корпусна лінгвістика, автоматич. аналіз текс­ту. З появою Інтернету формується новий напрям — мережна лінгвістика, або інтернет-лінгвістика.

В укр. мово­знавстві перші праці в цій галузі зʼявилися в серед. 1960-х рр. і були повʼязані з моделюва­н­ням штуч. інтелекту, ви­вче­н­ням статистич. закономірностей письмового й усно­го мовле­н­ня, створе­н­ням формал. граматик мови. Основи К. л. в Україні заклали від­діли докум. інформ. систем на чолі з Е. Скоро­ходьком та роз­пі­знава­н­ня й син­­тезу звук. образів під керівництвом Т. Вінцюка Ін­ституту кібернетики АН УРСР, від­діл структурно-матем. лінгвістики Ін­ституту мово­знавства АН УРСР (обидва — нині НАНУ) на чолі з В. Пере­бийніс, 1986–2004 його очолювала Н. Клименко (від 2011 — у складі Ін­ституту української мови НАНУ, зав. — Є. Карпілов­ська; усі — Київ), каф. матем. лін­гвістики Київ. університету під керівництвом Ф. Нікітіної (1985 реорганізов. у каф. матем. інформатики, яку очолив А. Анисимов), каф. заг. та приклад. мово­знавства Хар­ків. університету на чолі з В. Акуленком (нині зав. — І. Кравчук). Сьогодні в Україні над про­блемами К. л. працюють також Укр. мовно-інформ. фонд НАНУ (Київ; дир. — В. Широков), лаб. компʼю­тер. лінгвістики Київ. університету (зав. — Н. Дарчук), Київ. лінгвіст. університету (зав. — Т. Бобкова). У роз­виток теор. бази укр. К. л. вагомий внесок зробили А. Білецький, В. Пере­бийніс, Е. Скороходько, Ф. Нікітіна, Н. Клименко, І. Севбо, М. Пещак, В. Войнов, І. Штерн, Л. Пшенична, М. Муравицька, Л. Орлова, Т. Грязнухіна. Укр. науковці роз­вивають також ідеї світ. К. л., втілені в працях С. Шау­­мяна, М. Андреєва, Ю. Апресяна, І. Ревзіна, І. Мельчука, Р. Піот­ровського, Г. Бєлоногова, Ю. Тул­дави, А. Шайкевича, О. Паду­чевої, В. Плунгяна, К. Рахіліної, Н. Хомського, З. Хар­риса, Ч. Хо­­ке­та, Ю. Найди, У. Френсіса. Проб­леми К. л. висвітлюють ж. «Українська мова», «Мово­­знав­ство», зб. «Українське мово­знав­ство», «Лінгвістичні студії» та «Лінгвокомпʼютерні дослідже­н­ня». Укр. компʼютерна лексико­графія пред­ставлена знач. кіль­кістю електрон. версій традиц. (уклад. вручну) словників. Для вільного до­ступу в Інтернеті викладено бл. 300 укр. словників різних типів. На базі компʼютер. версій традиц. словників створ. інтегров. словник. бази, що дають змогу користувачам одержувати різні ві­домості про слово, зокрема інтегров. лексикогр. система «Словники України», яку роз­робив і виклав в Інтернеті Укр. мовно-інформ. фонд НАНУ, містить електрон­ні версії орфогр., орфоепіч., граматич. та фразеол. словників, а також словників синонімів та антонімів. Крім версій традиц. словників, є й автомат. словники, або слов­ники, уклад. компʼютером. Саме такі праці в К. л. називають слов­никами нового поколі­н­ня. Вони можуть становити самост. джерело інформації про мову, як, напр., частотно-валент. «Словник афіксальних морфем української мови», який уклали Н. Кли­менко, Є. Карпіловська, В. Карпіловський, Т. Недозим (електрон­ну версію створ. 1991, опубл. 1998). Автомат. словники можуть входити також до складу лінгвіст. забезпече­н­ня різних компʼютер. систем опрацюва­н­ня інформації. Такими є словни­ки (орфогр., тезаурус, конкор­данс, або словник сполучуваності слів) у складі системи ор­­фогр. конт­ролю укр. текс­тів «Ру­­та» та системи укр.-рос. й рос.-укр. машин. пере­кладу «Плай», що становлять укр. офіс операц. системи Windows фірми «Microsoft» (роз­­­робники — Т. Грязнухіна, Л. Ор­­лова, В. Критська, Т. Пуздирева, Т. Недозим, Н. Дарчук, Л. Алексієнко, Г. Колєнов і В. Сорокін), або пере­кладні компʼютерні слов­­ники в складі навч. комплексу «Глоса», який створив колектив лаб. компʼютер. лінгвістики Київ. лінгвіст. університету під керівництвом В. Пере­бийніс. В основу укр. офісу системи Windows покладено системи морфол., синтаксич. та логіко-семантич. аналізу укр. і рос. текс­тів, які впродовж 1980–90-х рр. створ. у від­ділі структурно-матем. лін­гвіс­тики Ін­ституту мово­знавства НАНУ. Нац. корпус мови як показове за обсягом зі­бра­н­ня текс­тів різ­них стилів і жанрів, придатне для опрацюва­н­ня компʼютер. технологіями, вже став поруч зі словником і граматикою надій. інструментом наук. дослідж. мови та роз­вʼяза­н­ня практич. зав­дань су­спільства. На сьогодні корпуси показового обсягу (від 200 млн до понад 1 млрд слово­вживань) мають не лише такі провід­ні зх.-європ. мови, як англ., франц., нім., а й словʼян. мови: рос., польс., словац., чеська. В Україні над створе­н­ням Укр. нац. лінгвіст. корпусу від кін. 1990-х рр. працює Укр. мовно-інформ. фонд, проте від­­критого до­ступу до цього корпусу користувачі поки що не мають. В Інтернеті роз­міщено лише Корпус української мови (обсягом 13 млн слово­вживань), створ. у лаб. компʼютер. лінгвістики Київ. університету під керівництвом Н. Дарчук. Він охоплює текс­ти худож., наук. та публіцист. стилів. У цьому корпусі здійснено спец. лінгвіст. анотацію текс­тів (морфол., син­таксичну й семантичну) для викона­н­ня теор. і практич. дослідж. із К. л. та для потреб лін­гводидактики.

Літ.: Пере­бийніс В. С. Коли робот заговорить (Мовне спілкува­н­ня людини з електрон­ною машиною). К., 1972; Лексична семантика в системі «людина–машина». К., 1986; Компьютерная лингвистика // Новое в зарубеж. лингвистике. Москва, 1989. Вып. 24; Ис­­поль­­­­зование ЭВМ в лингвистических ис­следованиях. К., 1990; Морфологи­ческий анализ на­учного текс­та на ЭВМ. К., 1990; Анисимов А. В. Компьютер­ная лингвистика для всех: Мифы. Алго­рит­мы. Язык. К., 1991; Клименко Н. Ф., Русанівський В. М. Від універсальної бази лінгвістичних знань до компʼю­тер­ного укла­да­н­ня словників // Мово­знав­ство. 1996. № 4–5; Пещак М. М. На­­риси з компʼютерної лінгвістики. Уж., 1999; Синтаксический анализ на­учного текс­та на ЭВМ. К., 1999; D. Cristal. Language and the Internet. Cambridge, 2001; Карпіловська Є. А. Вступ до ком­пʼютерної лінгвістики. Д., 2003; Пере­­­бий­ніс В. І., Сорокін В. М. Традиційна та компʼютерна лексико­графія. К., 2009; Резникова Т. И. Славянская корпусная лингвистика: современ­ное со­стояние ресурсов // Нац. корпус рус. язы­ка: Новые результаты и пер­спективы. С.-Петербург, 2009.

Є. А. Карпіловська

Додаткові відомості

Рекомендована література

Іконка PDF Завантажити статтю

Інформація про статтю


Автор:
Статтю захищено авторським правом згідно з чинним законодавством України. Докладніше див. розділ Умови та правила користування електронною версією «Енциклопедії Сучасної України»
Дата останньої редакції статті:
груд. 2014
Том ЕСУ:
14
Дата виходу друком тому:
Тематичний розділ сайту:
Мова і література
EMUID:ідентифікатор статті на сайті ЕСУ
4396
Вплив статті на популяризацію знань:
загалом:
1 728
цьогоріч:
348
сьогодні:
1
Дані Google (за останні 30 днів):
  • кількість показів у результатах пошуку: 242
  • середня позиція у результатах пошуку: 5
  • переходи на сторінку: 6
  • частка переходів (для позиції 5): 41.3% ★★☆☆☆
Бібліографічний опис:

Комп’ютерна лінгвістика / Є. А. Карпіловська // Енциклопедія Сучасної України [Електронний ресурс] / редкол. : І. М. Дзюба, А. І. Жуковський, М. Г. Железняк [та ін.] ; НАН України, НТШ. – Київ: Інститут енциклопедичних досліджень НАН України, 2014. – Режим доступу: https://esu.com.ua/article-4396.

Kompiuterna linhvistyka / Ye. A. Karpilovska // Encyclopedia of Modern Ukraine [Online] / Eds. : I. М. Dziuba, A. I. Zhukovsky, M. H. Zhelezniak [et al.] ; National Academy of Sciences of Ukraine, Shevchenko Scientific Society. – Kyiv : The NASU institute of Encyclopedic Research, 2014. – Available at: https://esu.com.ua/article-4396.

Завантажити бібліографічний опис

ВСІ СТАТТІ ЗА АБЕТКОЮ

Нагору нагору