КО́РПУСНА ЛІНГВІ́СТИКА — галузь мовознавства, предме­­том дослідже­н­ня якої є принципи та методи формува­н­ня корпусів текс­тів, а також роз­роб­­ле­н­ня компʼютерних систем для їхнього опрацюва­н­ня. Корпус роз­глядають як модель мовної системи, реалізовану в текс­тах різних функціонал. стилів, струк­­тури, тематики, при­значе­н­ня, території та часу їх створе­н­ня. Залежно від при­значе­н­ня виділяють фундам. і пошукові (дослідн.) корпуси, для роботи з якими створюють спец. текс­тові процесори — системи опрацюва­н­ня інформації про мовні оди­­ниці морфол., синтаксич., логіко-семантич. структур. рівнів текс­ту. Такі системи зорієнтовані на анотацію (роз­міче­н­ня) текс­ту, яка перед­бачає формаліз. виділе­н­ня у ньому мовних одиниць певних типів. Завдяки наявності автоматиз. засобів аналізу інформації корпуси при­­датні для викона­н­ня за допомогою компʼютера теор. і практ. зав­дань мово­знавства. За повнотою по­да­н­ня текс­тів, їхнім структурува­н­ням та наявністю засобів автоматиз. аналізу корпуси від­різняють від електрон. б-к, картотек і баз цитат. Сучасні нац. корпуси мають здебільшого фундам. характер, їхній обсяг сягає 200 і більше млн слово­вживань. Такими є, напр., Британ. нац. корпус (British Na­­tional Corpus), Нац. корпус рус. языка, Narodowy Korpus Ję­­zy­ka Polskiego або корпус текс­тів (Frantext) для укладе­н­ня словника «Trésor de la langue fran­­çaise» («Скарбниця французької мови»). Корпуси текс­тів різних типів та при­значе­н­ня мають естон., італ., китай., нім., польс., рос., серб., словен., словац., турец., укр. і чес. мови. В Україні перші корпуси україномовних текс­тів зʼявилися у 1990-х pp., зокрема корпус наук.-реферат. та публіцист. текс­тів, на базі якого спів­роб. від­ділу структурно-матем. лінгвістики (нині у скла­­ді Ін­ституту української мови НАНУ, Київ) створили систему автомат. орфогр. контролю текс­ту «Рута» та систему машин­ного рос.-укр. і укр.-рос. пере­кладу «Плай», а також корпус укр. худож., публіцист. і наук. текс­тів, сформов. у лаб. компʼютер. лінгвістики Ки­­їв. університету. Над укла­да­н­ням фундам. нац. корпусів україномовних текс­тів працюють науковці Укр. мовно-інформ. фонду НАНУ (Київ) та Ін­ституту української мови НАНУ. Від 2009 при Між­нар. комітеті сла­­вістів працює Комісія з корпус. лінгвістики на чолі з М. Лазинським (Варшава), яка координує діяльність роз­робників корпусів словʼян. мов. Від 1996 ви­­ходить «International Journal of Corpus Linguistics».