Математична статистика
МАТЕМАТИ́ЧНА СТАТИ́СТИКА — розділ прикладної математики, який розробляє методи виявлення та аналізу статистичних закономірностей на основі математичних моделей, що описують досліджувані дані. Статистичними називають закономірності, які виявляються лише при аналізі великої кількості однотип. спостережень і не дозволяють передбачати індивідуал. особливості кожного окремого спостереження. Основою теор. моделей таких закономірностей є ймовірностей теорія. Методи статист. аналізу, розроблені у М. с., застосовують у економетриці, страх. і фінанс. математиці, біоінформатиці, психометриці, розпізнаванні образів, машин. навчанні, статист. упр. якістю продукції тощо. Під час застосування ймовірніс. моделей статист. дані розглядають як спостереження випадк. об’єктів (подій, величин або векторів, процесів, полів, геом. фігур). При такому трактуванні осн. характеристикою даних є їхній розподіл, тобто ймовірність того, що дані набуватимуть тих чи ін. значень. У М. с. розподіл даних, зазвичай, вважають невідомим, висновки про нього потрібно робити на основі спостережув. даних. Осн. задачами, що розв’язують у М. с., є оцінювання невідомих параметрів розподілу даних, перевірка гіпотез про розподіл, статист. прогнозування, класифікація та фільтрація. За типом ймовірніс. моделей і способами їхнього використання розрізняють параметр., непараметр. та дескриптивну статистику. При параметр. підході розподіл даних намагаються описати невеликою кількістю числ. параметрів так, щоб, знаючи ці параметри, можна було однозначно визначити всі ймовірності, пов’язані з даними. Якщо справж. розподіл даних добре описується такою моделлю, методи параметр. статистики дозволяють обирати оптимал. оцінки параметрів і тести для перевірки гіпотез про них. Але висновки на основі параметр. моделі можуть бути цілком хибними, якщо вона не відповідає даним. Класич. прикладом параметр. підходу є статистика ґаусс. вибірок, але у статистиці широко застосовують й ін. параметр. сім’ї розподілів. При непараметр. підході для опису даних намагаються обрати якомога ширшу модель, яка містила б усі можливі розподіли. Для характеризування таких моделей потрібні переважно не числ., а функціонал. параметри. У результаті виникають задачі непараметр. оцінки функції розподілу, щільності, функції регресії, коваріації, спектра та задачі перевірки гіпотез про такі функції. Методи непараметр. статистики дозволяють будувати алгоритми для розв’язання таких задач, але ефективність цих алгоритмів нижча, ніж у параметричних. Тому для змістов. висновків на основі непараметр. моделей, як правило, потрібні значно більші обсяги даних, ніж при використанні параметр. моделей. У багатьох напрямах М. с., зокрема регресій., кореляцій., дисперсій. аналізі, аналізі часових рядів, можливе використання як параметр., так і непараметр. підходів. Методи дескриптив. (опис.) статистики призначені для виявлення внутр. структури та статист. особливостей даних без заданої наперед ймовірніс. моделі. Вибір моделі може бути результатом дескриптив. дослідження. У дескриптив. статистиці значну роль відіграють графічні методи аналізу, які дозволяють досліднику використовувати свою зорову інтуїцію. До дескриптив. аналізу належать методи багатовимір. шкалування, розвідниц. фактор. аналізу, кластер. аналізу. У приклад. статист. дослідж. досить часто буває, що ймовірнісна модель описує дані лише наближено. У таких ситуаціях доцільно використовувати для аналізу лише такі методи, які є стійкими відносно помір. відхилень від моделі розподілу. Аналізом стійкості (робастності) статист. методів і побудовою робаст. алгоритмів займається робастна статистика. Інколи, крім статист. даних, дослідник має додатк. інформацію про невідомі параметри, яка дозволяє охарактеризувати ймовірність різних значень цих параметрів. Для врахування такої апріор. інформації використовують методи баєс. статистики. При баєс. підході невідомі параметри ймовірніс. моделі вважаються не фіксованими, а випадк. об’єктами зі своїм влас. апріор. розподілом. Теор. дослідж. багатьох статист. задач значно спрощується, коли їх розглядають при необмеженому зростанні обсягу досліджув. даних (розміру вибірки, довжини спостережув. траєкторії випадк. процесу). Такі дослідж. називають асимптотич. статистикою. Вони дозволяють будувати статист. алгоритми, які найефективніше працюють при великих обсягах вибірки. Крім аналізу наяв. статист. даних, М. с. дозволяє також розв’язувати задачі оптимал. вибору алгоритмів відбору даних для дослідж. та побудови планів експериментів з урахуванням випадковості можливих результатів. У 18–19 ст. матем. методи у статистиці використовували переважно для узгодження теор. кривих з даними експерименту (методи абсолют. відхилень та найменших квадратів; серб. та італ. учений Р.-Й. Бошкович, франц. учені П.-С. Лаплас і А.-М. Лежандр, нім. учений К.-Ф. Ґаусс) та у страх. математиці для оцінки ризиків і побудови таблиць смертності (англ. учений Е. Галлей). 1846 у «Тр. С.-Петербур. АН» М. Остроградський розглядав матем. задачі, що виникають при застосуванні вибірк. методів контролю якості продукції. 1887 проф. Університету св. Володимира у Києві В. Єрмаков опублікував підруч. «Методъ наименьшихъ квадратовъ». Наприкінці 19 — на поч. 20 ст. М. с. сформувалася як самост. дисципліна, що ґрунтується на принципах теорії ймовірностей, знач. мірою завдяки роботам англ. учених К. Пірсона, Р. Фішера, швед. ученого Г. Крамера та їхніх учнів. 1899–1901 Д. Ґраве читав курс страх. математики у Харків., 1902–39 — у Київ. університетах, а 1912 опублікував підручник «Математика страхового дѣла». У 1930-х рр. у Києві М. Кравчук видав низку праць з М. с., а також очолював відділ М. с. в Інституті математики ВУАН. 1907–34 у Харків. університеті працював С. Бернштейн — автор нерівності Бернштейна, яку застосовують в асимптотич. статистиці, та гіпотези про асимптотичну поведінку апостеріор. розподілів у баєс. оцінюванні, яку пізніше назвали теоремою Бернштейна–Мізеса. Нового розвитку набули дослідж. з М. с. у Київ. університеті й Інституті математики АН УРСР у 2-й пол. 20 ст., коли Й. Гіхман, Б. Гнєденко та їхні учні почали застосовувати новітні результати в галузі теорії випадк. процесів до розв’язування статист. задач. Зокрема Й. Гіхман визначив асимптотич. розподіл статистики непараметр. тесту узгодженості Колмогорова у випадку, коли теор. розподіл має невідомі параметри. В. Королюк знайшов асимптотичні розклади для розподілів двовибірк. критеріїв згоди та розробив методи обчислення таких розподілів при малих обсягах вибірки. У подальших роботах він досліджував асимптотичну поведінку U-статистик, які застосовуються у різних статист. алгоритмах. В. Михалевич вивчав застосування баєс. процедур у статист. контролі якості. Під впливом Київ. і Донец. шкіл теорії випадк. процесів в Україні розвивалася М. с. випадк. процесів і полів. М. Ядренко, М. Леоненко та їхні учні вивчали оцінювання матем. сподівань та кореляц. функцій випадк. полів. Ю. Козаченко та Б. Бондарев розробили тести для перевірки гіпотез про випадк. процеси. Статист. дослідж. В. Булдигіна та його учнів присвяч. оцінюванню імпульс. перехід. функцій ліній. систем. Статистиці ґаусс. спостережень зі значеннями у гільберт. просторах присвяч. цикл робіт А. Скорохода та І. Ібрамхалілова. А. Дороговцев розглянув методи побудови оптимал. ліній. оцінок у моделях із нескінченновимір. заважаючими параметрами та методи оцінювання параметрів розподілів випадк. процесів. П. Кнопов дослідив питання статистики випадк. процесів і полів у зв’язку із задачами оптимал. керування, ідентифікації та розпізнавання. Ю. Ліньков і його учні на основі теорії великих відхилень розвинули асимптотичну теорію тестів відношення вірогідності із застосуванням до перевірки гіпотез про розподіли незалеж. спостережень та випадк. процесів. Нині розробленням алгоритмів розпізнавання зображень із застосуванням статист. методів, зокрема баєсових, займається М. Шлезінгер. Дослідж. у галузі регресій. аналізу проводять О. Іванов (регресій. аналіз випадк. процесів), О. Кукуш (моделі з похибками у змінних і застосування статист. методів у біоінформатиці), І. Мацак (моделі розподілів з важкими та легкими хвостами). Л. Сахно вивчає асимптотику оцінок спектрал. щільності випадк. процесів. Ю. Мішура, Г. Шевченко та їхні учні досліджують задачі оцінювання параметрів дифуз. і мультифрактал. випадк. процесів. М. Моклячук займається задачами мінімакс. прогнозування випадк. процесів і полів. Цикл праць Р. Майбороди й О. Сугакової присвяч. статист. аналізу даних, що описуються непараметр. моделями суміші кількох розподілів. Навч. за спеціальністю «статистика» проводять на матем. ф-тах Київ., Дніпроп., Львів., Донец., Ужгород., Чернів. університетів та в ін. укр. ВНЗах.