Курсова робота Теорія ймовірності математичної статистики. Математична статистика для фахівців різних галузей Основні поняття математичної статистики

Під математичною статистикою розуміють розділ математики, присвячений математичним методам збору, систематизації, обробки та інтерпретації статистичних даних, а також використання їх для наукових або практичних висновків. Правила та процедури математичної статистики спираються на теорію ймовірностей, що дозволяє оцінити точність і надійність висновків, одержуваних у кожному завданні на підставі наявного статистичного матеріалу. При цьому статистичними даними називаються відомості про кількість об'єктів у будь-якій більш менш широкої сукупності, що володіють тими або іншими ознаками.

На кшталт розв'язуваних завдань математична статистика зазвичай ділиться на три розділи: опис даних, оцінювання та перевірка гіпотез.

За видом статистичних даних математична статистика ділиться на чотири напрями:

- одновимірна статистика (статистика випадкових величин), у якій результат спостереження описується дійсним числом;

- багатовимірний статистичний аналіз, де результат спостереження над об'єктом описується кількома числами (вектором);

- Статистика випадкових процесів і тимчасових рядів, де результат спостереження - функція;

- Статистика об'єктів нечислової природи, в якій результат спостереження має нечислову природу, наприклад, є безліччю (геометричною фігурою), упорядкуванням або отриманий в результаті вимірювання за якісною ознакою.

Історично першою з'явилися деякі області статистики об'єктів нечислової природи (зокрема, завдання оцінювання частки шлюбу та перевірки гіпотез про неї) та одновимірна статистика. Математичний апарат їм простіше, тому з їхньої прикладі зазвичай демонструють основні ідеї математичної статистики.

Тільки методи обробки даних, тобто. Математична статистика є доказовими, які спираються на імовірнісні моделі відповідних реальних явищ і процесів. Йдеться про моделі поведінки споживачів, виникнення ризиків, функціонування технологічного обладнання, отримання результатів експерименту, перебігу захворювання тощо. Імовірнісну модель реального явища слід вважати побудованою, якщо аналізовані величини та зв'язки між ними виражені в термінах теорії ймовірностей.

Відповідність імовірнісної моделі дійсності, тобто. її адекватність обґрунтовують, зокрема, за допомогою статистичних методів перевірки гіпотез.

Неймовірні методи обробки даних є пошуковими, їх можна використовувати лише при попередньому аналізі даних, оскільки вони не дають можливості оцінити точність та надійність висновків, отриманих на підставі обмеженого статистичного матеріалу.

Імовірнісні та статистичні методи застосовні усюди, де вдається побудувати та обґрунтувати ймовірнісну модель явища чи процесу. Їх застосування обов'язково, коли зроблені з урахуванням вибіркових даних висновки переносяться всю сукупність (наприклад, з вибірки протягом усього партію продукції).

У конкретних галузях застосування використовуються як імовірнісно-статистичні методи широкого застосування, так і специфічні. Наприклад, розділ виробничого менеджменту, присвяченого статистичним методам управління якістю продукції, використовують прикладну математичну статистику (включаючи планування експериментів). За допомогою її методів проводиться статистичний аналіз точності та стабільності технологічних процесів та статистична оцінка якості. До специфічних методів належать методи статистичного приймального контролю якості продукції, статистичного регулювання технологічних процесів, оцінки та контролю надійності та ін.

Широко застосовуються такі прикладні імовірнісно-статистичні дисципліни, як теорія надійності та теорія масового обслуговування. Зміст першої їх зрозуміло з назви, друга займається вивченням систем типу телефонної станції, яку у випадкові моменти часу надходять виклики — вимоги абонентів, набираючих номери у своїх телефонних апаратах. Тривалість обслуговування цих вимог, тобто. тривалість розмов також моделюється випадковими величинами. Великий внесок у розвиток цих дисциплін зробили член-кореспондент АН СРСР А.Я. Хінчін (1894-1959), академік АН УРСР Б.В.Гнеденко (1912-1995) та інші вітчизняні вчені.


Зміст.

1. Введення:
- Як використовуються теорія ймовірностей та математична статистика? - Стор. 2
– Що таке «математична статистика»? - Стор. 3
2) Приклади застосування теорії ймовірностей та математичної статистики:
- Вибірка. - стор 4
- Завдання оцінювання. – стор. 6
- ймовірно-статистичні методи та оптимізація. – стор. 7
3) Висновок.

Вступ.

Як використовуються теорія ймовірностей та математична статистика? Ці дисципліни – основа імовірнісно-статистичних методів прийняття рішень. Щоб скористатися їх математичним апаратом, необхідно завдання прийняття рішень висловити термінах вероятностно-статистических моделей. Застосування конкретного імовірнісно-статистичного методу прийняття рішень складається з трьох етапів:
- перехід від економічної, управлінської, технологічної дійсності до абстрактної математико- статистичної схемою, тобто. побудова імовірнісної моделі системи управління, технологічного процесу, процедури прийняття рішень, зокрема за результатами статистичного контролю тощо.
- Проведення розрахунків та отримання висновків суто математичними засобами в рамках імовірнісної моделі;
- інтерпретація математико-статистичних висновків стосовно реальної ситуації та прийняття відповідного рішення (наприклад, про відповідність або невідповідність якості продукції встановленим вимогам, необхідність налагодження технологічного процесу тощо), зокрема, висновки (про частку дефектних одиниць продукції в партії, про конкретний вид законів розподілу контрольованих параметрів технологічного процесу та ін.).

Математична статистика використовує поняття, методи та результати теорії ймовірностей. Розглянемо основні питання побудови ймовірнісних моделей прийняття рішень на економічних, управлінських, технологічних та інших ситуаціях. Для активного та правильного використання нормативно-технічних та інструктивно-методичних документів з імовірнісно-статистичних методів прийняття рішень потрібні попередні знання. Так, необхідно знати, за яких умов слід застосовувати той чи інший документ, яку вихідну інформацію необхідно мати для вибору та застосування, які рішення повинні бути прийняті за результатами обробки даних і т.д.

Що таке "математична статистика"? Під математичною статистикою розуміють розділ математики, присвячений математичним методам збору, систематизації, обробки та інтерпретації статистичних даних, а також використання їх для наукових або практичних висновків. Правила та процедури математичної статистики спираються на теорію ймовірностей, що дозволяє оцінити точність і надійність висновків, одержуваних у кожному завданні на підставі наявного статистичного матеріалу». При цьому статистичними даними називаються відомості про кількість об'єктів у будь-якій більш менш широкої сукупності, що володіють тими або іншими ознаками.

На кшталт розв'язуваних завдань математична статистика зазвичай ділиться на три розділи: опис даних, оцінювання та перевірка гіпотез.

За видом статистичних даних математична статистика ділиться на чотири напрями:

Одномірна статистика (статистика випадкових величин), у якій результат спостереження описується дійсним числом;

багатовимірний статистичний аналіз, де результат спостереження над об'єктом описується кількома числами (вектором);

Статистика випадкових процесів та часових рядів, де результат спостереження – функція;

Статистика об'єктів нечислової природи, в якій результат спостереження має нечислову природу, наприклад, є множиною (геометричною фігурою), впорядкуванням або отриманим результатом вимірювання за якісною ознакою.

Приклади застосування теорії ймовірностей та математичної статистики.
Розглянемо кілька прикладів, коли вероятностно- статистичні моделі є гарним інструментом на вирішення управлінських, виробничих, економічних, народногосподарських завдань. Так, наприклад, монетка, яку використовують як жереб, має бути «симетричною», тобто. при її киданні в середньому в половині випадків повинен випадати герб, а в половині випадків – грати (решітка, цифра). Але що означає «у середньому»? Якщо провести багато серій по 10 кидань у кожній серії, то часто зустрічатимуться серії, в яких монета чотири рази випадає гербом. Для симетричної монети це відбуватиметься у 20,5% серій. А якщо на 100 000 кидань виявиться 40 000 гербів, то чи можна вважати монету симетричною? Процедура прийняття рішень будується з урахуванням теорії ймовірностей і математичної статистики.

Розглянутий приклад може бути недостатньо серйозним. Однак, це не так. Жеребкування широко використовується при організації промислових техніко-економічних експериментів, наприклад, при обробці результатів вимірювання показника якості (моменту тертя) підшипників залежно від різних технологічних факторів (впливу консерваційного середовища, методів підготовки підшипників перед вимірюванням, впливу навантаження підшипників у процесі вимірювання тощо). п.). Припустимо, необхідно порівняти якість підшипників залежно від результатів зберігання в різних консерваційних маслах, тобто. в оліях складу А і В. При плануванні такого експерименту виникає питання, які підшипники слід помістити в олію складу А, а які - в олію складу В, але так, щоб уникнути суб'єктивізму та забезпечити об'єктивність прийнятого рішення.

Вибірка
Відповідь це питання може бути отримано з допомогою жереба. Аналогічний приклад можна навести і з контролем якості продукції. Щоб вирішити, чи відповідає чи не відповідає контрольована партія продукції встановленим вимогам, з неї відбирається вибірка. За результатами контролю вибірки робиться висновок про всю партію. У цьому випадку дуже важливо уникнути суб'єктивізму при формуванні вибірки, тобто необхідно, щоб кожна одиниця продукції контрольованої партії мала однакову можливість бути відібраною у вибірку. У виробничих умовах відбір одиниць продукції вибірку зазвичай здійснюють за допомогою жереба, а, по спеціальним таблицям випадкових чисел чи з допомогою комп'ютерних датчиків випадкових чисел.
Аналогічні проблеми забезпечення об'єктивності порівняння виникають при зіставленні різних схем організації виробництва, оплати праці, під час проведення тендерів та конкурсів, підбору кандидатів на вакантні посади тощо. Усюди потрібне жеребкування або подібні до неї процедури. Пояснимо на прикладі виявлення найбільш сильної та другої за силою команди при організації турніру з олімпійської системи (який програв вибуває). Нехай завжди сильніша команда перемагає слабшу. Зрозуміло, що найсильніша команда однозначно стане чемпіоном. Друга за силою команда вийде у фінал тоді і лише тоді, коли до фіналу вона не матиме ігор з майбутнім чемпіоном. Якщо таку гру буде заплановано, то друга за силою команда у фінал не потрапить. Той, хто планує турнір, може або достроково «вибити» другу за силою команду з турніру, звівши її в першій зустрічі з лідером, або забезпечити їй друге місце, забезпечивши зустрічі з більш слабкими командами аж до фіналу. Щоб уникнути суб'єктивізму, проводять жеребкування. Для турніру з 8 команд ймовірність того, що у фіналі зустрінуться дві найсильніші команди, дорівнює 4/7. Відповідно до ймовірності 3/7 друга за силою команда залишить турнір достроково.
За будь-якого виміру одиниць продукції (за допомогою штангенциркуля, мікрометра, амперметра тощо) є похибки. Щоб з'ясувати, чи є систематичні похибки, необхідно зробити багаторазові виміри одиниці виробленої продукції, характеристики якої відомі (наприклад, стандартного зразка). При цьому слід пам'ятати, що, крім систематичної похибки, присутня і випадкова похибка.

Тому постає питання, як за результатами вимірювань дізнатися, чи є систематична похибка. Якщо відзначати лише, чи є отримана при черговому вимірі похибка позитивною чи негативною, це завдання можна звести до попередньої. Справді, порівняємо вимір із киданням монети, позитивну похибку – з випаданням герба, негативну – решітки (нульова похибка за достатньої кількості поділів шкали майже будь-коли зустрічається). Тоді перевірка відсутності систематичної похибки еквівалентна перевірці симетричності монети.

Метою цих міркувань є зведення завдання перевірки відсутності систематичної похибки завдання перевірки симетричності монети. Проведені міркування призводять до так званого критерію знаків в математичній статистиці.
«Критерій знаків» (sign test) - статистичний критерій, що дозволяє перевірити нульову гіпотезу, що вибірка підпорядковується биномиальному розподілу з параметром p=1/2 . Критерій знаків можна використовувати як непараметричний статистичний критерій для перевірки гіпотези рівності медіани заданого значення (зокрема, нуля), а також відсутності зсуву (відсутності ефекту обробки) у двох зв'язкових вибірках. Він також дозволяє перевіряти гіпотезу симетричності розподілу, проте для цього існують і потужніші критерії - одновибірковий критерій Вілкоксона та його модифікації.

При статистичному регулюванні технологічних процесів на основі методів математичної статистики розробляються правила та плани статистичного контролю процесів, спрямовані на своєчасне виявлення розладки технологічних процесів та вжиття заходів до їх налагодження та запобігання випуску продукції, що не відповідає встановленим вимогам. Ці заходи спрямовані на скорочення витрат виробництва та втрат від постачання неякісних одиниць продукції. При статистичному приймальному контролі з урахуванням методів математичної статистики розробляються плани контролю якості шляхом аналізу вибірок із партій продукції. Складність у тому, щоб вміти правильно будувати вероятностно-статистические моделі прийняття рішень, основі яких можна відповісти на поставлені вище питання. У математичній статистиці при цьому розроблені імовірнісні моделі і методи перевірки гіпотез, зокрема, гіпотез у тому, частка дефектних одиниць продукції дорівнює певному числу р0, наприклад, р0 = 0,23.

Завдання оцінювання.
У низці управлінських, виробничих, економічних, народногосподарських ситуацій виникають завдання іншого – завдання оцінки показників і параметрів розподілів ймовірностей.

Розглянемо приклад. Нехай на контроль надійшла партія із N електроламп. З цієї партії випадково відібрано вибірку обсягом n електроламп. Виникає низка природних питань. Як за результатами випробувань елементів вибірки визначити середній термін служби електроламп та з якою точністю можна оцінити цю характеристику? Як зміниться точність, якщо взяти вибірку більшого обсягу? При якому числі годинника Т можна гарантувати, що не менше 90% електроламп прослужать Т і більше годинника?

Припустимо, що з випробуванні вибірки обсягом n електроламп дефектними виявилися Х електроламп. Тоді виникають такі питання. Які межі можна вказати для числа D дефектних електроламп у партії, для рівня дефектності D/N тощо?

Або при статистичному аналізі точності та стабільності технологічних процесів слід оцінити такі показники якості, як середнє значення контрольованого параметра та ступінь його розкиду в аналізованому процесі. Відповідно до теорії ймовірностей як середнє значення випадкової величини доцільно використовувати її математичне очікування, а статистичної характеристики розкиду – дисперсію, середнє квадратичне відхилення чи коефіцієнт варіації. Звідси виникає питання: як оцінити ці статистичні характеристики за вибірковими даними та з якою точністю це вдається зробити? Аналогічних прикладів можна навести дуже багато. Тут важливо було показати, як теорія ймовірностей та математична статистика можуть бути використані у виробничому менеджменті при прийнятті рішень у галузі статистичного управління якістю продукції.

Імовірнісно-статистичні методи та оптимізація. Ідея оптимізації пронизує сучасну прикладну математичну статистику та інші статистичні методи. А саме, методи планування експериментів, статистичного приймального контролю, статистичного регулювання технологічних процесів та ін. прикладної математичної статистики

У виробничому менеджменті, зокрема, при оптимізації якості продукції і на вимоги стандартів особливо важливо застосовувати статистичні методи на початковому етапі життєвого циклу продукції, тобто. на етапі науково-дослідної підготовки дослідно-конструкторських розробок (розробка перспективних вимог до продукції, аванпроекту, технічного завдання на дослідно-конструкторську розробку). Це пояснюється обмеженістю інформації, доступної на початковому етапі життєвого циклу продукції, та необхідністю прогнозування технічних можливостей та економічної ситуації на майбутнє. Статистичні методи повинні застосовуватися на всіх етапах розв'язання задачі оптимізації – при шкалюванні змінних, розробці математичних моделей функціонування виробів та систем, проведенні технічних та економічних експериментів тощо.

У завданнях оптимізації, у тому числі оптимізації якості продукції та вимог стандартів, використовують усі галузі статистики. А саме, статистику випадкових величин, багатовимірний статистичний аналіз, статистику випадкових процесів та часових рядів, статистику об'єктів нечислової природи. Вибір статистичного методу для аналізу конкретних даних доцільно проводити згідно з рекомендаціями.

Висновок.
У
і т.д.................

Математична статистика одна із основних розділів такий науки, як математика, і є галузь, вивчаючу методи і правила обробки певних даних. Іншими словами, вона досліджує способи розкриття закономірностей, які властиві великим сукупностям однакових об'єктів, ґрунтуючись на їхньому вибірковому обстеженні.

Завдання цього розділу полягає у побудові методів оцінки ймовірності чи прийнятті певного рішення про характер подій, що розвиваються, спираючись на отримані результати. Для опису даних використовуються таблиці, діаграми та кореляційні поля. застосовуються рідко.

Математична статистика використовують у різних галузях науки. Наприклад, для економіки важливо обробляти відомості про однорідні сукупності явищ та об'єктів. Ними можуть бути вироби, що випускаються промисловістю, персонал, дані про прибуток і т. д. Залежно від математичної природи результатів спостережень, можна виділити статистику чисел, аналіз функцій та об'єктів нечислової природи, багатовимірний аналіз. Крім цього, розглядають загальні та приватні (пов'язані з відновленням залежностей, використанням класифікацій, вибірковими дослідженнями) завдання.

Автори деяких підручників вважають, що теорія математичної статистики є лише розділом теорії ймовірності, інші – що це самостійна наука, що має власні цілі, завдання та методи. Однак у будь-якому випадку її використання дуже широке.

Так, найяскравіше математична статистика застосовна у психології. Її використання дозволить фахівцеві правильно обґрунтувати знайти залежність між даними, узагальнити їх, уникнути багатьох логічних помилок та багато іншого. Слід зазначити, що виміряти той чи інший психологічний феномен чи властивість особистості без обчислювальних процедур часто просто неможливо. Це свідчить, що ази цієї науки необхідні. Іншими словами, її можна назвати джерелом та базою теорії ймовірностей.

p align="justify"> Метод дослідження, який спирається на розгляд статистичних даних, використовується і в інших областях. Однак відразу слід зазначити, що його риси щодо об'єктів, що мають різну природу походження, завжди своєрідні. Тому об'єднувати в одну науку фізичну чи немає сенсу. Загальні ж риси даного методу зводяться до підрахунку певної кількості об'єктів, що входять до тієї чи іншої групи, а також до вивчення розподілу кількісних ознак та застосування теорії ймовірностей для отримання тих чи інших висновків.

Елементи математичної статистики використовуються в таких галузях, як фізика, астрономія і т. д. Тут можуть розглядатися значення характеристик та параметрів, гіпотези про збіг будь-яких характеристик у двох вибірках, про симетрію розподілу та багато іншого.

Велику роль математична статистика грає у проведенні Їх метою найчастіше є побудова адекватних методів оцінювання та перевірка гіпотез. Нині велике значення у цій науці мають комп'ютерні технології. Вони дозволяють як значно спростити процес розрахунку, а й створити для розмноження вибірок чи щодо придатності отриманих результатів практично.

У загальному випадку методи математичної статистики допомагають зробити два висновки: або прийняти судження про характер або властивості досліджуваних даних та їх взаємозв'язків, або довести, що отриманих результатів недостатньо для того, щоб робити висновки.

Під математичною статистикою розуміють розділ математики, присвячений математичним методам збору, систематизації, обробки та інтерпретації статистичних даних, а також використання їх для наукових або практичних висновків. Правила та процедури математичної статистики спираються на теорію ймовірностей, що дозволяє оцінити точність і надійність висновків, одержуваних у кожному завданні на підставі наявного статистичного матеріалу. При цьому статистичними даними називаються відомості про кількість об'єктів у будь-якій більш менш широкої сукупності, що володіють тими або іншими ознаками.

На кшталт розв'язуваних завдань математична статистика зазвичай ділиться на три розділи: опис даних, оцінювання та перевірка гіпотез.

За видом статистичних даних математична статистика ділиться на чотири напрями:
- одновимірна статистика (статистика випадкових величин), у якій результат спостереження описується дійсним числом;
- багатовимірний статистичний аналіз, де результат спостереження над об'єктом описується кількома числами (вектором);
- статистика випадкових процесів та часових рядів, де результат спостереження – функція;
- статистика об'єктів нечислової природи, в якій результат спостереження має нечислову природу, наприклад, є множиною (геометричною фігурою), упорядкуванням або отримано в результаті вимірювання за якістю.

Історично першою з'явилися деякі області статистики об'єктів нечислової природи (зокрема, завдання оцінювання частки шлюбу та перевірки гіпотез про неї) та одновимірна статистика. Математичний апарат їм простіше, тому з їхньої прикладі зазвичай демонструють основні ідеї математичної статистики.

Тільки методи обробки даних, тобто. Математична статистика є доказовими, які спираються на імовірнісні моделі відповідних реальних явищ і процесів. Йдеться про моделі поведінки споживачів, виникнення ризиків, функціонування технологічного обладнання, отримання результатів експерименту, перебігу захворювання тощо. Імовірнісну модель реального явища слід вважати побудованою, якщо аналізовані величини та зв'язки між ними виражені в термінах теорії ймовірностей. Відповідність імовірнісної моделі дійсності, тобто. її адекватність обґрунтовують, зокрема, за допомогою статистичних методів перевірки гіпотез.

Неймовірні методи обробки даних є пошуковими, їх можна використовувати лише при попередньому аналізі даних, оскільки вони не дають можливості оцінити точність та надійність висновків, отриманих на підставі обмеженого статистичного матеріалу.

Імовірнісні та статистичні методи застосовні усюди, де вдається побудувати та обґрунтувати ймовірнісну модель явища чи процесу. Їх застосування обов'язково, коли зроблені з урахуванням вибіркових даних висновки переносяться всю сукупність (наприклад, з вибірки протягом усього партію продукції).

У конкретних галузях застосування використовуються як імовірнісно-статистичні методи широкого застосування, так і специфічні. Наприклад, розділ виробничого менеджменту, присвяченого статистичним методам управління якістю продукції, використовують прикладну математичну статистику (включаючи планування експериментів). За допомогою її методів проводиться статистичний аналіз точності та стабільності технологічних процесів та статистична оцінка якості. До специфічних методів належать методи статистичного приймального контролю якості продукції, статистичного регулювання технологічних процесів, оцінки та контролю надійності та ін.

Широко застосовуються такі прикладні імовірнісно-статистичні дисципліни, як теорія надійності та теорія масового обслуговування. Зміст першої їх ясно з назви, друга займається вивченням систем типу телефонної станції, яку у випадкові моменти часу надходять виклики - вимоги абонентів, набираючих номери у своїх телефонних апаратах. Тривалість обслуговування цих вимог, тобто. тривалість розмов також моделюється випадковими величинами. Великий внесок у розвиток цих дисциплін зробили член-кореспондент АН СРСР А.Я. Хінчін (1894-1959), академік АН УРСР Б.В.Гнеденко (1912-1995) та інші вітчизняні вчені.

Вступ

2. Основні поняття математичної статистики

2.1 Основні поняття вибіркового методу

2.2 Вибірковий розподіл

2.3 Емпірична функція розподілу, гістограма

Висновок

Список літератури

Вступ

Математична статистика - наука про математичні методи систематизації та використання статистичних даних для наукових та практичних висновків. У багатьох своїх розділах математична статистика спирається на теорію ймовірностей, що дозволяє оцінити надійність і точність висновків, які робляться на підставі обмеженого статистичного матеріалу (напр., оцінити необхідний обсяг вибірки для отримання результатів необхідної точності під час вибіркового обстеження).

Теоретично ймовірностей розглядаються випадкові величини із заданим розподілом чи випадкові експерименти, властивості яких цілком відомі. Предмет теорії ймовірностей - властивості та взаємозв'язку цих величин (розподілів).

Але найчастіше експеримент є чорний ящик, видає лише деякі результати, якими потрібно зробити висновок про властивості самого експерименту. Спостерігач має набір числових (або їх можна зробити числовими) результатів, отриманих повторенням того самого випадкового експерименту в однакових умовах.

При цьому виникають, наприклад, такі питання: Якщо ми спостерігаємо одну випадкову величину - як за набором її значень у кількох дослідах зробити якомога точніший висновок про її розподіл?

Прикладом такої серії експериментів може бути соціологічне опитування, набір економічних показників чи, нарешті, послідовність гербів і решок при тисячоразовому підкиданні монети.

Всі наведені вище фактори зумовлюють актуальністьта значимість тематики роботи на сучасному етапі, спрямованої на глибоке та всебічне вивчення основних понять математичної статистики.

У зв'язку з цим метою даної є систематизація, накопичення і закріплення знань про поняття математичної статистики.

1. Предмет та методи математичної статистики

Математична статистика - наука про математичні методи аналізу даних, отриманих під час проведення масових спостережень (вимірювань, дослідів). Залежно від математичної природи конкретних результатів спостережень статистика математична ділиться на статистику чисел, багатовимірний статистичний аналіз, аналіз функцій (процесів) та часових рядів, статистику об'єктів нечислової природи. Істотна частина математичної статистики заснована на ймовірнісних моделях. Виділяють загальні завдання опису даних, оцінювання та перевірки гіпотез. Розглядають і більш часткові завдання, пов'язані з проведенням вибіркових обстежень, відновленням залежностей, побудовою та використанням класифікацій (типологій) та ін.

Для опису даних будують таблиці, діаграми, інші наочні уявлення, наприклад, кореляційні поля. Вірогідні моделі зазвичай не застосовуються. Деякі методи опису даних спираються на просунуту теорію та можливості сучасних комп'ютерів. До них відносяться, зокрема, кластер-аналіз, націлений на виділення груп об'єктів, схожих один на одного, та багатовимірне шкалювання, що дозволяє наочно уявити об'єкти на площині, найменшою мірою спотворивши відстані між ними.

Методи оцінювання та перевірки гіпотез спираються на імовірнісні моделі породження даних. Ці моделі поділяються на параметричні та непараметричні. У параметричних моделях передбачається, що об'єкти, що вивчаються, описуються функціями розподілу, що залежать від невеликого числа (1-4) числових параметрів. У непараметричних моделях функції розподілу передбачаються довільними безперервними. У статистиці математичної оцінюють параметри та характеристики розподілу (математичне очікування, медіану, дисперсію, квантилі та ін.), щільності та функції розподілу, залежності між змінними (на основі лінійних та непараметричних коефіцієнтів кореляції, а також параметричних або непараметричних оцінок функцій, що виражають залежності) та ін. Використовують точкові та інтервальні (що дають межі для справжніх значень) оцінки.

У математичній статистиці є загальна теорія перевірки гіпотез і багато методів, присвячених перевірці конкретних гіпотез. Розглядають гіпотези про значення параметрів та характеристик, про перевірку однорідності (тобто про збіг характеристик або функцій розподілу у двох вибірках), про згоду емпіричної функції розподілу із заданою функцією розподілу або з параметричним сімейством таких функцій, про симетрію розподілу та ін.

Велике значення має розділ математичної статистики, пов'язаний із проведенням вибіркових обстежень, із властивостями різних схем організації вибірок та побудовою адекватних методів оцінювання та перевірки гіпотез.

Завдання відновлення залежностей активно вивчаються понад 200 років, з розробки К. Гауссом в 1794 р. методу найменших квадратів. В даний час найбільш актуальні методи пошуку інформативного підмножини змінних та непараметричні методи.

Розробка методів апроксимації даних та скорочення розмірності опису було розпочато понад 100 років тому, коли К. Пірсон створив метод головних компонентів. Пізніше було розроблено факторний аналіз та численні нелінійні узагальнення.

Різні способи побудови (кластер-анализ), аналізу та використання (дискримінантний аналіз) класифікацій (типологій) називають також способами розпізнавання образів (з учителем і без), автоматичної класифікації та ін.

Математичні методи у статистиці засновані або на використанні сум (на основі Центральної Граничної Теореми теорії ймовірностей) або показників відмінності (відстаней, метрик), як у статистиці об'єктів нечислової природи. Строго обґрунтовані зазвичай лише асимптотичні результати. В даний час комп'ютери відіграють велику роль у математичній статистиці. Вони використовуються як для розрахунків, так і для імітаційного моделювання (зокрема, у методах розмноження вибірок та щодо придатності асимптотичних результатів).

Основні поняття математичної статистики

2.1 Основні поняття вибіркового методу

Нехай – випадкова величина, що спостерігається у випадковому експерименті. Передбачається, що ймовірнісний простір задано (і нас не цікавитиме).

Вважатимемо, що, провівши раз цей експеримент в однакових умовах, ми отримали числа , , , - значення цієї випадкової величини в першому, другому і т.д. експериментах. Випадкова величина має деякий розподіл , який нам частково чи невідомо.

Розглянемо докладніше набір, званий вибіркою.

У серії вже зроблених експериментів вибірка – це набір чисел. Але якщо цю серію експериментів повторити ще раз, замість цього набору ми отримаємо новий набір чисел. Замість числа з'явиться інше число - одне із значень випадкової величини. Тобто (і, і, і т.д.) - змінна величина, яка може приймати ті ж значення, що і випадкова величина, і так само часто (з тими ж ймовірностями). Тому до досвіду - випадкова величина, однаково розподілена з , а після досвіду - число, яке ми спостерігаємо у першому експерименті, тобто. одне з можливих значень випадкової величини.

Вибірка обсягу - це набір із незалежних і однаково розподілених випадкових величин («копій»), що мають, як і , розподіл .

Що означає «за вибіркою зробити висновок про розподіл»? Розподіл характеризується функцією розподілу, густиною або таблицею, набором числових характеристик - , , і т.д. По вибірці необхідно вміти будувати наближення всім цих параметрів.

.2 Вибірковий розподіл

Розглянемо реалізацію вибірки одному елементарному результаті - набір чисел , , . На відповідному ймовірнісному просторі введемо випадкову величину , Що приймає значення , , З ймовірностями по (якщо якісь із значень збіглися, складемо ймовірності відповідне число разів). Таблиця розподілу ймовірностей та функція розподілу випадкової величини виглядають так:

Розподіл величини називають емпіричним чи вибірковим розподілом. Обчислимо математичне очікування та дисперсію величини та введемо позначення для цих величин:

Так само обчислимо і момент порядку

Загалом позначимо через величину

Якщо при побудові всіх введених нами характеристик вважати вибірку , набором випадкових величин, то й самі ці характеристики - , , , - стануть величинами випадковими. Ці характеристики вибіркового розподілу використовують із оцінки (наближення) відповідних невідомих характеристик справжнього розподілу.

Причина використання показників розподілу з метою оцінки показників істинного розподілу (чи ) - поблизу цих розподілів при великих .

Розглянемо, наприклад, підкидань правильного кубика. Нехай - Кількість очок, що випали при кидку, . Припустимо, що одиниця у вибірці зустрінеться раз, двійка – раз тощо. Тоді випадкова величина прийматиме значення 1 , , 6 з ймовірностями , відповідно. Але ці пропорції зі зростанням наближаються до закону великих чисел. Тобто розподіл величини у певному сенсі зближується з дійсним розподілом числа очок, що випадають при підкиданні правильного кубика.

Ми не будемо уточнювати, що мають на увазі під близькістю вибіркового та справжнього розподілів. У наступних параграфах ми докладніше познайомимося з кожною з введених вище характеристик та досліджуємо її властивості, у тому числі її поведінку із зростанням обсягу вибірки.

.3 Емпірична функція розподілу, гістограма

Оскільки невідомий розподіл можна описати, наприклад, його функцією розподілу, побудуємо за вибіркою «оцінку» для цієї функції.

Визначення 1.

Емпіричною функцією розподілу, побудованої за вибіркою об'єму, називається випадкова функція, при кожному рівна

Нагадування:Випадкова функція

називається індикатором події. При кожному це випадкова величина, що має розподіл Бернуллі з параметром . чому?

Інакше висловлюючись, за будь-якого значення , рівне істинної ймовірності випадкової величині бути менше , оцінюється часткою елементів вибірки, менших .

Якщо елементи вибірки , , упорядкувати за зростанням (на кожному елементарному результаті), вийде новий набір випадкових величин, званий варіаційним рядом :

Елемент, називається -м членом варіаційного ряду або -й порядковою статистикою.

приклад 1.

Вибірка:

Варіаційний ряд:

Мал. 1.Приклад 1

Емпірична функція розподілу має стрибки в точках вибірки, величина стрибка в точці дорівнює , де кількість елементів вибірки, що збігаються з .

Можна побудувати емпіричну функцію розподілу за варіаційним рядом:

Іншою характеристикою розподілу є таблиця (для дискретних розподілів) або густина (для абсолютно безперервних). Емпіричним або вибірковим аналогом таблиці або щільності є так звана гістограма .

Гістограма будується за групованими даними. Передбачувану область значень випадкової величини (або область вибіркових даних) ділять незалежно від вибірки деяку кількість інтервалів (не обов'язково однакових). Нехай , , - інтервали на прямий, які називаються інтервалами угруповання . Позначимо через число елементів вибірки, що потрапили в інтервал :

(1)

На кожному з інтервалів будують прямокутник, площа якого є пропорційною . Загальна площа всіх прямокутників має дорівнювати одиниці. Нехай - довжина інтервалу. Висота прямокутника над дорівнює

Отримана постать називається гістограмою.

приклад 2.

Є варіаційний ряд (див. приклад 1):

Тут - десятковий логарифм, тому, тобто. зі збільшенням вибірки вдвічі кількість інтервалів угруповання збільшується на 1. Зауважимо, що більше інтервалів угруповання, краще. Але, якщо брати кількість інтервалів, скажімо, порядку, то зі зростанням гістограма не наближатиметься до щільності.

Справедливе таке твердження:

Якщо щільність розподілу елементів вибірки є безперервною функцією, то при так, що , має місце поточкова збіжність за ймовірністю гістограми до густини.

Отже, вибір логарифму розумний, але не є єдино можливим.

Висновок

Математична (чи теоретична) статистика спирається на методи та поняття теорії ймовірностей, але вирішує у якомусь сенсі зворотні завдання.

Якщо спостерігаємо одночасно прояв двох (чи більше) ознак, тобто. маємо набір значень кількох випадкових величин - що можна сказати про їхню залежність? Є вона чи ні? А якщо є, то якою є ця залежність?

Часто буває можливо висловити деякі припущення про розподіл, захований у «чорному ящику», або його властивості. У цьому випадку за досвідченими даними потрібно підтвердити або спростувати ці припущення (гіпотези). При цьому треба пам'ятати, що відповідь «так» чи «ні» може бути дана лише з певним ступенем достовірності, і що довше ми можемо продовжувати експеримент, то точніше можуть бути висновки. Найбільш сприятливою для дослідження виявляється ситуація, коли можна впевнено стверджувати про деякі властивості спостережуваного експерименту - наприклад, про наявність функціональної залежності між величинами, що спостерігаються, про нормальність розподілу, про його симетричність, про наявність у розподілу щільності або про його дискретний характер, і т.д. .

Отже, про (математичну) статистику має сенс згадувати, якщо

· Є випадковий експеримент, властивості якого частково або повністю невідомі,

· ми вміємо відтворювати цей експеримент в одних і тих же умовах деяке (а краще - будь-яке) число разів.

Список літератури

1. Баумоль У. Економічна теорія та дослідження операцій. - М.; Наука, 1999.

2. Більшов Л.М., Смирнов Н.В. Таблиці математичної статистики. М: Наука, 1995.

3. Боровков А.А. Математична статистика. М: Наука, 1994.

4. Корн Г., Корн Т. Довідник з математики для науковців та інженерів. – СПБ: Видавництво «Лань», 2003.

5. Коршунов Д.А., Чернова Н.І. Збірник завдань та вправ з математичної статистики. Новосибірськ: Вид-во Інституту математики ім. С.Л.Соболєва ЗІ РАН, 2001.

6. Пехелецький І.Д. Математика: підручник для студентів. - М: Академія, 2003.

7. Суходільський В.Г. Лекції з вищої математики для гуманітаріїв. – СПБ Видавництво Санкт-Петербурзького державного університету. 2003

8. Феллер В. Введення в теорію ймовірностей та її застосування. - М: Мир, Т.2, 1984.

9. Харман Р., Сучасний факторний аналіз. - М: Статистика, 1972.


Харман Р., Сучасний факторний аналіз. - М: Статистика, 1972.

Поділіться з друзями або збережіть для себе:

Завантаження...