Знаймо

Додати знання

приховати рекламу

Цей текст може містити помилки.

Статистика



План:


Введення

Статистика - галузь знань, в якій викладаються загальні питання збору, вимірювання та аналізу масових статистичних (кількісних або якісних) даних.

Слово "статистика" походить від латинського status - стан справ [1]. В науку термін "статистика" ввів німецький учений Готфрід Ахенваль в 1746 році, запропонувавши замінити назву курсу "державознавство", викладав в університетах Німеччини, на "Статистику", поклавши тим самим початок розвитку статистики як науки і навчальної дисципліни. Незважаючи на це, статистичний облік вівся набагато раніше: проводились перепису населення в Стародавньому Китаї, здійснювалося порівняння військового потенціалу держав, вівся облік майна громадян в Стародавньому Римі і т. п. [2]

Статистика розробляє спеціальну методологію дослідження та обробки матеріалів: масові статистичні спостереження, метод угруповань, середніх величин, індексів, балансовий метод, метод графічних зображень і інші методи аналізу статистичних даних.


1. Розвиток уявлень про статистику

Початок статистичної практики відноситься приблизно до часу виникнення держави. Першою опублікованій статистичною інформацією можна вважати глиняні таблички Шумерського царства ( III - II тисячоліття до н.е..).

Спочатку під статистикою розуміли опис економічного і політичного стану держави або його частини. Наприклад, До 1792 р. належить визначення: "статистика описує стан держави в даний час або в певний момент відомий у минулому". І в даний час діяльність державних статистичних служб цілком укладається в це визначення [3].

Однак поступово термін "статистика" став використовуватися більш широко. За Наполеону Бонапарту, "статистика - це бюджет речей" [4]. Тим самим статистичні методи були визнані корисними не тільки для адміністративного управління, але і для застосування на рівні окремого підприємства. Згідно з формулюванням 1833 р., "мета статистики полягає в поданні фактів в найбільш стислій формі" [5]. У 2-ій половині XIX - початку XX століть сформувалася наукова дисципліна - математична статистика, що є частиною математики.

В XX столітті статистику часто розглядають передусім як самостійну наукову дисципліну. Статистика є сукупність методів і принципів, відповідно до яких проводиться збір, аналіз, порівняння, уявлення та інтерпретація числових даних. У 1954 р. академік АН УРСР Б. В. Гнеденко дав таке визначення: "Статистика складається з трьох розділів:

  1. збір статистичних відомостей, тобто відомостей, що характеризують окремі одиниці будь-яких масових сукупностей;
  2. статистичне дослідження отриманих даних, що полягає у з'ясуванні тих закономірностей, які можуть бути встановлені на основі даних масового спостереження;
  3. розробка прийомів статистичного спостереження та аналізу статистичних даних. Останній розділ, власне, й становить зміст математичної статистики ". [6]

Термін "статистика" вживають ще у двох сенсах. По-перше, в побуті під "статистикою" часто розуміють набір кількісних даних про будь-яке явище або процес. По-друге, статистикою називають функцію від результатів спостережень, використовувану для оцінки характеристик і параметрів розподілів та перевірки гіпотез.


2. Коротка історія статистичних методів

Типові приклади раннього етапу застосування статистичних методів описані в Біблії, в Старому Завіті. Там, зокрема, наводиться кількість воїнів у різних племенах. З математичної точки зору справа зводилася до підрахунку числа влучень значень спостережуваних ознак у певні градації.

Відразу після виникнення теорії ймовірностей (Паскаль, Ферма, XVII століття) імовірнісні моделі стали використовуватися при обробці статистичних даних. Наприклад, вивчалася частота народження хлопчиків і дівчаток, було встановлено відміну ймовірність народження хлопчика від 0.5, аналізувалися причини того, що в паризьких притулках ця ймовірність не та, що в самому Парижі, і т. д.

У 1794 р. (за іншими даними - в 1795 р.) німецький математик Карл Гаусс формалізував один з методів сучасної математичної статистики - метод найменших квадратів [7]. У XIX столітті помітний внесок у розвиток практичної статистики вніс бельгієць Кетле, на основі аналізу великого числа реальних даних показав стійкість відносних статистичних показників, таких, як частка самогубств серед усіх смертей [8].

Перша третина ХХ століття пройшла під знаком параметричної статистики. Вивчалися методи, засновані на аналізі даних з параметричних сімейств розподілів, описаних кривими сімейства Пірсона. Найбільш популярним було нормальне розподіл. Для перевірки гіпотез використовувалися критерії Пірсона, Стьюдента, Фішера. Були запропоновані метод максимальної правдоподібності, дисперсійний аналіз, сформульовані основні ідеї планування експерименту.

Розроблену у першій третині ХХ століття теорію аналізу даних називають параметричної статистикою, оскільки її основний об'єкт вивчення - це вибірки з розподілів, що описуються одним або невеликим числом параметрів. Найбільш загальним є сімейство кривих Пірсона, що задаються чотирма параметрами. Як правило, не можна вказати будь-яких вагомих причин, по яких розподіл результатів конкретних спостережень має входити в те чи інше параметричне сімейство. Винятки добре відомі: якщо ймовірна модель передбачає підсумовування незалежних випадкових величин, то суму природно описувати нормальним розподілом; якщо ж у моделі розглядається твір таких величин, то підсумок, мабуть, наближається логарифмічно нормальним розподілом і так далі.


3. Статистичні методи

Статистичні методи - методи аналізу статистичних даних. Виділяють методи прикладної статистики, які можуть застосовуватися у всіх галузях наукових досліджень і будь-яких галузях народного господарства, і інші статистичні методи, застосовність яких обмежена тією чи іншою сферою. Маються на увазі такі методи, як статистичний приймальний контроль, статистичне регулювання технологічних процесів, надійність та випробування, планування експериментів.


3.1. Класифікація статистичних методів

Статистичні методи аналізу даних застосовуються практично у всіх областях діяльності людини. Їх використовують завжди, коли необхідно отримати і обгрунтувати будь-які судження про групу (об'єктів або суб'єктів) з деякою внутрішньою неоднорідністю.

Доцільно виділити три види наукової і прикладної діяльності в області статистичних методів аналізу даних (за ступенем специфічності методів, поєднаної з заглибленістю в конкретні проблеми):

а) розробка і дослідження методів загального призначення, без урахування специфіки галузі застосування;

б) розробка і дослідження статистичних моделей реальних явищ і процесів у відповідності до потреб тієї чи іншої галузі діяльності;

в) застосування статистичних методів і моделей для статистичного аналізу конкретних даних.


4. Прикладна статистика

Прикладна статистика - це наука про те, як обробляти дані довільної природи. Математичною основою прикладної статистики та статистичних методів аналізу є теорія ймовірностей і математична статистика.

Опис виду даних та механізму їх породження - початок будь-якого статистичного дослідження. Для опису даних застосовують як детерміновані, так і імовірнісні методи. За допомогою детермінованих методів можна проаналізувати лише ті дані, які є в розпорядженні дослідника. Наприклад, з їх допомогою отримані таблиці, розраховані органами офіційної державної статистики на основі представлених підприємствами і організаціями статистичних звітів. Перенести отримані результати на більш широку сукупність, використовувати їх для передбачення і управління можна лише на основі ймовірнісно-статистичного моделювання. Тому в математичну статистику часто включають лише методи, що спираються на теорію ймовірностей.

У простій ситуації статистичні дані - це значення певної ознаки, властивого досліджуваних об'єктів. Значення можуть бути кількісними або бути вказівка ​​на категорію, до якої можна віднести об'єкт. У другому випадку говорять про якісне ознаці.

При вимірюванні за кількома кількісним чи якісним ознаками в якості статистичних даних про об'єкт отримуємо вектор. Його можна розглядати як новий вид даних. У такому випадку вибірка складається з набору векторів. Є частина координат - числа, а частина - якісні (категоризовать) дані, то говоримо про вектор різнотипних даних.

Одним елементом вибірки, тобто одним виміром, може бути і функція в цілому. Наприклад, що описує динаміку показника, тобто його зміна в часі, - електрокардіограма хворого або амплітуда биття вала двигуна. Або часовий ряд, що описує динаміку показників певної фірми. Тоді вибірка складається з набору функцій.

Елементами вибірки можуть бути й інші математичні об'єкти. Наприклад, бінарні відношення. Так, при опитуваннях експертів часто використовують впорядкування (ранжування) об'єктів експертизи - зразків продукції, інвестиційних проектів, варіантів управлінських рішень. Залежно від регламенту експертного дослідження елементами вибірки можуть бути різні види бінарних відносин (упорядкування, розбиття, толерантності), безлічі, нечіткі множини і т. д.

Отже, математична природа елементів вибірки в різних завданнях прикладної статистики може бути самою різною. Однак можна виділити два класи статистичних даних - числові і нечислові. Відповідно прикладна статистика розбивається на дві частини - числову статистику і нечислової статистику.

Числові статистичні дані - це числа, вектора, функції. Їх можна складати, множити на коефіцієнти. Тому в числовий статистикою велике значення мають різноманітні суми. Математичний апарат аналізу сум випадкових елементів вибірки - це (класичні) закони великих чисел і центральні граничні теореми.

Нечислові статистичні дані - це категоризовать дані, вектора різнотипних ознак, бінарні відносини, множини, нечіткі множини і ін Їх не можна складати і множити на коефіцієнти. Тому не має сенсу говорити про суми нечислових статистичних даних. Вони є елементами нечислових математичних просторів (множин). Математичний апарат аналізу нечислових статистичних даних заснований на використанні відстаней між елементами (а також заходів близькості, показників відмінності) в таких просторах. За допомогою відстаней визначаються емпіричні та теоретичні середні, доводяться закони великих чисел, будуються непараметричні оцінки щільності розподілу ймовірностей, вирішуються завдання діагностики та кластерного аналізу, і т. д. (див. [2]).

У прикладних дослідженнях використовують статистичні дані різних видів. Це пов'язано, зокрема, зі способами їх отримання. Наприклад, якщо випробування деяких технічних пристроїв тривають до певного моменту часу, то отримуємо т. н. цензуровані дані, що складаються з набору чисел - тривалості роботи ряду пристроїв до відмови, та інформації про те, що інші пристрої продовжували працювати в момент закінчення випробування. Цензуровані дані часто використовуються при оцінці і контролі надійності технічних пристроїв.


4.1. Статистичний аналіз конкретних даних

Застосування статистичних методів і моделей для статистичного аналізу конкретних даних тісно прив'язане до проблем відповідної області. Результати третього з виділених видів наукової та прикладної діяльності знаходяться на стику дисциплін. Їх можна розглядати як приклади практичного застосування статистичних методів. Але не менше підстав відносити їх до відповідної сфери діяльності людини.

4.2. Перспективи розвитку

Теорія статистичних методів націлена на вирішення реальних завдань. Тому в ній постійно виникають нові постановки математичних завдань аналізу статистичних даних, розвиваються і обгрунтовуються нові методи. Обгрунтування часто проводиться математичними засобами, тобто шляхом доведення теорем. Велику роль відіграє методологічна складова - як саме ставити завдання, які припущення прийняти з метою подальшого математичного вивчення. Велика роль сучасних інформаційних технологій, зокрема, комп'ютерного експерименту.

Актуальною є задача аналізу історії статистичних методів з метою виявлення тенденцій розвитку і застосування їх для прогнозування.


5. Обчислювальна статистика

Розвиток обчислювальної техніки в другій половині XX століття зробило значний вплив на статистику. Раніше статистичні моделі були представлені переважно лінійними моделями. Збільшення швидкодії ЕОМ та розробка відповідних чисельних алгоритмів послужило причиною підвищеного інтересу до нелінійних моделям таким, як штучні нейронні мережі, і призвело до розробки складних статистичних моделей, наприклад обощения лінійна модель і ієрархічна модель.

Набули широкого поширення обчислювальні методи, засновані на повторній вибірці як критерій перестановок і бутстреппінг, поряд методи як семплірованіє по Гиббсу дозволили більш доступно використовувати Байєсовські алгоритми. В даний час існує різноманітне статистичне програмне забезпечення загального та спеціалізованого призначення.


Примітки

  1. Райзберг Б. А., Лозівський Л. Ш., Стародубцева Е. Б. Сучасний економічний словник. 5-е изд., Перераб. і доп. - М.: ИНФРА-М, 2007. - 495 с. - (Б-ка словників "ИНФРА-М")
  2. Лекція за статистикою - Предмет і метод статистики - chaliev.narod.ru/statistics/lection1-predmet-i-metod-statistiki.html
  3. Нікітіна Є.П., Фрейдліна В.Д., Ярхо А. В. Колекція визначень терміну "статистика" - Москва: МДУ, 1972.
  4. Чупров А. А. Питання статистики - М .: Госстатіздат ЦСУ СРСР, 1960.
  5. Нікітіна Є. П., Фрейдліна В. Д., Ярхо А. Колекція визначень терміну "статистика"
  6. Гнеденко Б.В. Нарис з історії теорії ймовірностей - Москва: УРСС, 2001.
  7. Клейн Ф. Лекції про розвиток математики в XIX столітті. Частина I - Москва, Ленінград: Об'єднане науково-технічне видавництво НКТП СРСР, 1937.
  8. Плошку Б.Г., Єлісєєва І. І. Історія статистики: Учеб.пособие - Москва, Ленінград: Фінанси і статистика, 1990.

Література

  1. Орлов А. І. Прикладна статистика. Підручник. - М.: Іспит, 2006. - 671 с. - orlovs.pp.ru / stat.php # k1
  2. Норман Дрейпер, Гаррі Сміт Прикладний регресійний аналіз. Множинна регресія = Applied Regression Analysis - 3-е изд. - М .: "Діалектика", 2007. - С. 912. - ISBN 0-471-17082-8.

Цей текст може містити помилки.

Схожі роботи | скачати

Схожі роботи:
Математична статистика
Біологічна статистика
Правова статистика
Статистика запитів
Варіація (статистика)
Розмах (статистика)
Мода (статистика)
Медіана (статистика)
Прикладна статистика
© Усі права захищені
написати до нас
Рейтинг@Mail.ru