Matematická statistika

MATEMATICKÁ STATISTIKA – věda o matematických metodách pro analýzu dat získaných při hmotnostních pozorováních (měření, experimenty). V závislosti na matematické povaze konkrétních pozorování jsou matematické statistiky rozděleny do statistik čísel, vícerozměrné statistické analýzy, analýzy funkcí (procesů) a časových řad, statistiky objektů nečíselné povahy. Podstatná část matematické statistiky je založena na pravděpodobnostních modelech.

Matematická statistika
Matematická statistika

Zvýrazněte běžné úkoly při popisu dat, vyhodnocování a testování hypotéz. Rovněž zvažují specifičtější úkoly spojené s prováděním výběrového šetření, obnovováním závislostí, budováním a používáním klasifikací (typologie) atd.

specifičtější úkoly spojené s prováděním výběrového šetření
specifičtější úkoly spojené s prováděním výběrového šetření

Popisovat data, sestavit tabulky, grafy, další vizuální reprezentace, například korelační pole. Pravděpodobnostní modely obvykle neplatí. Některé metody popisu dat jsou založeny na pokročilé teorii a možnosti moderního. počítačů. Jedná se zejména o shlukovou analýzu, která je zaměřena na identifikaci skupiny objektů, které jsou si navzájem podobné, a vícerozměrné škálování, které umožňuje vizualizaci objektů v rovině, což v nejmenším rozsahu zkresluje vzdálenost mezi nimi.

Metody pro odhad a testování hypotéz jsou založeny na pravděpodobnostních modelech generování dat. Tyto modely jsou rozděleny na parametrické a neparametrické. V parametrických modelech se předpokládá, že studované objekty jsou popsány distribučními funkcemi v závislosti na malém počtu (1–4) číselných parametrů. U neparametrických modelů se předpokládá, že distribuční funkce jsou libovolné spojité. V matematické statistice se odhadují parametry a charakteristiky distribuce (matematické očekávání, medián, rozptyl, kvantily atd.), Hustota a distribuční funkce, závislosti mezi proměnnými (na základě lineárních a neparametrických korelačních koeficientů a parametrické nebo neparametrické odhady funkcí vyjadřujících závislosti). a tak dále. Použijte bod a interval (udávající hranice pro skutečné hodnoty).

U neparametrických modelů se předpokládá, že distribuční funkce jsou libovolné spojité
U neparametrických modelů se předpokládá, že distribuční funkce jsou libovolné spojité

V matematické statistice existuje obecná teorie testování hypotéz a velké množství metod věnovaných testování specifických hypotéz. Zvažte hypotézy o hodnotách parametrů a charakteristik, o ověření homogenity (tj. O shodě charakteristik nebo distribučních funkcí ve dvou vzorcích), o shodě empirické distribuční funkce s danou distribuční funkcí nebo s parametrickou řadou těchto funkcí, symetrií distribuce atd.

hypotézy o hodnotách parametrů a charakteristik, o ověření homogenity
hypotézy o hodnotách parametrů a charakteristik, o ověření homogenity

Pro sociologii je velmi důležitá část matematických statistik spojených s prováděním výběrového šetření, s vlastnostmi různých vzorců odběru vzorků a konstrukcí vhodných metod pro hodnocení a testování hypotéz.

Úloha obnovení závislostí byla aktivně studována více než 200 let, od vývoje metody nejmenších čtverců K. Gausse v roce 1794. V současné době je nejvýznamnější metodou vyhledávání informativní podmnožiny proměnných a neparametrických metod.

Různé metody konstrukce (shluková analýza), analýza a použití (diskriminační analýza) klasifikací (typologie) se také nazývají metody rozpoznávání obrazu (s učitelem i bez učitele), automatická klasifikace atd.

Matematické metody ve statistice jsou založeny buď na použití součtů (založených na centrální limitní teorii teorie pravděpodobnosti), nebo na ukazatelích rozdílu
Matematické metody ve statistice jsou založeny buď na použití součtů (založených na centrální limitní teorii teorie pravděpodobnosti), nebo na ukazatelích rozdílu

Matematické metody ve statistice jsou založeny buď na použití součtů (založených na centrální limitní teorii teorie pravděpodobnosti), nebo na ukazatelích rozdílu (vzdálenosti, metriky), jako ve statistikách objektů numerické povahy. Obvykle jsou odůvodněné pouze asymptotické výsledky. V současné době hrají počítače v matematické statistice velkou roli. Používají se jak pro výpočty, tak pro simulační modelování (zejména metody reprodukce vzorků a studium vhodnosti asymptotických výsledků).

A.I. Orlové

Sociologický slovník / resp. ed. G.V. Osipov, L.N. Moskvichev. M, 2014, s. 498-499.