Jaký je v R rozdíl mezi dt (), pt () a qt () ve vztahu k distribuci studenta?


Odpověď 1:

To je někdy matoucí, rozhodl jsem se nakreslit malý obrázek, abych lépe ilustroval mou odpověď. Podobné funkce jsou pro hlavní rozdělení pravděpodobnosti implementované v R a všechny pracují stejně, v závislosti na předponě:

d - hustota, dává hodnotu funkce hustoty v daném bodě

p - pravděpodobnost, dává CDF, tj. pravděpodobnost vrácení čísla menšího než argument této funkce

q - kvantilní, inverzní CDF, tj. jaká hodnota je při daném kvantilu.

Dovolte mi to vysvětlit podrobněji. Podívejme se na distribuci s 30 stupni volnosti, která bude blízká normální distribuci.

qt (0,95,30) vrátí 1,69, což je hodnota 95. percentilu této distribuce. To znamená, že 95% všech čísel v naší distribuci je méně než 1,69 a pouze 5% je větší. Toto je obrácený CDF.

Podobně, pokud používáte pt (1,69,30), dostanete výsledek téměř 95%. Tato funkce vrací CDF, což je pravděpodobnost získání čísla menšího nebo rovného argumentu. Protože 1,69 je náš 95. percentil, je hodnota CDF skutečně 95%.

dt (x, 30) poskytne hodnotu funkce hustoty pravděpodobnosti v x. Pro 1,69 je to 0,096, což je poměrně nízko, zatímco pro 0 je to 50%.

Mějte na paměti, že nejde o pravděpodobnost získání tohoto čísla, abyste získali pravděpodobnost, musíte integrovat funkci hustoty na řadu hodnot. Proto je funkce CDF užitečná, protože výpočtem rozdílu pro dvě hodnoty můžete získat pravděpodobnost získání čísla, které patří mezi tato dvě čísla.


Odpověď 2:

Předpokládám, že se jedná o funkce Studentovy t-distribuce a na tomto základě odpovím.

dt () vrací hustotu pravděpodobnosti t-rozdělení pro daný stupeň volnosti. Mohu nakreslit t-rozdělení s 9 stupni svobody a zobrazit ho takto:

To dává:

pt () udává pravděpodobnost ocasu. Předpokládejme, že provádíte test na spodním ocasu a statistika vašeho testu je rovna -2,75 se stejnou mírou svobody. Poté můžete vypočítat pravděpodobnost dolního ocasu následujícím způsobem:

pt (-2,75, df = 9, Lower.tail = PRAVDA)

A vaše odpověď zní:

0,011

Takže odmítnete svou null na 5%, ale ne na 1%, ale jste blízko.

qt () je reverzní funkce t, kterou dáváte pravděpodobnost a dostanete kvantil t-rozdělení zpět. Předpokládejme, že jste chtěli 99% interval spolehlivosti. To by ponechalo 0,005 v obou ocasech (1 - 0,99) / 2. Protože jsem používal tabulky, které šly z mínus nekonečna na t, vypočítal bych tento kvantil jako:

qt (0,995, df = 9, nižší.tail = PRAVDA)

[1] 3,249836

>