Distribuição amostral

Distribuição das médias amostrais $\overline{X}$

A distribuição das médias amostrais representa a população de todas as possíveis médias oriundas de uma amostra de tamanho $n$ de variável aleatória.

A convergência em forma de distribuição e dos parâmetros dessa distribuição amostral são elucidadas pela Lei dos Grandes Números e pelo Teorema Central do Limite (apresentado no tópico - Teoremas Limites).

De acordo com a teoria e confirmado pelo de simulações conseguimos verificar que a distribuição das médias amostrais resulta em uma distribuição na forma de uma normal, com os seguintes parâmetros:

Distribuição amostral da média

Seja $\overline{X}$ uma variável aleatória, $\overline{X} \sim N(\mu,\sigma^2/n)$.

\[ \begin{aligned} \overline{X} & = \frac{X_1 + ... + X_n}{n}\\ E[\overline{X}] & = \mu \\ V(\overline{X}) & = \frac{\sigma^2}{n}\\ \end{aligned} \]

Isso significa dizer que se a população do qual são retidas as amostras segue uma distribuição de probabilidade qualquer a variável aleatória $\overline{X}$ tenderá à uma distribuição Normal com média $\mu$ e desvio padrão $\sigma/\sqrt{n}$ a medida que o $n$ (tamanho da amostra) aumenta.

Porém se a variável aleatória $\overline{X}$ for padronizada para $Z_n$ esta tenderá à uma distribuição normal padrão, com média 0 e desvio padrão 1.

Distribuição amostral da média padronizada

Seja $Z_n$ uma variável aleatória padronizada, $Z_n \sim N(0,1)$.

\[ \begin{aligned} Z_n & = \frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\\ E[Z_n] & = 0\\ V(Z_n) & = 1\\ \end{aligned} \]

Distribuição das proporções amostrais $\hat{P}$

Da mesma forma que o exposto para as médias amostrais, a resultante para a variável aleatória proporção amostral é válida. Porém a v.a. $\hat{P}$ é oriunda da soma de v.a. Bernoulli, ou seja soma de v.a.s $X \sim Ber(p)$. Como resultado teremos uma distribuição normal, $\hat{P} \sim N(p,p(1-p)/n)$

Distribuição amostral da proporção

Seja $\hat{P}$ uma variável aleatória, $\hat{P} \sim N(p,p(1-p)/n)$ e $X \sim Ber(p)$.

\[ \begin{aligned} \hat{P} & = \frac{X_1 + ... + X_n}{n}\\ \quad \\ E[\hat{P}] & = p \\ V(\hat{P}) & = \frac{p(1-p)}{n}\\ \end{aligned} \]

Distribuição amostral da proporção padronizada

Seja $Z_n$ uma variável aleatória padronizada, $Z_n \sim N(0,1)$.

\[ \begin{aligned} Z_n & = \frac{\hat{P}-p}{\sqrt{\frac{p(1-p)}{n}}}\\ \quad\\ E[Z_n] & = 0\\ V(Z_n) & = 1\\ \end{aligned} \]

Distribuição das diferenças ou de somas de médias ou proporções amostrais

Sejam duas populações A e B, para cada uma delas os parâmetros podem ser calculados. Agora suponha que possam ser calculadas as diferenças entre as médias de todas as combinações possíveis de amostras de tamanho $n_A$ e $n_B$ das populações A e B.

Assim teremos uma distribuição denominada Distribuição Amostral das Diferenças entre médias (ou proporções). Da mesma forma se aplicam os resultados para a soma destas. Assim temos que

Distribuição amostral da diferença ou soma das médias amostrais

Seja $\overline{X_A}$ uma variável aleatória, $\overline{X}_A \sim N(\mu_A,\sigma_A^2/n)$.

Seja $\overline{X_B}$ uma variável aleatória, $\overline{X}_B \sim N(\mu_B,\sigma_B^2/n)$.

\[ E[\overline{X}_A] = \mu_A \\ V(\overline{X}_A) = \frac{\sigma_A^2}{n}\\ E[\overline{X}_B] = \mu_B \\ V(\overline{X}_B) = \frac{\sigma_B^2}{n}\\ \] A diferença é dada por:

\[ \begin{aligned} \overline{X}_{AB} & = \overline{X}_A - \overline{X}_B\\ E[\overline{X}_{A-B}] & = \mu_A - \mu_B\\ V(\overline{X}_{A-B}) & = \frac{\sigma_A^2}{n}+\frac{\sigma_B^2}{n}\\ \end{aligned} \] A soma é dada por: \[ \begin{aligned} \overline{X}_{A+B} & = \overline{X}_A + \overline{X}_B\\ E[\overline{X}_{A+B}] & = \mu_A + \mu_B \\ V(\overline{X}_{A+B}) & = \frac{\sigma_A^2}{n}+\frac{\sigma_B^2}{n}\\ \end{aligned} \]

Distribuição amostral da diferença ou soma das proporções amostrais

Seja $\hat{P}_A$ uma variável aleatória, $\hat{P}_A \sim N(p_A,p_A(1-p_A)/n_A)$.

Seja $\hat{P}_B$ uma variável aleatória, $\hat{P}_B \sim N(p_B,p_B(1-p_B)/n_B)$.

\[ \begin{aligned} E[\hat{P}_A] & = p_A \\ V(\hat{P}_A) & = \frac{p_A(1-p_A)}{n_A}\\ E[\hat{P}_B] & = p_B \\ V(\hat{P}_B) & = \frac{p_B(1-p_B)}{n_B}\\ \end{aligned} \] A diferença é dada por:

\[ \begin{aligned} \hat{P}_{A-B} & = \hat{P}_A - \hat{P}_B\\ E[\hat{P}_{A-B}] & = p_A - p_B\\ V(\hat{P}_{A-B}) & = \frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}\\ \end{aligned} \] A soma é dada por: \[ \begin{aligned} \hat{P}_{A+B} & = \hat{P}_A + \hat{P}_B\\ E[\hat{P}_{A-B}] & = p_A + p_B\\ V(\hat{P}_{A-B}) & = \frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}\\ \end{aligned} \]

Distribuição amostral da variância

Agora que temos a distribuição amostral da média da amostra, vamos voltar nossa atenção para encontrar a distribuição amostral da variância da amostra. O seguinte teorema fará o truque para nós…

Distribuição amostral da variância

Suponha que $X_1, X_2, ..., X_n$ são observações de tamanho $n$ de uma variável aleatória com distribuição Normal $\sim N(\mu, \sigma^2)$
$\overline{X} = \frac{1}{n}\sum_{i=1}^{n}{X_i}$ é a média da amostra de $n$ observações, e
$S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \overline{X})^2$ é a variância amostral de $n$ observações.

Então

$\overline{X}$ e $S^2$ são independentes
$ = $

Applet de simulação da distribuição amostral

Abaixo está disponível um applet em Java que simula o processo de tomada de amostras de tamanho $n$ e a criação da distribuição amostral.

Está disponível a simulação da distribuição amostral das seguintes v.a.s:

Média
Mediana
sd - Desvio Padrão
Variância
Variância U (n-1)
Amplitude

Este applet java foi desenvolvido por David Lane (Rice University , University of Houston Clear Lake, and Tufts University), no projeto: Online Statistics Education: A Multimedia Course of Study (http://onlinestatbook.com/). Project Leader: David M. Lane, Rice University.

Distribuição Amostral

media =

mediana =

sd =

assimetria=

curtose=

Reps=

amplitude=

Reps=

media=

mediana=

sd=

assimetria=

Curtose=

Reps=

media=

mediana=

sd=

assimetria=

Curtose=

Amostra:

Ajuste normal

Distribuição amostral

Distribuição das médias amostrais \(\overline{X}\)

Distribuição das proporções amostrais \(\hat{P}\)

Distribuição das diferenças ou de somas de médias ou proporções amostrais

Distribuição amostral da variância

Applet de simulação da distribuição amostral