Distribuição das médias amostrais \(\overline{X}\)

A distribuição das médias amostrais representa a população de todas as possíveis médias oriundas de uma amostra de tamanho \(n\) de variável aleatória.

A convergência em forma de distribuição e dos parâmetros dessa distribuição amostral são elucidadas pela Lei dos Grandes Números e pelo Teorema Central do Limite (apresentado no tópico - Teoremas Limites).

De acordo com a teoria e confirmado pelo de simulações conseguimos verificar que a distribuição das médias amostrais resulta em uma distribuição na forma de uma normal, com os seguintes parâmetros:

Distribuição amostral da média

Seja \(\overline{X}\) uma variável aleatória, \(\overline{X} \sim N(\mu,\sigma^2/n)\).

\[ \begin{aligned} \overline{X} & = \frac{X_1 + ... + X_n}{n}\\ E[\overline{X}] & = \mu \\ V(\overline{X}) & = \frac{\sigma^2}{n}\\ \end{aligned} \]

Isso significa dizer que se a população do qual são retidas as amostras segue uma distribuição de probabilidade qualquer a variável aleatória \(\overline{X}\) tenderá à uma distribuição Normal com média \(\mu\) e desvio padrão \(\sigma/\sqrt{n}\) a medida que o \(n\) (tamanho da amostra) aumenta.

Porém se a variável aleatória \(\overline{X}\) for padronizada para \(Z_n\) esta tenderá à uma distribuição normal padrão, com média 0 e desvio padrão 1.

Distribuição amostral da média padronizada

Seja \(Z_n\) uma variável aleatória padronizada, \(Z_n \sim N(0,1)\).

\[ \begin{aligned} Z_n & = \frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\\ E[Z_n] & = 0\\ V(Z_n) & = 1\\ \end{aligned} \]

Distribuição das proporções amostrais \(\hat{P}\)

Da mesma forma que o exposto para as médias amostrais, a resultante para a variável aleatória proporção amostral é válida. Porém a v.a. \(\hat{P}\) é oriunda da soma de v.a. Bernoulli, ou seja soma de v.a.s \(X \sim Ber(p)\). Como resultado teremos uma distribuição normal, \(\hat{P} \sim N(p,p(1-p)/n)\)

Distribuição amostral da proporção

Seja \(\hat{P}\) uma variável aleatória, \(\hat{P} \sim N(p,p(1-p)/n)\) e \(X \sim Ber(p)\).

\[ \begin{aligned} \hat{P} & = \frac{X_1 + ... + X_n}{n}\\ \quad \\ E[\hat{P}] & = p \\ V(\hat{P}) & = \frac{p(1-p)}{n}\\ \end{aligned} \]
Distribuição amostral da proporção padronizada

Seja \(Z_n\) uma variável aleatória padronizada, \(Z_n \sim N(0,1)\).

\[ \begin{aligned} Z_n & = \frac{\hat{P}-p}{\sqrt{\frac{p(1-p)}{n}}}\\ \quad\\ E[Z_n] & = 0\\ V(Z_n) & = 1\\ \end{aligned} \]

Distribuição das diferenças ou de somas de médias ou proporções amostrais

Sejam duas populações A e B, para cada uma delas os parâmetros podem ser calculados. Agora suponha que possam ser calculadas as diferenças entre as médias de todas as combinações possíveis de amostras de tamanho \(n_A\) e \(n_B\) das populações A e B.

Assim teremos uma distribuição denominada Distribuição Amostral das Diferenças entre médias (ou proporções). Da mesma forma se aplicam os resultados para a soma destas. Assim temos que

Distribuição amostral da diferença ou soma das médias amostrais

Seja \(\overline{X_A}\) uma variável aleatória, \(\overline{X}_A \sim N(\mu_A,\sigma_A^2/n)\).

Seja \(\overline{X_B}\) uma variável aleatória, \(\overline{X}_B \sim N(\mu_B,\sigma_B^2/n)\).

\[ E[\overline{X}_A] = \mu_A \\ V(\overline{X}_A) = \frac{\sigma_A^2}{n}\\ E[\overline{X}_B] = \mu_B \\ V(\overline{X}_B) = \frac{\sigma_B^2}{n}\\ \] A diferença é dada por:

\[ \begin{aligned} \overline{X}_{AB} & = \overline{X}_A - \overline{X}_B\\ E[\overline{X}_{A-B}] & = \mu_A - \mu_B\\ V(\overline{X}_{A-B}) & = \frac{\sigma_A^2}{n}+\frac{\sigma_B^2}{n}\\ \end{aligned} \] A soma é dada por: \[ \begin{aligned} \overline{X}_{A+B} & = \overline{X}_A + \overline{X}_B\\ E[\overline{X}_{A+B}] & = \mu_A + \mu_B \\ V(\overline{X}_{A+B}) & = \frac{\sigma_A^2}{n}+\frac{\sigma_B^2}{n}\\ \end{aligned} \]
Distribuição amostral da diferença ou soma das proporções amostrais

Seja \(\hat{P}_A\) uma variável aleatória, \(\hat{P}_A \sim N(p_A,p_A(1-p_A)/n_A)\).

Seja \(\hat{P}_B\) uma variável aleatória, \(\hat{P}_B \sim N(p_B,p_B(1-p_B)/n_B)\).

\[ \begin{aligned} E[\hat{P}_A] & = p_A \\ V(\hat{P}_A) & = \frac{p_A(1-p_A)}{n_A}\\ E[\hat{P}_B] & = p_B \\ V(\hat{P}_B) & = \frac{p_B(1-p_B)}{n_B}\\ \end{aligned} \] A diferença é dada por:

\[ \begin{aligned} \hat{P}_{A-B} & = \hat{P}_A - \hat{P}_B\\ E[\hat{P}_{A-B}] & = p_A - p_B\\ V(\hat{P}_{A-B}) & = \frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}\\ \end{aligned} \] A soma é dada por: \[ \begin{aligned} \hat{P}_{A+B} & = \hat{P}_A + \hat{P}_B\\ E[\hat{P}_{A-B}] & = p_A + p_B\\ V(\hat{P}_{A-B}) & = \frac{p_A(1-p_A)}{n_A}+\frac{p_B(1-p_B)}{n_B}\\ \end{aligned} \]

Distribuição amostral da variância

Agora que temos a distribuição amostral da média da amostra, vamos voltar nossa atenção para encontrar a distribuição amostral da variância da amostra. O seguinte teorema fará o truque para nós…

Distribuição amostral da variância
  • Suponha que \(X_1, X_2, ..., X_n\) são observações de tamanho \(n\) de uma variável aleatória com distribuição Normal \(\sim N(\mu, \sigma^2)\)
  • \(\overline{X} = \frac{1}{n}\sum_{i=1}^{n}{X_i}\) é a média da amostra de \(n\) observações, e
  • \(S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i - \overline{X})^2\) é a variância amostral de \(n\) observações.

Então

  • \(\overline{X}\) e \(S^2\) são independentes
  • $ = $

Applet de simulação da distribuição amostral

Abaixo está disponível um applet em Java que simula o processo de tomada de amostras de tamanho \(n\) e a criação da distribuição amostral.

Está disponível a simulação da distribuição amostral das seguintes v.a.s:

  • Média
  • Mediana
  • sd - Desvio Padrão
  • Variância
  • Variância U (n-1)
  • Amplitude

Este applet java foi desenvolvido por David Lane (Rice University , University of Houston Clear Lake, and Tufts University), no projeto: Online Statistics Education: A Multimedia Course of Study (http://onlinestatbook.com/). Project Leader: David M. Lane, Rice University.



Distribuição Amostral
media =
24
mediana =
48
sd =
48

assimetria=
48

curtose=
48

Reps=
0
amplitude=
0
Reps=
0
media=
24
mediana=
48
sd=
48

assimetria=
48

Curtose=
48

Reps=
0
media=
24
mediana=
48
sd=
48

assimetria=
48

Curtose=
48