Distribuição de probabilidade conjunta discreta

Em muitos casos temos interesse em analisar o comportamento probabilístico de mais de uma variável aleatória. Nestes casos devemos analisar a distribuição conjunta de probabilidades, ou seja, o comportamento simultâneo de probabilidades.

Considere duas variáveis aleatórias discretas \(X\) e \(Y\) com as PMFs \(p_X(x)\) e \(p_Y(y)\) oriundas dos espaços amostrais \(\Omega_{X}\) e \(\Omega_{Y}\). Seja \(\Omega_{X,Y}\) o espaço amostral de todos os possíveis pares observados \((x,y)\), chamado espaço conjunto de \(X\) e \(Y\). A função massa de probabilidade conjunta de \(X\) e \(Y\), \(p_{X,Y}(x,y)\) é definida por:

\[ p_{X,Y}(x,y) = \mathbb{P}(X=x,Y=y) \quad para \space (x,y) \in \Omega_{X,Y} \]

Toda e qualquer PMF conjunta satisfaz,

\[ p_{X,Y}(x,y) \ge 0 \quad para \space (x,y) \in \Omega_{X,Y} \\ \\ \sum\limits_{(x,y) \in \Omega_{X,Y}}{p_{X,Y}(x,y)} = 1\\ \\ \sum\limits_{x}\sum\limits_{x}{p_{X,Y}(x,y)} = 1 \]

Neste contexto vamos nomear as funções massa de probabilidade \(p_X(x)\) e \(p_Y(y)\) como PMF marginal.

\[ p_{X}(x) = \sum\limits_{y}{p_{X,Y}(x,y)}\\ p_{Y}(Y) = \sum\limits_{x}{p_{X,Y}(x,y)}\\ \] Vamos demonstrar essa distribuição a partir de um exemplo simples. Suponha a situação onde duas variáveis aleatórias com respostas discretizadas estão relacionadas, sendo C = clima, T = temperatura, onde \(\Omega_{C} = \{sol, chuva, neve \}\) e \(\Omega_{T}= \{quente, frio\}\), e as probabilidades são dadas a seguir:

C = clima T = temperatura Probabilidade conjunta
sol quente 0.3000000
sol frio 0.2000000
chuva quente 0.0333333
chuva frio 0.1333333
neve quente 0.0000000
neve frio 0.3333333

Organizando a table a temos o seguinte:

quente frio
sol 0.3000000 0.2000000
chuva 0.0333333 0.1333333
neve 0.0000000 0.3333333

As probabilidades conjuntas podem ser obtidas como (observe o código):

\[ p_{C,T}("quente","sol") = 0.30 \\ p_{C,T}("frio","chuva") = 0.13 \\ \]

p_CT["sol","quente"]
[1] 0.3
p_CT["chuva","frio"]
[1] 0.1333333

Distribuição de Probabilidade Marginal - PMF Marginal

As probabilidades marginais de \(C\) e \(T\) são:

\[ p_{C}(c) = \sum\limits_{t}{p_{C,T}(c,t)}\\ \]

margin.table(p_CT,margin=1)
      sol     chuva      neve 
0.5000000 0.1666667 0.3333333 

\[ p_{T}(t) = \sum\limits_{c}{p_{C,T}(c,t)}\\ \]

margin.table(p_CT,margin=2)
   quente      frio 
0.3333333 0.6666667 

Distribuição de Probabilidade Condicional - PMF Condicional

Se \(x \in \Omega_{X}\), tal que \(p_X(x) > 0\), então podemos definir a probabilidade condicional de \(Y|(X = x)\) como \(p_{Y|X}\) sendo,

\[ p_{Y|X} = \frac{p_{X,Y}(x,y)}{p_{X}(x)} \quad y \in \Omega_{Y} \]


Licença Creative Commons 4.0

Este conteúdo está disponível por meio da Licença Creative Commons 4.0