8.1 Introdução à teoria das probabilidades

A teoria de probabilidade consiste em utilizar a intuição humana para estudar os fenômenos do nosso cotidiano de trabalho. Para isso, vamos utilizar o princípio básico do aprendizado humano que é a ideia de experimento.

Podemos classificar os experimentos em dois tipos: aleatórios (casuais) e não aleatórios (determinísticos). Os experimentos determinísticos são totalmente caracterizados a priori, ou seja, são fenômenos em que o resultado é sabido antes mesmo em que ele ocorra e desta forma, nada temos a fazer.

Os experimentos que iremos estudar são os aleatórios, dos quais não sabemos o resultado a priori, ou seja, são acontecimentos cujos resultados não podem ser previstos.

A seguir tratamos os termos básicos associados a modelagem dos experimentos aleatórios.

Definição 1.1 (Espaço Amostral)

O primeiro elemento na modelagem de um experimento é o espaço amostral, que consiste no conjunto de todos os possíveis resultados do experimento. Ao estudarmos uma característica da qualidade de um processo (ou produto), o espaço amostral consiste de todos os resultados possíveis que a característica da qualidade pode assumir. Geralmente representaremos esse conjunto por S ou por $ \Omega $.

Por exemplo, se o experimento é lançar uma moeda e verificar a face voltada para cima, o espaço amostral é o conjunto S = {cara, coroa}. Para o lançamento de um dado de seis faces, o espaço amostral é S = {1, 2, 3, 4, 5, 6}.

Exemplo 1.1

Considere um experimento no qual classificamos um produto em defeituoso ou não defeituoso. Neste caso, o espaço amostral é S = {defeituoso, não defeituoso}.

Exemplo 1.2

Em um experimento para contar o número de pessoas com diabetes na cidade de São Paulo, obtemos como espaço amostral S = {0, 1, 2, 3, … }.

Ao projetarmos nosso experimento formulamos perguntas (ou conjecturas) associadas ao mesmo. Estas perguntas são denominadas eventos.

Definição 1.2

Todas as perguntas (ou conjecturas) que formulamos a respeito do experimento são denominadas EVENTOS. Os eventos serão denotados por letras maiúsculas.

Considerando novamente o exemplo de lançar um dado, podemos ter os seguintes eventos: A = {sair número par}, B = {sair número ímpar}, C = {sair número maior do que 3}. Esses eventos podem ser representados, respectivamente, pelos conjuntos: A = {2, 4, 6} , B = {1, 3, 5} e C = {4, 5, 6}. Considerando agora o experimento do Exemplo 1.1 podemos definir como eventos D = {defeituoso}, E = {não defeituoso}. Já referente ao Exemplo 1.2, ao contarmos o número de pessoas com diabetes, podemos associar eventos como A={entre 15 e 20 pessoas com diabetes} = {15,16,17,18,19,20} ou o evento F = {nenhuma pessoa} = {0}.

Em todos estes exemplos, associamos os eventos a subconjuntos do espaço amostral. Portanto, do ponto de vista matemático, vamos definir eventos como subconjuntos do espaço amostral. O próprio espaço amostral é um evento, também conhecido como evento certo, enquanto que o conjunto $ \varnothing $ é denominado de evento impossível.

1.1 - Manipulação de Eventos

Os eventos são estudados do ponto de vista de sua “ocorrência” ou “não ocorrência”. Por exemplo, o evento impossível de ocorrer é o evento vazio, enquanto que o evento certo de ocorrer é o espaço amostral. Neste módulo, vamos estabelecer uma estratégia para manipularmos os eventos. Como interpretamos os eventos como sentenças que formulamos a respeito dos resultados do experimento (subconjuntos do espaço amostral), podemos utilizar relações lógicas para manipular os eventos. As três operações básicas são:

União ($ \cup $): A união de dois conjuntos quaisquer A e B conterá todos os elementos de A e de B, incluindo os elementos que são e os que não são comuns aos dois conjuntos. Um elemento $ w \in A\cup B $ se, e só se, $ w \in A $ e/ou $ w \in B $.

Figura8.1.1

Figura 8.1.1: Representação da união de dois conjuntos

Os círculos em amarelo é o conjunto $ A \cup B $.

Podemos generalizar a definição de união para uma sequência de conjuntos $A_1$, $A_2$, … . Generalizamos tal definição da seguinte forma:

$$\displaystyle \bigcup_{i=1}^{\infty} A_i = A_1 \cup A_2 \cup \ldots = \lbrace w: w \in A_n \ \hbox{para algum n} \rbrace .$$

Interseção ($ \cap $): A interseção de dois conjuntos quaisquer A e B conterá os elementos comuns a A e B. Um elemento $ w \in A \cap B $ se, e só se, $ w \in A $ e $ w \in B $.

Figura8.1.2

Figura 8.1.2: Representação da intersecção de dois conjuntos

A região pintada em amarelo é o conjunto $ A\cap B $.

Analogamente, generalizamos esta definição para uma sequência de conjuntos $A_1$, $A_2$, $\ldots$ da seguinte forma:

$$ \displaystyle \bigcap_{i=1}^{\infty} A_i = A_1 \cup A_2 \cup \ldots = \lbrace w: w \in A_n \ \hbox{para algum n} \in \mathbb{N} \rbrace .$$

Complementar ($ A^c $): O evento complementar ao evento $A$ é o conjunto dos elementos do espaço amostral que não pertencem a $A$. Um elemento $ w \in A^c $ se, e só se, $ w \notin A $ e $ w \in S $.

Figura8.1.3

Figura 8.1.3: Representação da complementar de um conjunto

O círculo em branco é o conjunto $A$ e a região em amarelo é o conjunto Complementar de $A$ ($ A^c $).

Consideremos os seguinte eventos, associados ao lançamento de um dado: A = {sair número par} = {2, 4, 6}, B = {sair número ímpar} = {1, 3, 5} e C = {sair número maior que 3} = {4, 5, 6}. Com isso temos que

a) $ A\cup B = \lbrace (1, 2, 3, 4, 5, 6) \rbrace $.

b) $ A\cap B = \emptyset $.

c) $ A\cup C = \lbrace (2, 4, 5, 6) \rbrace $ e $ A\cap C = \lbrace (4, 6) \rbrace $.

d) $ C^c = \lbrace (1, 2, 3) \rbrace $.

Observação

Na terminologia da teoria de conjuntos, o conjunto vazio é o conjunto composto por nenhum elemento, que denotaremos por Ø. Este conjunto está contido em qualquer outro evento do espaço amostral.

Definição 1.1.1

Eventos mutuamente exclusivos (ou disjuntos) são aqueles cuja ocorrência de um elimina a possibilidade de ocorrência do outro. Ou seja, dizemos que os eventos A e B são mutuamente exclusivos se $ A \cap B $ = Ø.

A seguir, apresentamos algumas propriedades elementares das operações de união, interseção e complementar:

a) $ A\cup S = S $.

b) $ A\cap S = A $.

c) $ A\cup (B\cup C) = (A\cup B) \cup C $.

d) $ A\cap (B\cap C) = (A\cap B) \cap C $.

e) $ A\cup (B\cap C) = (A\cup B) \cap (A\cup C) $.

f) $ A\cap (B\cup C) = (A\cap B) \cup (A\cap C) $.

Considere $ A_1, A_2, \cdots $ uma família enumerável de eventos. Assim, as leis de De Morgan são dadas por:

$$ \left( \displaystyle\bigcup_{i=1}^{\infty} A_i \right)^c = \bigcap_{i=1}^{\infty} A_{i}^c$$

$$ \left( \displaystyle\bigcap_{i=1}^{\infty} A_i \right)^c = \bigcup_{i=1}^{\infty} A_{i}^c .$$

As leis de De Morgan são simples de serem demonstradas (exercício), porém serão bastante utilizadas durante nosso curso de probabilidade.

A partir das operações básicas (união, intersecção e complementar), podemos desenvolver novas operações com conjuntos. Considere A e B eventos, definimos a diferença entre estes eventos por $ A-B = A \cap B^c $.

Figura 8.1.4

Figura 8.1.4: Representação da diferença entre dois conjuntos

O conjunto em laranja representa a diferença entre dois conjuntos (A-B).

De forma similar, definimos a diferença simétrica entre dois eventos por $ A \triangle B = (A-B) \cup (B-A) $.

Figura 8.1.5

Figura 8.1.5: Representação da diferença simétrica entre dois conjuntos

O conjunto em vermelho representa a diferença simétrica ($ A \triangle B $).

A estrutura que definimos sobre a classe de eventos é denominada álgebra booleana.

Exercício

Dado uma família finita de eventos $ A_1 , \cdots , A_n $, mostre que $ \displaystyle \bigcup_{i=1}^n A_i = \displaystyle \bigcup_{i=1}^n B_i $ no qual $ B_i = A_i - \displaystyle \bigcup_{j=1}^{i-1} A_j $ são disjuntos dois a dois.

O evento $ A $ implica no evento $ B $, denotado por $ A \subset B $ se $ A = A \cap B $ ou, equivalentemente, se $ B= A \cup B $. Assim, dois eventos $ A $ e $ B $ tais que $ A \subset B $ e $ B \subset A $ são denominados iguais $ (A=B) $. Estas relações apresentam as seguintes propriedades:

$ A \subset A $: reflexiva;
$ A \subset B $ e $ B \subset A $ implicam que $ A=B $: simétrica;
$ A \subset B $ e $ B \subset C $ implicam que $ A \subset C $: transitiva.

Exercício

A partir das definições e axiomas definidos neste módulo, mostre que as relações abaixo são válidas para quaisquer eventos $ A,B,C $ e $ D $:

$ A \subset B $ implica que $ B^c \subset A^c $;
$ A-B = A - (A \cap B) = (A \cup B) - B $;
$ (A - B) \cap (C-D) = (A \cap C) - (B \cup D) $;
$ A-(B \cup C) = (A-B) \cap (A-C) $
$ A-(B \cap C)= (A-B) \cup (A=C) $

Exercício

Considere o experimento de lançamento de dois dados:

Definir o espaço amostral e a classe de eventos;
Dados os eventos $ A= $“soma das faces é número par” e o evento $ B= $ “a soma das faces é maior que 9”. Calcule $ A \cap B $.

Neste curso de probabilidade também precisamos da união e intersecção de classes de conjuntos. Se temos um número finito de conjuntos, basta aplicarmos as operações de união e intersecção diversas vezes. Entretanto, suponha que temos uma coleção infinita de conjuntos $ \lbrace A_1 , A_2 , \cdots \rbrace $. Assim, definimos

$$\displaystyle \bigcup_{i=1}^{\infty} A_i = \lbrace x: x \in A_i \hbox{ para algum } i \in \mathbb{N} \rbrace \quad \hbox{e} \quad \displaystyle \bigcap_{i=1}^{\infty} A_i = \lbrace x: x \in A_i \hbox{ para todo } i \in \mathbb{N} \rbrace$$

1.2 - Noções fundamentais de probabilidade

A probabilidade é o ato de atribuirmos pesos aos eventos. Entretanto, para que cada um não defina probabilidade de sua forma, vamos exigir que esta função peso tenha algumas propriedades intuitivas. Quando lançamos uma moeda não hesitamos em associar probabilidade $ 1/2 $ para o evento “cara” e também $ 1/2 $ para o evento “coroa”. Da mesma forma, quando lançamos uma moeda $ n $ vezes todos os $ 2^n $ possíveis resultados deste experimento tem a mesma probabilidade.

Dado um experimento com espaço amostral $ \Omega $, a classe de eventos associada será denotada por $ \mathcal{A} $ e deve satisfazer algumas propriedades:

i) $ \emptyset \in \mathcal{A} $;

ii) Se $ A \in \mathcal{A} $, então $ A^c \in \mathcal{A} $;

iii) Se $ A_1 , A_2 , \cdots \in \mathcal{A} $, então $ \displaystyle\bigcup_{i=1}^{\infty} A_i\in \mathcal{A} $.

A classe de eventos $ \mathcal{A} $ satisfazendo estas propriedades é denominada $ \sigma $-álgebra. Ao utilizarmos De Morgan, concluímos que a $ \sigma $-álgebra também é fechada por intersecção enumerável, isto é, se $ A_1 , A_2, \cdots \in \mathcal{A} $ então $ \displaystyle\bigcap_{i=1}^{\infty} A_i \in \mathcal{A} $. A seguir, vamos introduzir o conceito de probabilidade segundo Kolmogorov.

Definição 1.2.1(Probabilidade)

Para um experimento com espaço amostral $ \Omega $ e classe de eventos $ \mathcal{A} $, a probabilidade, que denotaremos por $ \mathbb{P} $, é uma função que tem domínio na classe de eventos $ (\mathcal{A}) $ e tem como imagem valores numéricos (pesos) entre 0 e 1. Além disso, a probabilidade deve satisfazer os seguintes axiomas:

i) $ \mathbb{P}(\Omega)=1 $ e $ \mathbb{P}(\emptyset)=0 $.

ii) $ 0 \leq \mathbb{P}(A) \leq 1 $, para todo evento $ A $.

iii) Para qualquer sequência de eventos mutuamente exclusivos $ A_1,A_2,\ldots $, isto é, eventos para os quais $ A_i\displaystyle\bigcap A_j=\emptyset $ quando $ i \neq j $, temos que

$$\mathbb{P}\left(\bigcup_{i=1}^\infty A_i\right)=\sum_{i=1}^{\infty}\mathbb{P}(A_i).$$

Qualquer função $ \mathbb{P} $ que atribua pesos a eventos associados a um espaço amostral e que satisfaça as propriedades (1), (2) e (3) acima será denominada probabilidade.

Propriedades da probabilidade

A seguir, apresentamos algumas propriedades elementares da probabilidade que são obtidas diretamente da definição.

P1. Se $ A^c $ for o evento complementar de $ A $, então $ \mathbb{P}(A) = 1 - \mathbb{P}(A^c) $.

De fato, sendo $ \Omega $ o espaço amostral, temos que

$$\Omega=A\cup A^c$$

onde esta união é disjunta, uma vez que $ A\cap A^c=\emptyset $. Utilizando o axioma 3 da definição de probabilidade segue que

$$\mathbb{P}(\Omega)=\mathbb{P}(A)+\mathbb{P}(A^c)\Rightarrow \mathbb{P}(A^c)=\mathbb{P}(\Omega)-\mathbb{P}(A)=1-\mathbb{P}(A)$$

como queríamos.

Uma propriedade importante para calcularmos a probabilidade de ocorrência de eventos associados ao experimento é a regra da soma, que nos dá a probabilidade da união de dois eventos quaisquer.

P2. A probabilidade da união de dois eventos $ A $ e $ B $ é calculada como

$$\mathbb{P}(A\cup B) = \mathbb{P}(A)+\mathbb{P}(B)-\mathbb{P}(A\cap B).$$ De fato, temos que $ A\cup B=A\cup (B- A) $ e $ A\cap(B - A)=\emptyset $, portanto

$$\mathbb{P}(A\cup B)=\mathbb{P}(A)+\mathbb{P}(B - A).$$ Também temos que $ B=(B- A)\cup(A\cap B) $ com $ (B - A)\cap(A\cap B)=\emptyset $, então

$$\mathbb{P}(B)=\mathbb{P}(B - A)+\mathbb{P}(A\cap B).$$

Então, combinando estes dois resultados, temos que

$$\mathbb{P}(A\cup B)=\mathbb{P}(A)+\mathbb{P}(B)-\mathbb{P}(A\cap B)$$

como queríamos demonstrar.

P3. Se $ A $, $ B $ e $ C $ são três eventos quaisquer, então

$$\mathbb{P}(A\cup B\cup C) = \mathbb{P}(A)+\mathbb{P}(B)+\mathbb{P}(C)-\mathbb{P}(A\cap B)-\mathbb{P}(A\cap C)-\mathbb{P}(B\cap C)+\mathbb{P}(A\cap B\cap C).$$

De fato, temos que

$$A\cup B\cup C=(A\cup B)\cup C=(A\cup B)\cup (C - (A\cup B))$$ sendo esta união disjunta. Então pelo axioma 3 da definição de probabilidade, temos que

$$\mathbb{P}(A\cup B\cup C)=\mathbb{P}(A\cup B)+\mathbb{P}(C - (A\cup B)) \tag{1}$$

e utilizando a propriedade P2 na equação (1) temos

$$\mathbb{P}(A\cup B\cup C)=\mathbb{P}(A)+\mathbb{P}(B)-\mathbb{P}(A\cap B)+\mathbb{P}(C - (A\cup B)).$$

Mas $ C=(C - (A\cup B))\cup(C\cap(A\cup B)) $, sendo que esta união é disjunta, portanto

$$\mathbb{P}(C - (A\cup B))=\mathbb{P}(C)-\mathbb{P}(C\cap(A\cup B)) \tag{2}$$ Também temos que $ C\cap (A\cup B)=(C\cap A)\cup (C\cap(B-A)) $, e esta união é disjunta. Daí

$$\mathbb{P}(C\cap (A\cup B))=\mathbb{P}(A\cap C)+\mathbb{P}(C\cap(B- A)) \tag{3}$$ Finalmente, $ C\cap B = (A\cap B\cap C)\cup (C\cap(B- A)) $, o que implica que

$$\mathbb{P}(C\cap(B- A))=\mathbb{P}(B\cap C)-\mathbb{P}(A\cap B\cap C) \tag{4}$$ já que a união é disjunta.

Então, combinando as equações (1), (2), (3) e (4), concluímos que

$$\mathbb{P}(A\cup B\cup C)=\mathbb{P}(A)+\mathbb{P}(B)+\mathbb{P}(C)-\mathbb{P}(A\cap B)-\mathbb{P}(A\cap C)-\mathbb{P}(B\cap C)+\mathbb{P}(A\cap B\cap C)$$

como queríamos demonstrar.

P4. Se A $ \subset $ B, então $ \mathbb{P}(A) \leq \mathbb{P}(B) $.

De fato, temos que se $ A\subset B $ então $ B = A\cup (B - A) $, sendo que esta união é disjunta. Portanto, utilizando o axioma 3 da definição de probabilidade, segue que

$$\mathbb{P}(B)=\mathbb{P}(A)+\mathbb{P}(B- A).$$

Como $ \mathbb{P}(B- A)\geq 0 $, temos então que $ \mathbb{P}(B)\geq \mathbb{P}(A) $, como queríamos demonstrar.

P5. Se $ A\subset B \Rightarrow \mathbb{P}(B-A)=\mathbb{P}(B)-\mathbb{P}(A) $

De fato observe que $ B=A\cup (B-A) $, e ainda que $ A\cap (B-A)=\emptyset $. Assim podemos utilizar o axioma 3

$$\mathbb{P}(B)=\mathbb{P}(A\cup (B-A))=\mathbb{P}(A)+\mathbb{P}(B-A)\Rightarrow \mathbb{P}(B-A)=\mathbb{P}(B)-\mathbb{P}(A).$$

P6. Sejam $ A_1,A_2, \cdots $ eventos aleatórios tais que $ A_n \downarrow \emptyset $, ou seja, $ A_1 \supset A_2 \supset A_3 \supset \cdots $ e ainda o $ \displaystyle \lim_{n\rightarrow \infty}A_n=\emptyset $, então $ P(A_n)\rightarrow 0 $.

Como $ A_1 \supset A_2 \supset A_3 \supset \cdots $ então

$$A_1=(A_1-A_2)\cup (A_2 - A_3)\cup \cdots = \displaystyle \bigcup_{i=1}^{\infty}(A_i-A_{i+1}).$$

Isto é ilustrado através do diagrama:

Figura 8.1.6

Figura 8.1.6: Diagrama de uma sequencia encaixada

Observe que cada $ A_i - A_{i+1} $ são conjuntos disjuntos, pois a sequência é uma sequência decrescente. Pelo axioma 3 temos então que

$$\mathbb{P}(A_1)=\mathbb{P}\left(\displaystyle \bigcup_{i=1}^{\infty}(A_i-A_{i+1})\right)=\displaystyle\sum_{i=1}^{\infty}\mathbb{P}(A_i-A_{i+1}).$$

Logo por P5 $ \mathbb{P}(A_i-A_{i+1})=\mathbb{P}(A_i)-\mathbb{P}(A_{i+1}) $, e portanto

$$\mathbb{P}(A_1)=\lim_{n \rightarrow \infty} \displaystyle\sum _{i=1}^{n-1}\mathbb{P}(A_i-A_{i+1}).$$

Note que os termos da somatória vão se cancelando restando apenas o primeiro e o último, assim

$$\mathbb{P}(A_1)= \displaystyle \lim_{n \rightarrow \infty} \mathbb{P}(A_1) - \mathbb{P}(A_n)=\mathbb{P}(A_1) - \lim_{n \rightarrow \infty} \mathbb{P}(A_n) \Rightarrow \lim_{n \rightarrow \infty}\mathbb{P}(A_n)=0.$$

Portanto $ \mathbb{P}(A_n)\rightarrow 0 $.

P7. Sejam $ A_1, A_2, \cdots , A_n $ uma sequência de eventos aleatórios, então

$$\mathbb{P}\left(\displaystyle \bigcup_{i=1}^{n}A_i\right)\leq \displaystyle\sum_{i=1}^{n} \mathbb{P}(A_i).$$

Vamos mostrar essa propriedade por indução finita, para isto mostremos primeiramente que $ \mathbb{P}(A_1\cup A_2)\leq \mathbb{P}(A_1)+\mathbb{P}(A_2) $, de fato por P2

$$\mathbb{P}(A_1\cup A_2)=\mathbb{P}(A_1)+\mathbb{P}(A_2)-\mathbb{P}(A_1\cap A_2)\Rightarrow \mathbb{P}(A_1\cup A_2)\leq \mathbb{P}(A_1)+\mathbb{P}(A_2),$$

pois $ \mathbb{P}(A_1 \cap A_2)\geq 0 $. Agora vamos supor que esta propriedade seja válida para $ n-1 $, ou seja, que

$$\mathbb{P}\left(\displaystyle \bigcup_{i=1}^{n-1}A_i\right)\leq \displaystyle\sum_{i=1}^{n-1} P(A_i)$$

e mostremos que é válida para $ n $. Note que

$$\mathbb{P}\left( \bigcup_{i=1}^{n}A_i\right)=\mathbb{P}\left(\bigcup_{i=1}^{n-1}A_i \cup A_n\right)=\mathbb{P}(C \cup A_n)=\mathbb{P}(C)+\mathbb{P}(A_n)-\mathbb{P}(C\cap A_n)\leq \mathbb{P}(C)+\mathbb{P}(A_n),$$

no qual $ C=\displaystyle \bigcup_{i=1}^{n-1}A_i $, e pela nossa hipótese de indução temos que

$$\mathbb{P}(C)+\mathbb{P}(A_n)\leq \displaystyle\sum_{i=1}^{n-1} \mathbb{P}(A_i) + \mathbb{P}(A_n)= \displaystyle\sum_{i=1}^{n} \mathbb{P}(A_i).$$

e, portanto, concluímos nossa demonstração.

P8. (Continuidade da Probabilidade). Se $ A_n\uparrow A $, então

$$\mathbb{P}(A_n)\uparrow \mathbb{P}(A).$$

Similarmente se $ A_n\downarrow A $ então

$$\mathbb{P}(A_n)\downarrow \mathbb{P}(A).$$

Primeiramente vamos considerar o caso em que $ A_n\downarrow A $, ou seja, $ A_{n+1}\subset A_n $ para qualquer $ n\in\mathbb{N} $ e $ \displaystyle \bigcap_{n\geq 1}A_n=A $. Assim sendo, por P4 temos que $ \mathbb{P}(A_{n+1})\leq \mathbb{P}(A_n) $, pois $ A_{n+1}\subset A_n $.

Além disso, por propriedades de conjunto temos que $ A_n-A\downarrow \emptyset $, o que implica por P6 que

$$\mathbb{P}(A_n-A)\rightarrow 0.$$ Por P5 temos que

$$\mathbb{P}(A_n - A)=\mathbb{P}(A_n)-\mathbb{P}(A)\Rightarrow \mathbb{P}(A_n)-\mathbb{P}(A)\rightarrow 0\Rightarrow \mathbb{P}(A_n)\rightarrow \mathbb{P}(A)$$

mas a sequência $ \lbrace \mathbb{P}(A_n) \rbrace_{n\in\mathbb{N}} $ é descrescente por P4, logo $ \mathbb{P}(A_n)\downarrow \mathbb{P}(A) $

Agora se $ A_n\uparrow A $, ou seja $ A_n\subset A_{n+1} $ com $ \displaystyle \bigcup_{n\geq 1}{A_n}=A $, então $ A_n^c\downarrow A^c $. Portanto pelo que foi demonstrado acima temos que

$$\mathbb{P}(A_n^c)\downarrow \mathbb{P}(A^c)$$ ou seja,

$$1-\mathbb{P}(A_n)\downarrow 1-\mathbb{P}(A)\Rightarrow \mathbb{P}(A_n)\uparrow \mathbb{P}(A)$$

P9. Sejam $ A_1, A_2, \cdots $ uma sequência de eventos aleatórios, então

$$\mathbb{P}\left(\displaystyle \bigcup_{i=1}^{\infty}A_i\right)\leq \displaystyle\sum_{i=1}^{\infty} \mathbb{P}(A_i).$$

Observemos que se definirmos $ C_n=\displaystyle \bigcup_{i=1}^{n}A_i $, temos então que $ C_n $ é uma sequência monótona crescente, ou seja, $ C_n\uparrow C $, no qual C é definido como $ C=\displaystyle \bigcup_{i=1}^{\infty}A_i $. Mas a probabilidade é uma função contínua em uma sequência monótona crescente como podemos ver em P8, assim sendo temos que $ \mathbb{P}(C_n)\uparrow P(C) $.

Mas por P7 temos que

$$\mathbb{P}(C_n)= \mathbb{P}\left(\bigcup_{i=1}^{n}A_i\right)\leq\sum_{i=1}^{n} \mathbb{P}(A_i),$$ por outro lado

$$\mathbb{P}\left( \bigcup_{i=1}^{\infty}A_i\right)= \mathbb{P}(C)=\lim_{n\rightarrow \infty}\mathbb{P}(C_n)\leq\lim_{n\rightarrow \infty}\sum_{i=1}^{n} \mathbb{P}(A_i)= \displaystyle\sum_{i=1}^{\infty} \mathbb{P}(A_i),$$

ou seja

$$\mathbb{P}\left(\displaystyle \bigcup_{i=1}^{\infty}A_i\right)\leq \displaystyle\sum_{i=1}^{\infty} \mathbb{P}(A_i).$$

P10. $ \mathbb{P}\left(\displaystyle \bigcap_{k=1}^{n} A_k\right)\geq 1- \displaystyle\sum_{k=1}^{n} \mathbb{P}(A_{k}^{C}) $.

Por De Morgan temos que $ \displaystyle \bigcup_{k=1}^{n}A_k^{C}=\left(\displaystyle\bigcap_{k=1}^{n}A_k\right)^{C} $. Assim

$$1-\mathbb{P}\left(\displaystyle\bigcap_{k=1}^{n}A_k\right) = \mathbb{P}\left[\left(\displaystyle\bigcap_{k=1}^{n}A_k\right)^{C}\right] = \mathbb{P}\left(\bigcup_{k=1}^{n}A_k^C\right)\Rightarrow \mathbb{P}\left(\displaystyle \bigcap_{k=1}^{n} A_k\right)\geq 1- \displaystyle\sum_{k=1}^{n} \mathbb{P}(A_{k}^{C}).$$

P11. $ \mathbb{P}\left(\displaystyle\bigcap_{k=1}^{\infty} A_k\right)\geq 1- \displaystyle \sum_{k=1}^{\infty}\mathbb{P}(A_{k}^{C}) $.

Tomemos $ C_n=\displaystyle\bigcap_{k=1}^{n} A_k $, observe que $ C_n \supset C_{n+1} $, logo $ C_n\downarrow C $, no qual $ C=\displaystyle\bigcap_{k=1}^{\infty} A_k $. Assim como a função de probabilidade é continua em uma sequência monótona temos que $ \mathbb{P}(C_n)\downarrow \mathbb{P}(C) $, portanto temos que

$$\mathbb{P}\left(\bigcap_{k=1}^{\infty} A_k\right)=\mathbb{P}(C)= \lim_{n\rightarrow \infty}\mathbb{P}(C_n)\geq 1-\lim_{n\rightarrow \infty}\displaystyle\sum_{i=1}^{n}\mathbb{P}(A_i^{C})= 1- \displaystyle\sum_{i=1}^{\infty} \mathbb{P}(A_i^{C}).$$

P12. Se $ \mathbb{P}(A_n)=0 $, para $ n=1,2,\cdots $, então

$$\mathbb{P}\left(\displaystyle\bigcup_{n=1}^{\infty} A_n\right)=0.$$

Por P9 e pela primeiro axioma temos que

$$0\leq \mathbb{P}\left(\displaystyle\bigcup_{n=1}^{\infty} A_n\right)\leq \displaystyle\sum_{i=1}^{\infty} \mathbb{P}(A_i)=0\Rightarrow \mathbb{P}(\displaystyle\bigcup_{n=1}^{\infty} A_n)=0.$$

P13. Se $ \mathbb{P}(A_n)=1 $, para $ n=1,2,\cdots $, então

$$\mathbb{P}\left(\displaystyle\bigcap_{n=1}^{\infty} A_n\right)=1.$$

Por P11 e pelo primeiro axioma temos que

$$1\geq \mathbb{P}\left(\bigcap_{n=1}^{\infty} A_n\right) \geq 1- \displaystyle\sum_{i=1}^{\infty} \mathbb{P}(A_i^{C})=1 \Rightarrow \mathbb{P}\left(\displaystyle\bigcap_{n=1}^{\infty} A_n\right)=1.$$

P14. Se $ A_1,A_2, \cdots $ e $ B_1,B_2,\cdots $ são eventos aleatórios, tais que $ \mathbb{P}(A_n)\rightarrow 1 $ e $ \mathbb{P}(B_n)\rightarrow p $, quando $ n \rightarrow \infty $, então $ \mathbb{P}(A_n \cap B_n) \rightarrow p $.

Observemos primeiramente que por P2 $ \mathbb{P}(A_n \cap B_n) = \mathbb{P}(A_n)+\mathbb{P}(B_n) - \mathbb{P}(A_n \cup B_n) $, mas $ \mathbb{P}(A_n)\rightarrow 1 $ e $ \mathbb{P}(B_n)\rightarrow p $ e $ \mathbb{P}(A_n)\leq \mathbb{P}(A_n\cup B_n)\leq 1 $, pois $ A_n \subset (A_n \cup B_n) $, e assim temos que

$$\lim_{n \rightarrow \infty} \mathbb{P}(A_n)=1\leq \lim_{n \rightarrow \infty} \mathbb{P}(A_n \cup B_n)\leq1 \Rightarrow \mathbb{P}(A_n \cup B_n)\rightarrow 1.$$

Logo, como $ \mathbb{P}(A_n \cap B_n) - \mathbb{P}(B_n)=\mathbb{P}(A_n) - \mathbb{P}(A_n \cup B_n) $, temos então que $ \mathbb{P}(A_n \cap B_n) - \mathbb{P}(B_n)\rightarrow 0 $, e portanto $ \mathbb{P}(A_n \cap B_n) \rightarrow p $.

Exemplo 1.2.1

Considerando o evento A={sair número par} e o evento C={sair número maior que 3} no lançamento de um dado, temos que

$$\mathbb{P}(A\cup C)=\mathbb{P}(A)+\mathbb{P}(C)-\mathbb{P}(A\cap C)=\frac{3}{6}+\frac{3}{6}-\frac{2}{6} = \frac{4}{6}.$$

Exemplo 1.2.2

Consideremos o experimento de lançarmos 3 moedas honestas simultaneamente, e observamos a face voltada para cima. Qual é a probabilidade de obtermos 3 caras? Neste mesmo experimento qual seria a probabilidade de obtermos pelo menos 2 caras?

Primeiramente vamos construir nosso espaço amostral, denotaremos por C=cara e K=coroa.

$$\Omega = \lbrace (C,C,C);(C,C,K);(C,K,C);(K,C,C);(K,K,C);(K,C,K);(C,K,K);(K,K,K) \rbrace$$

Logo temos que $ \Omega $ tem 8 elementos; o evento A={Obter 3 caras}={(C,C,C)}.

Assim como as moedas são honestas temos que existe igual probabilidade para cada elemento do espaço amostral $ \Omega $

Sendo assim:

$$\mathbb{P}(A)=\frac{\hbox{Número~de~elementos~favoráveis~a~A}}{\hbox{Número~de~elementos~do~espaço~amostral}}=\frac{1}{8}$$

Agora vamos analisar a probabilidade de obtermos pelo menos 2 caras. Seja B={obter pelo menos 2 caras}={(C,C,C);(C,C,K);(C,K,C);(K,C,C)}, então

$$\mathbb{P}(B)=\frac{\hbox{Número~de~elementos~favoráveis~a~B}}{\hbox{Número~de~elementos~do~espaço~amostral}}=\frac{4}{8}=\frac{1}{2}.$$

Exemplo 1.2.3

Sejam $ A_1, A_2, \dots $ eventos aleatórios em uma espaço de probabilidade $ (\Omega,\mathbb{A},\mathbb{P}) $, e definam-se

$$\limsup_{n\rightarrow \infty} A_n=\bigcap_{n=1}^\infty \bigcup_{k=n}^\infty A_k,$$

$$\liminf_{n\rightarrow \infty} A_n=\bigcup_{n=1}^\infty \bigcap_{k=n}^\infty A_k,$$

$$\limsup_{n\rightarrow \infty} A_n=\liminf_{n\rightarrow \infty} A_n=A,$$

chamamos o evento A de $ \lim_{n\rightarrow \infty} A_n $ (limite de $ A_n $). Demonstre que se $ A=\lim A_n $ então $ \mathbb{P}(A_n)\rightarrow \mathbb{P}(A) $

quando $ n\rightarrow \infty $.

Dem:

Fazendo $ B_n=\bigcap_{k=1}^n \bigcup_{j=k}^\infty A_j $ então $ B_1\supseteq B_2 \supseteq \dots $. Então, $ B_n\downarrow \limsup A_n=A $ então pela propriedade

P8 temos que $ \mathbb{P}(B_n)\downarrow \mathbb{P}(A) $.

Analogamente $ C_n \uparrow \limsup A_n=A $ então pela propriedade P8 temos que $ \mathbb{P}(C_n)\uparrow \mathbb{P}(A) $

Agora $ A_n \subset \bigcap_{k=1}^n\bigcup_{j=k}^\infty A_j $ e $ A_n\supseteq \bigcup_{k=1}^n \bigcap_{j=k}^\infty A_j $ e então $ C_n\subset A_n \subset B_n $

então pela propriedade

$$\mathbb{P}(C_n)\leq \mathbb{P}(A_n)\leq \mathbb{P}(B_n)$$

Então, temos que $ \mathbb{P}(A_n)\rightarrow \mathbb{P}(A). $

Proposição 1.2.1 (Desigualdades de Bonferroni)

As seguintes desigualdades de Bonferroni são válidas

(i)

$$\sum_{i=1}^{n}\mathbb{P}(A_i)-\sum_{1\leq i < j \leq n}\mathbb{P}(A_i\cap A_j)\leq \mathbb{P}\left(\bigcup_{i=1}^n A_i\right)\leq$$

$$\sum_{i=1}^{n}\mathbb{P}(A_i)-\sum_{1\leq i < j\leq n}\mathbb{P}(A_i\cap A_j)+\sum_{1\leq i < k\leq n}\mathbb{P}(A_i\cap A_j\cap A_k)$$

(ii) Se $ k $ é ímpar, $ k\leq n $, então

$$\mathbb{P}\left(\bigcup_{i=1}^n A_i\right)\leq \sum_{i=1}^{n}\mathbb{P}(A_i)-\sum_{1\leq i_1 < i_2\leq n}\mathbb{P}(A_{i_1}\cap A_{i_2})+\dots$$

$$+(-1)^{k-1}\sum_{i\leq i_1 < \dots < i_k\leq n}\mathbb{P}(A_{i_1}\cap \dots \cap A_{i_k})$$

se k é par, $ k\leq n $ vale $ \geq $ nesta última desigualdade.

Demonstração:

(i) Primeiramente vamos mostrar que

$$\sum_{k=1}^{n}\mathbb{P}(A_k)-\sum_{1\leq i < j\leq n}\mathbb{P}(A_i\cap A_j)\leq \mathbb{P}\left(\bigcup_{i=1}^n A_i\right)$$

Vamos mostrar por indução, sabemos que $ n=2 $ vale pois $ \mathbb{P}(A)+\mathbb{P}(B)=\mathbb{P}(A\cup B). $

Agora suponhamos que vale para n, então

$$\mathbb{P}\left(\bigcup_{i=1}^{n+1} A_i\right)=\mathbb{P}\left(A_{n+1}\bigcup\left(\bigcup_{i=1}^n A_i\right)\right)=\mathbb{P}(A_{n+1})+\mathbb{P}\left(\bigcup_{i=1}^n A_i\right)-\mathbb{P}\left(A_{n+1}\bigcap\left(\bigcup_{i=1}^n A_i\right)\right)$$

$$\geq \mathbb{P}(A_{n+1})+\left[\sum_{i=1}^{n}\mathbb{P}(A_i)-\sum_{1\leq i < j\leq n}\mathbb{P}(A_i\cap A_j)\right]-\mathbb{P}\left(\bigcup_{i=1}^n (A_{n+1}\cap A_i)\right)$$

$$\geq \sum_{i=1}^{n+1}\mathbb{P}(A_i)-\sum_{1\leq i < j\leq n+1} \mathbb{P}(A_i\cap A_j)-\sum_{1\leq i < j\leq n+1} \mathbb{P}(A_i\cap A_j)$$

Com

$$\left[\sum_{i=1}^{n}\mathbb{P}(A_i)-\sum_{1\leq i < j\leq n}\mathbb{P}(A_i\cap A_j)\right]$$

sendo a hipótese de indução.

Então, temos que

$$\sum_{k=1}^{n}\mathbb{P}(A_k)-\sum_{1\leq i < j\leq n}\mathbb{P}(A_i\cap A_j)\leq \mathbb{P}\left(\bigcup_{i=1}^n A_i\right)$$

Agora vamos mostrar que também por indução que

$$\mathbb{P}\left(\bigcup_{i=1}^{n+1}A_i\right)\leq \sum_{i=1}^{n+1}\mathbb{P}(A_i)-\sum_{1\leq i < j\leq n} \mathbb{P}(A_i\cap A_j)+\sum_{1\leq i < j < k\leq n}\mathbb{P}(A_i\cap A_j\cap A_k)$$

Assim, $ n=3 $ vale a desigualdade pois pela propriedade P3

Agora suponhamos que vale para $ n $ provamos que vale para $ n+1 $

$$\mathbb{P}\left(\bigcup_{i=1}^{n+1}A_i\right)=\mathbb{P}\left(A_{n+1}\cup\left(\bigcup A_i\right)\right)=\mathbb{P}(A_{n+1})+\mathbb{P}\left(\bigcup_{i=1}^{n+1} A_i\right)-\mathbb{P}\left(A_{n+1}\cap \left(\bigcup_{i=1}^n A_i\right)\right)$$

$$\leq \mathbb{P}(A_{n+1})+\left[\sum_{i=1}^{n}\mathbb{P}(A_i)-\sum_{1\leq i < j\leq n}\mathbb{P}(A_i\cap A_j)+\sum_{1\leq i < j < k \leq n}\mathbb{P}\left(A_i\cap A_j\cap A_k\right)\right]-\mathbb{P}\left(\bigcup_{i=1}^n (A_{n+1}\cap A_i)\right)$$

Pela desigualdade anterior temos que

$$\mathbb{P}\left(\bigcup_{i=1}^{n} A_{n+1}\cap A_i\right)\geq \sum_{i=1}^{n}\mathbb{P}(A_{n+1}\cap A_i)-\sum_{1\leq i < j \leq n}\mathbb{P}(A_{n+1}\cap A_i \cap A_j)$$

Então, temos que

$$\mathbb{P}\left(\bigcup_{i=1}^{n+1}A_i\right)\leq \sum_{i=1}^{n+1}\mathbb{P}(A_i)-\sum_{1\leq i < j \leq n+1}\mathbb{P}(A_i\cap A_j)+ \sum_{1\leq i < j < k\leq n+1}\mathbb{P}(A_i\cap A_j\cap A_k)$$

ii) Definimos

$$S_1=\sum_{i=1}^n \mathbb{P}(A_i)$$

$$S_2=\sum_{1\leq i_1 < i_2\leq n} \mathbb{P}(A_{i_1}\cap A_{i_2} )$$

$$\vdots$$

$$S_n=\sum_{1\leq i_1 < i_2 < \dots < i_n\leq n} \mathbb{P}(A_{i_1}\cap A_{i_2}\cap\dots \cap A_{i_n} )$$

Então por $ (i) $ temos

$$\mathbb{P}\left(\bigcup_{i=1}^n A_i\right)=\sum_{i=1}^n (-1)^{i-1}S_i \tag{I}$$

Agora, vamos introduzir a seguinte notação:

$ P_m= $ [ é a probabilidadede que ocorram pelo menos m dos eventos $ A_1, A_2, \dots, A_n $]

$ P_{\lceil m\rceil}= $ [ é a probabilidade de que ocorram exatamente m dos eventos $ A_1, A_2, \dots, A_n $]

então

$$P_m=P_{\lceil m\rceil}+P_{\lceil m+1\rceil}+\dots+P_{\lceil n\rceil} \tag{II}$$

Agora observe que

$$P_{m+1}=P_{m}-P_{\lceil m\rceil}$$

usando a equação (I), podemos exprimir $ P_m $ em termos de $ S_m,S_{m+1},\dots, S_n $. Assim, temos que

$$P_m=S_m-\binom{m}{m-1}S_{m+1}+\binom{m+1}{m-1}S_{m+2}+\dots \pm \binom{n-1}{m-1}S_n \tag{III}$$

Porém, podemos expressar $ S_v $ em temos de $ P_{\lceil k\rceil} $ da seguinte forma

$$S_v=\sum_{k=v}^n \binom{k}{v}P_{\lceil k\rceil} \tag{IV}$$

Então, provar a desigualdade de Bonferroni é equivalente a provar para $ m=1 $ que se conservam-se apenas os termos $ S_1, S_2, \dots, S_v $ e podemos descartar os termos $ S_{v+1}, S_{v+2}, \dots, S_n $. Então, o erro tem o sinal do primeiro termo omitido (a saber $ (-1)^v $) e é menor em valor absoluto o que através de $ (III) $ se verifica quando:

$$\sum_{v=t}^n (-1)^{v-t}\binom{v}{1}S_v \geq 0 \tag{V}$$

para todo $ t=1,2,\dots, n $. Agora de $ (IV) $ em $ (V) $ o que implica que

$$\sum_{v=t}^n (-1)^{v-t}\binom{v}{1}\sum_{k=v}^n \binom{n}{v}P_{\lceil k\rceil}$$

Agora, isto é uma combinação linear dos $ P_{\lceil k\rceil} $, no qual para $ t \leq k < n $ o coeficiente de $ P_{\lceil k\rceil} $ é igual a

$$\sum_{v=t}^k (-1)^{v-t}\binom{v}{1}\binom{k}{v}=\binom{k}{1}\sum_{v=t}^{k}(-1)^{v-t}\binom{k-1}{v-1}=\binom{k}{1}\binom{k-2}{t-2}\geq 0.$$

Portanto, (V) é satisfeita e o resultado segue.

1.3 - Eventos Equiprováveis

Se um experimento tem como espaço amostral $ \Omega = (e_1,e_2,\ldots,e_n) $, com um número finito de elementos, dizemos que os eventos elementares $ (e_i) $ são equiprováveis, se todos tem a mesma probabilidade de ocorrer, isto é

$$\mathbb{P}(e_i)=\frac{1}{n}.$$

Desta forma, podemos definir a probabilidade de um evento $ E = (e_{j1},\ldots,e_{jk}) $, composto por $ k $ elementos (com $ k $ menor que $ n $), como sendo:

$$\mathbb{P}(E)=\frac{\text{número de casos favoráveis a E}}{\text{número de casos possíveis de S}}=\frac{k}{n}.$$

No lançamento de um dado honesto, os elementos do espaço amostral $ \Omega = (1, 2, 3, 4, 5, 6) $ são equiprováveis, pois cada elemento do espaço amostral tem a mesma chance de ocorrer, ou seja, a chance de sair 1 é a mesma de sair 2, que é a mesma de sair 3, e assim por diante. Portanto,

$$\mathbb{P}(1)=\mathbb{P}(2)=\mathbb{P}(3)=\mathbb{P}(4)=\mathbb{P}(5)=\mathbb{P}(6)=\frac{1}{6}.$$

Com isso e da propriedade (3) de probabilidade, temos que, se $ A $ é o evento sair número par no lançamento de um dado, então

$$\mathbb{P}(A)=\mathbb{P}( \ 2 \ \hbox{ou} \ 4 \ \hbox{ou} \ 6 \ )=\mathbb{P}((2)\cup(4)\cup(6))=\frac{1}{6}+\frac{1}{6}+\frac{1}{6}=\frac{3}{6}.$$

Com isso, obtemos que a probabilidade de ocorrer o evento $ A $ é igual ao número de elementos favoráveis a $ A = (2, 4, 6) $, que é 3 (pois $ A $ tem 3 elementos), dividido pelo número de elementos no espaço amostral $ \Omega $, que é $ 6 $.

Exemplo 1.3.1

Em um jogo de dados são lançados dois dados honestos simultaneamente. Para que um jogador ganhe, um dos seguintes eventos deve ocorrer: “soma das duas faces deve ser igual a 7”, ou que o “maior valor obtido nos dois dados seja no máximo 3”. Qual das duas possibilidades ele deve escolher? Primeiramente vamos analisar o nosso espaço amostral, que é dado pela tabela abaixo:

	1	2	3	4	5	6
1	(1,1)	(1,2)	(1,3)	(1,4)	(1,5)	(1,6)
2	(2,1)	(2,2)	(2,3)	(2,4)	(2,5)	(2,6)
3	(3,1)	(3,2)	(3,3)	(3,4)	(3,5)	(3,6)
4	(4,1)	(4,2)	(4,3)	(4,4)	(4,5)	(4,6)
5	(5,1)	(5,2)	(5,3)	(5,4)	(5,5)	(5,6)
6	(6,1)	(6,2)	(6,3)	(6,4)	(6,5)	(6,6)

Tabela 8.1.1: Espaço amostral do lançamento de dois dados.

Note que o número de elementos do nosso espaço amostral é de $ 36 $. Seja $ A=(\text{conjunto dos pares} \ (i,j) \ \text{tais que} \ i+j=7) $, esses pares aparecem em amarelo na figura a baixo.

Figura 8.1.7

Figura 8.1.7: Pares cujas somas é igual a 7

As células em amarelo representam o conjuntos dos pares tais que a soma é igual a $ 7 $.

Observe que o número de elementos do conjunto $ A $ é igual a $ 6 $, ou seja, existem $ 6 $ pares para os quais a soma é $ 7 $. Assim, a probabilidade que procuramos é dada por:

$$\mathbb{P}(A)=\frac{\text{Número de elementos favoráveis a A}}{\text{Número de elementos do espaço amostral}}=\frac{6}{36}=\frac{1}{6}.$$

Desta forma, a probabilidade de um jogador ganhar neste jogo é de $ \frac{1}{6} $ caso ele escolha a possibilidade da soma ser igual $ 7 $. Vamos agora calcular a probabilidade do jogador vencer no caso em que o maior valor obtido nos lançamentos dos dados seja $ 3 $. Seja $ B=(\text{o conjunto dos pares} \ (i,j) \ \text{tais que} \ i\leq 3 \ \text{e} \ j\leq 3) $. Na tabela abaixo os pares que aparecem em azul são os pares pertencentes a B.

Figura 8.1.8

Figura 8.1.8: Pares cujas somas são $\leq 3$

A células em azul representam o conjunto dos pares tais que o maior valor é no máximo 3. Pela tabela podemos observar que B tem 9 elementos, logo

$$\mathbb{P}(B)=\frac{\hbox{Número de elementos favoráveis a B}}{\hbox{Número de elementos do espaço amostral}}=\frac{9}{36}=\frac{1}{4}.$$

Portanto $ \mathbb{P}(B)\geq \mathbb{P}(A) $, assim é mais vantajoso para o jogador escolher que o maior valor obtido seja no máximo 3, pois assim ele tem maiores chances de ganhar.

Exemplo 1.3.2

No jogo de Craps dois dados são jogados. Se o jogador tira 7 ou 11 pontos ele ganha. Se ele tira 2,3 ou 12 ele perde. Nos outros casos ele continua jogando os dois dados até sair 7, caso em que ele perde, ou então sair o primeiro resultado, caso em que ele ganha. Descreva o espaço amostral. Qual é a probabilidade dele ganhar?

$$\Omega=(\omega_i; i=1,2, \dots, \omega_i\in (1,\dots,6)\times (1,\dots,6); \omega_i=(a_i+b_i))$$

Considere o evento $ B= \lbrace \text{ Ganhar o jogo } \rbrace $. Então sendo:

$$B_1 = \lbrace \omega_1=7 \text{ ou } \omega_1=11 \rbrace$$

$$=\lbrace \text{tirar 7 ou 11 na primeira jogada} \rbrace $$

$$B_2 = \lbrace \omega_1=4, \exists \ j > 1 \text{ tq } \omega_j=4 \quad e\quad \omega_i\neq 7,i=2,\dots,j-1 \rbrace$$

$$= \lbrace \text{ tirar 4 na primeira jogada, joga até tirar 4 novamente e ganha não tirando 7 enquanto isso } \rbrace$$

$$B_3 = \lbrace \omega_1=5, \exists \ j > 1 \text{ tq } \omega_j=5 \quad e\quad \omega_i\neq 7,i=2,\dots,j-1 \rbrace$$

$$= \lbrace\text{tirar 5 na primeira jogada, joga até tirar 4 novamente e ganha não tirando 7 enquanto isso } \rbrace$$

$$\vdots$$

$$B_7 = \lbrace \omega_1= \lbrace 10, \exists \ j > 1 \text{ tq } \omega_j=5 \quad e\quad \omega_i\neq 7,i=2,\dots,j-1 \rbrace$$

$$= \lbrace \text{ tirar 10 na primeira jogada, joga até tirar 4 novamente e ganha não tirando 7 enquanto isso } \rbrace$$

Então

$$\mathbb{P}(B)=\mathbb{P}\left(\bigcup_{i=1}^7 B_i\right)=\sum_{i=1}^{7}\mathbb{P}(B_i)=0,49292.$$

Exemplo 1.3.3

Uma caixa contém $ 2n $ sorvetes, n do sabor A e n do sabor B. De um grupo de 2n pessoas, $ a<n$ preferem o sabor A, $b<n$ o sabor e $ 2n-(a+b) $ não tem preferência. Demonstre que os sorvetes são distribuídos ao acaso, a probabilidade de que a preferência de todas as pessoas seja respeitada é de

$$\cfrac{\binom{2n-a-b}{n-a}}{\binom{2n}{n}}.$$

Temos n sorvetes do tipo A e n do sabor B. Para facilitar o entendimento, podemos pensar nas pessoas como enfileiradas como sendo $ a $ pessoas que gostam do tipo A em seguida as $ b $ pessoas que gostam do tipo B e por fim as demais pessoas.

Com isso temos que a probabilidade que queremos é dada por

$$p=\frac{[n(n-1)\dots(n-a+1)][ n (n-1) \dots (n-b+1)](2 n - (a + b))!}{2n!}=\frac{1}{2n!}\frac{n!}{(n-a)!}\frac{n!}{(n-b)!}\frac{2n!}{(a+b)!}$$

$$=\frac{(2n-(a+b))!}{(n-a)!(n-b)!}\frac{n!n!}{2n!}=\frac{\binom{2n-a-b}{n-a}}{\binom{2n}{n}}$$

Exemplo 1.3.4

Suponhamos que dez cartas estejam numeradas de 1 até 10. Das dez cartas, retira-se uma de cada vez, ao acaso e sem reposição, até retirar-se o primeiro número par. Conta-se o número de retiradas necessárias. Exiba um bom modelo probabilístico para este experimento.

Nosso espaço amostral é dado por $ \Omega=(1,2,3,4,5,6) $, com a $ \sigma $-álgebra sendo as partes.

Assim temos que a

$$\mathbb{P}(n)=\dfrac{\binom{5}{n-1}\binom{5}{1}}{\binom{10}{n}}, \quad \quad, n=1,2, \dots,5.$$

$$\mathbb{P}(6)=\dfrac{1}{\binom{10}{5}}$$

Exemplo 1.3.5

Para cada um dos seguintes experimentos, descreva um espaço de probabilidade que sirva de modelo.

(a) Seleciona-se um ponto, ao acaso, do quadrado unitário

$$ \lbrace (x,y):0≤x≤1,0≤y≤1 \rbrace.$$

(b) Retiram-se cartas sucessivamente de um baralho de 52 cartas, ao acaso e com reposição até retirar-se o primeiro rei. Registra-se o número total de retiradas.

(c) Quinze bolas são retiradas, ao acaso e com reposição, de uma urna contendo 5 bolas vermelhas, 9 bolas pretas, e uma bola branca. Observa-se o número de vezes que ocorre cada cor.

(d) O experimento (c) é realizado sem reposição.

(a) Então o espaço amostral $ \Omega=\mathbb{R}^2 $, sendo $Q= \lbrace (x,y):0≤x≤1;0≤y≤1 \rbrace$ e a $ \sigma $-álgebra é a $ \sigma $-álgebra de Borel definimos

$ \mathbb{P}(A)=\dfrac{\text{area}(A\cap Q)}{\text{area}(Q)}=\text{ area }(A\cap Q). $

(b) O espaço amostral $ \Omega=\mathbb{N} $ e a $ \sigma $-álgebra das partes $ \mathbb{N} $. Então

$$\mathbb{P}(n)=\left(\frac{12}{13}\right)^{n-1}\frac{12}{13}, \quad \quad n=1,2, \dots$$

$$\mathbb{P}(n_v,n_p,n_b)=\frac{15!}{n_v!n_b!n_p!}=\left(\frac{5}{15}\right)^{n_v} \left(\frac{9}{15}\right)^{n_p} \left(\frac{1}{15}\right)^{n_b}, \quad \quad (n_v,n_p,n_b)\in \Omega.$$

(d) No caso sem reposição $ \Omega=\lbrace(n_v,n_p,n_b)=(5,9,1)\rbrace $ a $ \sigma $-álgebra é as partes e

$$\mathbb{P}(n_v,n_p,n_b)=\frac{n_v}{5}\frac{n_p}{9}\frac{n_b}{1}=1$$

Exemplo 1.3.6

Retiram-se 4 cartas, ao acaso, de um baralho de 52 cartas. Registra-se o número de reis na amostra. Exiba um bom modelo probabilístico para este experimento se:

(a) As retiradas são feitas sem reposição.

(b) as retiradas são feitas com reposição.

(a) A retirada sem reposição então o espaço amostral $ \Omega=(1,2,3,4) $ então o número de reis é dado por

$$\mathbb{P}(n)=\frac{\binom{48}{4-n}\binom{4}{n}}{\binom{52}{4}}; \quad \quad n=0,1,2,3,4$$

(b) com reposição o espaço amostral $ \Omega=(1,2,3,4) $. Então, o número de reis é dado por

$$\mathbb{P}(n)=\binom{4}{n}\left(\frac{12}{13}\right)^{4-n}\left(\frac{1}{13}\right)^{n}.$$

$$\mathbb{P}_a(4)=\frac{1}{\binom{52}{4}}=\frac{1}{270725}\approx 3,693 \times 10^{-6}$$

$$\mathbb{P}_b(4)=\binom{4}{4}\left(\frac{12}{13}\right)^{0}\left(\frac{1}{13}\right)^{4}=\frac{1}{28561}\approx 3,5\times 10^{-5}$$

Então é mais provável obter 4 reis com reposição.

Exemplo 1.3.7: (Problema de casamentos)

(a) Suponha que temos n casais casados (n homens e n mulheres) se fizermos uma identificação ao acaso(associar um mulher a um homem ao acaso) dos casais qual a probabilidade de acertarmos o casal corretamente(acertar quais são marido e mulher) ?

(b) Mostre que a probabilidade considerada no item anterior converge para $ p=1-\frac{1}{e} $ quando $ n\rightarrow \infty $.

(a) Fazendo $ A_i=(\text{ Acerta a identificação do i-ésima equação}, i=1,2, \dots,n). $

Temos $ \bigcup_{i=1}^n A_i\text{ Acerta pelo menos uma identificação } $

$$\mathbb{P}(A_i)=\frac{(n-1)!}{n!}=\frac{1}{n}, i=1,2,\dots,n$$

$$\mathbb{P}(A_i\cap A_j)=\frac{(n-2)!}{n!}=\frac{1}{n(n-1)}, 1\leq i < j \leq n$$

$$\mathbb{P}(A_i\cap A_j\cap A_k)=\frac{(n-3)!}{n!}=\frac{1}{n(n-1)(n-2)}, 1\leq i < j < k \leq n$$

$$\vdots$$

$$\mathbb{P}(A_1\cap A_2\cap \dots \cap A_n)=\frac{1}{n!}$$

então usando

$$\mathbb{P}\left(\bigcup_{i=1}^n A_i\right)=n \mathbb{P}(A_1\cap A_2)+\binom{n}{3}\mathbb{P}(A_1\cap A_2\cap A_3)+\dots (-1)^{n-1}\mathbb{P}(A_1\cap A_2\cap \dots \cap A_n)=$$

$$=n\frac{1}{n}-\frac{n(n+1)}{2!}\frac{1}{n(n+1)}+\frac{n(n+1)(n+2)}{3!}\frac{1}{n(n+1)(n+2)}-\dots (-1)^{n-1}\frac{1}{n!}$$

$$=\sum_{i=1}^{n}\frac{(-1)^{i+1}}{i!}$$

(b)

$$\lim_{n\rightarrow \infty} \mathbb{P}\left(\bigcup_{i=1}^n A_i\right)=\lim_{n\rightarrow}\sum_{i=1}^{n}\frac{(-1)^{i+1}}{i!}=\frac{1}{e}$$

Exemplo 1.3.8

Suponha que n cartas numeradas de 1 a n sejam embaralhadas e retiradas uma por uma, sem reposição, até todas as cartas serem retiradas. Qual a probabilidade de que para pelo menos uma carta, o número da carta coincida com o número da retirada?

Basta usar o exemplo anterior, pois podemos ver como um problema dos casamentos assim, temos que

$$\mathbb{P}\left(\bigcup_{i=1}^n A_i\right)=\sum_{i=1}^{n}\frac{(-1)^{i+1}}{i!}$$

1.3.1 - Métodos de Enumeração

Quando trabalhamos com espaço amostral finito $ \Omega = (\omega_1,\ldots,\omega_n) $ e eventos equiprováveis, obtemos que a probabilidade pode ser definida por

$$\mathbb{P}(E)=\frac{\hbox{número de casos favoráveis a E}}{\hbox{número de casos possíveis de S}}=\frac{k}{n}.$$

Neste caso, precisamos conhecer regras de contagem (ou enumeração) para calcularmos as probabilidades associadas aos eventos de interesse, pois nem sempre é fácil calcularmos o número de elementos do espaço amostral, ou ainda o número de elementos do evento de interesse.

Exemplo 1.3.1.1

Um grupo de $ 1000 $ pessoas contém $ 2 $ pessoas com diabetes e $ 998 $ pessoas saudáveis. Dez pessoas são escolhidas ao acaso e sem reposição. Qual a probabilidade de escolhermos apenas uma pessoa com diabetes?

Espaço amostral?

$$\Omega = \lbrace (\omega_1, \omega_2, \dots, \omega_{10}) : \omega_i = \text{pessoa e} \ \omega_i\neq\omega_j \rbrace$$

Quantas 10-uplas de pessoas existem?
Quantas tem a característica que desejamos?

Regras de contagem

A seguir, vamos apresentar as regras básicas de contagem, denominadas regra da multiplicação e regra da adição.

Regra da multiplicação: Suponha que para realizarmos uma tarefa temos que executar dois procedimentos (obrigatoriamente), denotados por $ P_1 $ e $ P_2 $. O procedimento $ P_1 $ tem $ n_1 $ formas de ser executado e o procedimento $ P_2 $ tem $ n_2 $ formas de ser executado. O total de maneiras para executarmos a tarefa é dado por $ n_1\times n_2 $.

Exemplo 1.3.1.2

Uma peça manufaturada deve passar por três passos e por três estações de controle. Em cada estação a peça é inspecionada com relação a uma determinada característica e marcada adequadamente. Na primeira estação, três classificações são possíveis (ok, excelente, retrabalho), enquanto que nas duas últimas, duas classificações são possíveis (ok, retrabalho). De quantas maneiras uma peça pode ser marcada?

1ª estação - 3 maneiras

2ª estação - 2 maneiras

3ª estação - 2 maneiras

Desta forma, a peça pode ser marcada de $ 3 \times 2 \times 2 = 12 $ maneiras diferentes.

Regra da adição: Suponha que temos dois procedimentos possíveis para executar uma tarefa. Aqui, basta executar um dos dois procedimentos para que tenhamos executado a tarefa. O procedimento $ P_1 $ tem $ n_1 $ formas de ser executado e o procedimento $ P_2 $ tem $ n_2 $ formas de ser executado. O total de maneiras para executarmos a tarefa é então dado por $ n_1+n_2 $.

Figura8.1.9

Figura 8.1.9: Regresentação da Regra da Adição

Exemplo 1.3.1.3

Considere um processo de manufatura dividido em $ 4 $ máquinas $ (M_1,M_2,M_3,M_4) $. Cada peça é desenvolvida por uma das máquinas e classificada em:

Máquinas	$\mathbf{M_1}$	$\mathbf{M_2}$	$\mathbf{M_3}$	$\mathbf{M_4}$
	A1	B1	C1	D1
Característica	A2	B2	C2	D2
	A3			D3
Totais	3	2	2	3

Tabela 8.1.2: Peças desenvolvidas por cada máquina

Com isso, concluímos que existe um total de $ 10 $ maneiras de classificarmos a peça.

Permutações, arranjos e combinação

Permutação

Suponha que tenhamos uma coleção $ O = (w_1,w_2,\ldots,w_n) $ de $ n $ objetos. De quantas maneiras podemos permutar (dispor) estes elementos? O número de maneiras que podemos fazer isto é denominado permutação.

Exemplo 1.3.1.4

Se tivermos os objetos $ a $, $ b $ e $ c $, podemos considerar as permutações: $abc$, $acb$, $bac$, $bca$, $cab$ e $cba$.

Suponha que temos $ n $ compartimentos e queremos dispor os $ n $ objetos de $ O $ nestes compartimentos. Para isto, considere o esquema:

Figura8.1.10

Figura 8.1.10: Representação de permutação

Aplicando a regra da multiplicação, temos que o número de maneiras de permutar $ n $ elementos é:

$$P_n=n(n-1)\ldots 1=n! \qquad \text{(Fatorial)}$$

Arranjo

Suponha que tenhamos uma coleção $ O = (w_1,w_2,\ldots,w_n) $ composta por $ n $ objetos. Agora, desejamos escolher $ r $$ (\leq n) $ objetos e permutá-los. O número de maneiras para fazer isto é denominado arranjo. Suponha que temos $ r $ compartimentos e queremos dispor os $ n $ objetos de O nestes compartimentos. Para isto, considere o esquema:

Figura8.1.11

Figura 8.1.11: Representação de arranjo

Aplicando a regra da multiplicação, temos que o número de maneiras de arranjar $ n $ elementos em $ r $ compartimentos é:

$$A_{n,r} = n(n-1)\ldots(n-r+1)=\frac{n!}{(n-r)!}$$

Combinação

Suponha que tenhamos uma coleção $ O = (w_1,w_2,\ldots,w_n) $ composta por $ n $ objetos. Agora, trataremos da contagem do número de maneiras de escolher $ r $$ (\leq n) $ objetos dentre os $ n $ objetos sem considerarmos a ordem.

Exemplo 1.3.1.5

Na coleção de objetos $ O = (a,b,c,d) $, quantos grupos podemos formar com dois objetos?

Podemos formar os seguintes grupos com dois elementos: $ (ab, ac, ad, bc, bd, cd) $. Ou seja, em uma coleção de $ 4 $ elementos, é possível formar $ 6 $ grupos de dois elementos. Observe que aqui não contamos $ ab $ e $ ba $ pois formam dois grupos iguais.

Como o número de maneiras de alocarmos os $ n $ objetos em $ r $ compartimentos é

$$\frac{n!}{(n-r)!}$$

e, após alocarmos os $ r $ objetos temos $ r! $ formas de permutá-los, então o número de maneiras de escolhermos $ r $ objetos sem importar a ordem dentre $ n $ objetos é:

$$C_{n,r}=\frac{n!}{r!(n-r)!}= \binom{n}{r}$$

Exemplo 1.3.1.6

Considere novamente o Exemplo 1.3.1.1 em que temos

1000 pessoas;
2 pessoas com diabetes;
10 pessoas selecionadas ao acaso e sem reposição.

Espaço amostral: $ \Omega = \lbrace (\omega_1, \omega_2, \omega_{10}): \omega_i = \text{pessoa i} \rbrace $. De quantas maneiras podemos selecionar $ 10 $ pessoas sem reposição?

$$ \binom{1000}{10}$$

Qual a probabilidade de encontrarmos $ 1 $ pessoa com diabetes entre as $ 10 $ escolhidas?

$$\cfrac{\binom{2}{1} \binom{998}{9}}{\binom{1000}{10}}=\frac{\hbox{nº de resultados favoráveis}}{\hbox{nº total de resultados}}.$$

Teorema 1.3.1 (Binômio de Newton)

Dados $ x,y\in\mathbb{R} $ temos que

$$(x+y)^n=\sum_{k=0}^n\binom{n}{k} x^k y^{n-k}$$

Demonstração

Quando $ n=1 $ temos que

$$x+y=\sum_{k=0}^1\binom{1}{k} x^k y^{n-k}=\binom{1}{0}x^0 y^1 + \binom{1}{1}x^1 y^0 = y+x$$ e a igualdade é válida para $ n=1 $. Suponha agora que a igualdade seja válida para $ n-1 $. Então

$$(x+y)^n=(x+y)(x+y)^{n-1}=(x+y)\sum_{k=0}^{n-1}\binom{n-1}{k} x^k y^{n-1-k},$$

assim, obtemos que

$$(x+y)^n=\sum_{k=0}^{n-1} \binom{n-1}{k} x^{k+1} y^{n-1-k} + \sum_{k=0}^{n-1} \binom{n-1}{k} x^k y^{n-k}.$$

Tomando $ i = k+1 $ na primeira soma e $ i=k $ na segunda soma, temos que

$$(x+y)^n=\sum_{i=1}^n\binom{n-1}{i-1} x^i y^{n-i}+\sum_{i=0}^{n-1}\binom{n-1}{i}x^iy^{n-i}$$

$$(x+y)^n=x^n+\sum_{i=1}^{n-1}\left[\binom{n-1}{i-1}+\binom{n-1}{i}\right]x^iy^{n-i}+y^n$$

$$(x+y)^n=x^n+\sum_{i=1}^{n-1}\binom{n}{i} x^i y^{n-i}+y^n=\sum_{i=0}^n \binom{n}{i}x^i y^{n-i}$$

como queríamos demonstrar.

Esquemas de Amostragem

Considere $ O = (o_1,o_2,\ldots,o_n) $ uma coleção de $ n $ objetos. A amostragem “com reposição” é um tipo de experimento no qual, após cada etapa, o objeto selecionado retorna ao grupo. Em uma amostragem com reposição cada elemento selecionado $ o_i $ pode ser qualquer um dos $ n $ objetos. Neste caso, a descrição do espaço amostral depende da forma como as amostras selecionadas são consideradas, por exemplo, (4,1,2,1) e (1,4,2,1) são diferentes ou iguais. Assim, temos dois casos: “ordenadas” e “não ordenadas”. No primeiro caso, as amostras contendo os mesmos elementos, mas arranjados diferentemente, são considerados distintas. No segundo caso, a ordem dos elementos é descartada e as duas amostras são consideradas as mesmas. A seguir, vamos utilizar a notação $ (o_1,\ldots,o_n) $ para amostras ordenadas e $ [o_1,\ldots,o_n] $ para amostras não ordenadas.

Amostragem com reposição

Amostragem ao acaso, com reposição e ordenada: Selecionar $ r $ objetos ao acaso e com reposição na coleção de objetos $ O $:

Espaço amostral: $Ω= \lbrace(ω1,ω2,…,ω_n):wi∈O \rbrace ;$

Probabilidade: $ \displaystyle \mathbb{P}((w_1,w_2,\ldots,w_r))=\frac{1}{n^r} $.

Amostragem ao acaso, com reposição e não-ordenada: Selecionar $ r $ objetos ao acaso e com reposição na coleção de objetos $ O $:

Espaço amostral: $S= \lbrace [w1,w2,…,w_n]:wi∈O \rbrace$

Probabilidade:

$ \displaystyle \mathbb{P}([w_1,\ldots,w_r])=\frac{1}{\binom{n+r-1}{r}}=\frac{r!(n-1)!}{(n+r-1)!} $

Amostragem sem reposição

Amostragem ao acaso, sem reposição e ordenado: Selecionar ao acaso $ r $ objetos ao acaso e sem reposição na coleção de objetos $ O $ ( com $ r $ menor ou igual a $ n $):

Espaço amostral: $Ω= \lbrace (w_1,w_2,…,w_n):w_i∈O,w_i≠w_j \rbrace$

Probabilidade: $ \displaystyle \mathbb{P}((w_1,\ldots,w_r))=\frac{1}{n!/(n-r)!}=\frac{(n-r)!}{n!} $

Amostragem ao acaso, sem reposição e não-ordenada: Selecionar ao acaso $ r $ objetos e sem reposição na coleção de objetos $ O $ (com $ r $ menor ou igual a n):

Espaço amostral: $Ω= \lbrace [w_1,…,w_r]:w_i∈O,w_i≠w_j \rbrace;$

Probabilidade:

$ \mathbb{P}([w_1,\ldots,w_n])=\dfrac{1}{\binom{n}{r}}=\dfrac{r!(n-r)!}{n!} $.

Exemplo 1.3.1.7

Considere uma loteria com $ M $ tickets, que são numerados de $ 1 $ a $ M $ e os $ n $ primeiros $ (1 $ a $ n) $ contém prêmios. Vamos admitir que $ M \geq 2n $. Se você comprar $ n $ tickets, qual a probabilidade de você ganhar pelo menos um prêmio?

Como a ordem não interessa, consideramos um processo de amostragem ao acaso sem reposição e não ordenada:

$$ \Omega = \lbrace \omega : \omega = [a_1 , a_2 , \cdots , a_n]; ~ a_i \neq a_j ~ (i\neq j) \rbrace ; $$

$ {\cal C} $: subconjuntos de $ \Omega $;

$$\mathbb{P}( \lbrace w \rbrace) = \frac{1}{\binom{M}{n}}, ~ ~ w \in \Omega.$$

Considere o evento $ A_0 = \lbrace \omega: \omega = [a_1, \cdots , a_n]; ~ a_i=n+1, \cdots , M; ~ a_i \neq a_j ~ (i \neq j) \rbrace $ que corresponde a nenhum ticket com prêmio. Então, temos que

$$\mathbb{P} (A_0) = \frac{\hbox{número de elementos de}~A_0 }{\hbox{número de elementos de}~\Omega } = \dfrac{\binom{M-n}{n}}{\binom{M}{n} }=\left(1-\frac{n}{M}\right)\cdots\left(1-\frac{n}{M-n+1}\right).$$ –>

Exemplo 1.3.1.8

Agora iremos fazer um exemplo mais geral. Em um processo de amostragem com reposição e ordenado, vamos calcular a probabilidade de ocorrência do evento “todos os elementos selecionados são distintos”.

Vamos supor que dispomos de $ M $ objetos distintos, e que iremos selecionar $ n $ vezes.

Assim seja $A = ((O_1, …, O_n) : O_i ≠ O_j, i ≠ j~e~O_i ∈ O)$, no qual $O = (O_1, …O_M)$.

$$\mathbb{P}(A)=\frac{\hbox{Número de elementos em } A}{\hbox{Número de elementos de } \Omega}=\cfrac{\frac{M!}{(M-n)!}}{M^n}=\cfrac{M!}{(M-n)!M^n}.$$

Ajustando a equação a cima obtemos:

$$\mathbb{P}(A)=\left(1-\frac{1}{M} \right)\cdot \left(1-\frac{2}{M} \right) \cdots \left(1-\frac{n-1}{M} \right).$$

Exemplo 1.3.1.9

Utilizando o exemplo acima, vamos fazer uma aplicação interessante. Em um grupo de $ n $ pessoas qual a chance de duas ou mais pessoas fazerem aniversário no mesmo dia do ano.

Neste caso, os $ M $ objetos distintos que dispomos são os $ 365 $ dias do ano, assim $ M=365 $. Queremos selecionar $ n $ dias (pois existem $ n $ pessoas no grupo) ao acaso e com reposição e de forma ordenada. Vamos definir $ B = \lbrace \hbox{ ninguém faz aniversário no mesmo dia} \rbrace $. Assim o evento de interesse nosso é $ B=A^c $. Então

$$\mathbb{P}(B)=1-\mathbb{P}(A)=1-\left[\left(1-\frac{1}{365} \right)\cdot \left(1-\frac{2}{365} \right) \cdots \left(1-\frac{n-1}{365} \right) \right]$$

Apenas a título de curiosidade vamos colocar segue abaixo a probabilidade para alguns valores de $n$.

$ n $	$ \mathbb{P}(B) $
4	0,016
16	0,284
23	0,503
40	0,891
64	0,997

Tabela 8.1.3: Probabilidade para alguns valores de $n$

É interessante observar que para $ n=64 $ a probabilidade de duas ou mais pessoas fazerem aniversário no mesmo dia é quase 100%.

Exemplo 1.3.1.10

Suponha que queremos distribuir $ r $ bolas em $ n $ compartimentos, com $ r\geq n $, todas as bolas devem ser distribuídas. Vamos calcular a probabilidade de um compartimento conter $ K $ bolas.

Observe que $ K $ bolas podem ser escolhidas de $ \binom{r}{k} $ maneiras distintas e que $ (r-K) $ bolas podem ser colocadas nos $ (n-1) $ compartimentos que restaram de $ (n-1)^{r-k} $ maneiras. Assim seja $ A= \lbrace \hbox{Um compartimento conter K bolas} \rbrace $ a probabilidade de que um compartimento contenha $K$ bolas é de:

$$\mathbb{P}(A)=\binom{r}{k} \cdot \frac{(n-1)^{r-k} }{n^r}.$$

1.4 - Eventos independentes e probabilidade condicional

Outro conceito importante da teoria de probabilidade é o de independência entre dois eventos. Na prática, dois eventos são independentes quando a ocorrência de um evento não influência a ocorrência do outro evento. Do ponto de vista probabilístico temos a seguinte definição:

Definição 1.4.1 (Independência)

Dois eventos $ A $ e $ B $ são ditos independentes se

$$\mathbb{P}(A\cap B)=\mathbb{P}(A) \ \mathbb{P}(B).$$

Exemplo 1.4.1

Um lote contém $ 10 $ peças, sendo $ 7 $ boas ($ B $) e $ 3 $ defeituosas ($ D $). Retiramos duas peças, ao acaso e com reposição, para inspeção. Qual a probabilidade de se obter duas peças defeituosas?

O experimento de realizar a primeira retirada tem como espaço amostral $ \Omega_1= (D_1,B_1) $ e a segunda retirada tem como espaço amostral $ \Omega_2 = (D_2,B_2) $, em que $ D_i $ significa que retiramos uma peça defeituosa na i-ésima retirada e $ B_i $ significa que retiramos uma peça boa na i-ésima retirada, para $ i = 1,2 $. Como as duas peças são retiradas ao acaso e com reposição, isto é, após retirarmos a primeira peça esta é colocada novamente no lote para que possamos efetuar a segunda retirada, temos que

$$\mathbb{P}(D_1)=\mathbb{P}(D_2)=\frac{3}{10} \qquad \text{e} \qquad \mathbb{P}(B_1)=\mathbb{P}(B_2)=\frac{7}{10}.$$

Associamos ao experimento de retirar duas peças ao acaso e com reposição o seguinte espaço amostral

$$\Omega=((D_1,B_2);(B_1,D_2);(D_1,D_2);(B_1,B_2)).$$

Queremos encontrar a probabilidade de se obter duas peças defeituosas, ou seja, a probabilidade das peças na primeira retirada e na segunda retirada serem defeituosas. Assim, desde que a primeira e a segunda retirada sejam executadas de forma independente, temos que

$$\mathbb{P}\left((D_1,D_2)\right)=\mathbb{P}(D_1\cap D_2)=\mathbb{P}(D_1) \mathbb{P}(D_2)=\frac{3}{10}\cdot \frac{3}{10}=\frac{9}{100}.$$

Vamos examinar melhor a diferença entre extrair uma peça de um lote, ao acaso, com reposição ou sem reposição. Como vimos neste exemplo, se a retirada for feita com reposição, então

$$\mathbb{P}(D_1)=\mathbb{P}(D_2)=\frac{3}{10} \qquad \text{e} \qquad \mathbb{P}(B_1)=\mathbb{P}(B_2)=\frac{7}{10}$$

pois cada vez que extraímos peças do lote, sempre existirão $ 3 $ peças defeituosas e $ 7 $ peças boas num total de $ 10 $. No entanto, se estivermos extraindo sem reposição, o resultado é diferente. É ainda verdade, naturalmente, que

$$\mathbb{P}(D_1)=\frac{3}{10} \qquad \text{e} \qquad \mathbb{P}(B_1)=\frac{7}{10},$$

mas as probabilidades de sair uma peça defeituosa ou de sair uma peça boa na segunda retirada não serão as mesmas. Para calcularmos essas probabilidades devemos conhecer a composição do lote no momento de se extrair a segunda peça. Por exemplo, para calcularmos a probabilidade de extrairmos uma peça defeituosa na segunda retirada, D2, temos que saber se ocorreu $ D_1 $ ou $ B_1 $. Caso tenha ocorrido $ D_1 $,

$$\mathbb{P}(D_2) = \frac{2}{9}$$

e, se ocorreu $B_1$,

$$\mathbb{P}(D_2) =\frac{3}{9}.$$

Este exemplo nos mostra a necessidade de introduzirmos a definição de probabilidade condicional.

Proposição 1.4.1

Um evento $ A $ é independente dele mesmo se, e só se, $ \mathbb{P}(A)=0 $ ou $ \mathbb{P}(A)=1 $.

Suponha que $ \mathbb{P}(A)=a $, com $ 0 \ < \ a \ < \ 1 $. Sabemos que $ \mathbb{P}(A\cap A)=\mathbb{P}(A)=a\neq a^2 $, para qualquer $ a\in (0,1) $, entretanto $ \mathbb{P}(A\cap A)=\mathbb{P}(A)=a= a^2 $, se $ a=0 $ ou $ a=1 $. Logo se $ \mathbb{P}(A)=0 $ ou $ \mathbb{P}(A)=1 $ então ele é independente de si mesmo. Caso contrário, ele não será independe de si mesmo. Suponha agora que $ A $ seja independente de si mesmo, portanto $ a^2=\mathbb{P}(A)\mathbb{P}(A)= \mathbb{P}(A\cap A)=\mathbb{P}(A)=a $, ou seja, $ a^2=a $ mas isto é válido se, e somente se, $ a=0 $ ou $ a=1 $.

Definição 1.4.2 (Probabilidade Condicional)

A probabilidade de ocorrer um evento $ A $ dado que ocorreu um evento $ B $ é dada por

$$\mathbb{P}(A|B)=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)}.$$

Dessa relação sai a Regra do Produto que é dada no teorema a seguir.

Teorema 1.4.1

Considere um conjunto finito $ A_1,A_2,\ldots,A_n $ um conjunto de eventos tais que os eventos condicionais $ A_i|A_1\cap A_2\cap\ldots\cap A_{i-1} $ tenham probabilidades positivas. Então temos que

$$\mathbb{P}\left(\bigcap_{i=1}^nA_i\right)=\mathbb{P}(A_1) \ \mathbb{P}(A_2|A_1)\ \mathbb{P}(A_3|A_1\cap A_2) \ \ldots \ \mathbb{P}(A_n|\cap_{i=1}^{n-1}A_i).$$

Para demonstrar este teorema escrevemos

$$\mathbb{P}\left(\bigcap_{i=1}^nA_i\right)=\mathbb{P}(A_1) \ \frac{\mathbb{P}(A_1\cap A_2)}{\mathbb{P}(A_1)} \ \frac{\mathbb{P}(A_1\cap A_2\cap A_3)}{\mathbb{P}(A_1\cap A_2)}\ldots \ \frac{\mathbb{P}(\bigcap_{i=1}^n A_i)}{\mathbb{P}(\bigcap_{i=1}^{n-1} A_i)},$$

e usando a definição de probabilidade condicional, podemos reescrever o lado direito da igualdade acima como

$$\mathbb{P}(A_1) \ \mathbb{P}(A_2|A_1) \ \mathbb{P}(A_3|A_1\cap A_2) \ \ldots \ \mathbb{P}(A_n|\cap_{i=1}^{n-1}A_i).$$

Com caso particular temos que, dados dois eventos $ A $ e $ B $, concluímos que a probabilidade de ocorrência simultânea dos eventos $ A $ e $ B $ é igual a probabilidade de ocorrência do evento $ A $ (ou $ B $) vezes a probabilidade de ocorrência do evento $ A $ (ou $ B $) dado que ocorreu o evento $ B $ (ou $ A $), ou seja

$$\mathbb{P}(A\cap B)=\mathbb{P}(B) \ \mathbb{P}(A|B).$$

Exemplo 1.4.2

Considere o Exemplo 1.4.1, mas agora as retiradas serão feitas sem reposição, isto é, a primeira peça retirada não volta ao lote para retirarmos a segunda peça. Qual a probabilidade de se retirar duas peças defeituosas?

A probabilidade de sair uma peça defeituosa na primeira retirada é $ \mathbb{P}(D_1)=\frac{3}{10} $. Além disso, $ \mathbb{P}(D_2|D_1)=\frac{2}{9} $. Assim,

$$\mathbb{P}[(D_1,D_2)]=\mathbb{P}(D_1\cap D_2)=\mathbb{P}(D_1)\times \mathbb{P}(D_2|D_1)=\frac{3}{10}\times\frac{2}{9}=\frac{6}{90}=\frac{1}{15}.$$

A seguir, apresentamos o teorema da probabilidade total que é usado com frequência para calcular a probabilidade de vários eventos.

Teorema 1.4.2 (Teorema da Probabilidade Total)

Sejam $ A_1, A_2,\ldots, A_n $ eventos dois a dois disjuntos que formam uma partição do espaço amostral, isto é,

$$\bigcup_{i=1}^nA_i=\Omega$$

e assuma que $ \mathbb{P}(A_i) \ > \ 0 $ para $ i = 1, 2, \ldots, n $. Então, para qualquer evento $ B $, temos que

$$\mathbb{P}(B)=\mathbb{P}(A_1\cap B) + \cdots + \mathbb{P}( A_n \cap B) = \mathbb{P}(A_1) \mathbb{P}(B|A_1) + \cdots + \mathbb{P}(A_n)\mathbb{P}(B|A_n)=\sum_{i}\mathbb{P}(A_i)\mathbb{P}(B|A_i).$$

Para demonstrarmos esse teorema basta observarmos que como a sequência $ A_1, A_2, \ldots $ formam uma partição então para qualquer $ B\in \Omega $, temos que $ B=\displaystyle\bigcup_{i}(A_i\cap B) $. E como os $ A_i $ são disjuntos dois a dois temos que $ B\cap A_i $ também são disjuntos e pelo axioma 3 e pelo teorema 1.4.1 temos que

$$\mathbb{P}(B)=\sum_{i}\mathbb{P}(A_i\cap B)=\sum_{i}\mathbb{P}(A_i) \ \mathbb{P}(B|A_i).$$

Exemplo 1.4.3

Suponha que um jogador participa de um torneio de xadrez onde sua probabilidade de vitória é $ 0,3 $ contra metade dos jogadores (chame-os do tipo $ 1 $), $ 0,4 $ contra um quarto dos jogadores (chame-os do tipo $ 2 $) e $ 0,5 $ contra o um quarto dos jogadores restantes (chame-os do tipo $ 3 $). O jogador disputa uma partida contra um oponente selecionado aleatoriamente. Qual é a probabilidade dele vencer?

Seja $ A_i $ o evento de jogar com um oponente do tipo $ i $. Temos então que

$$\mathbb{P}(A_1)=0,5; \qquad \mathbb{P}(A_2)=0,25; \qquad \mathbb{P}(A_3)=0,25.$$

Seja $ B $ o evento vitória. Então temos

$$\mathbb{P}(B|A_1)=0,3; \qquad \mathbb{P}(B|A_2)=0,4; \qquad \mathbb{P}(B|A_3)=0,5.$$

Assim, pelo teorema da probabilidade total, a probabilidade de vitória é

$$\mathbb{P}(B)=\mathbb{P}(A_1)\mathbb{P}(B|A_1)+\mathbb{P}(A_2)\mathbb{P}(B|A_2)+P(A_3)\mathbb{P}(B|A_3)=0,5\cdot 0,3+0,25\cdot 0,4+0,25\cdot 0,5=0,375.$$

Ou seja, a probabilidade do jogador vencer a partida é de 37,5%. O teorema da probabilidade total com frequência é usado em conjunto com o seguinte teorema, chamado de Teorema de Bayes, que relaciona probabilidades condicionais da forma $ \mathbb{P}(A|B) $ com probabilidades condicionais da forma $ \mathbb{P}(B|A) $, em que a ordem da condicionalidade é reversa.

Teorema 1.4.3 (Teorema de Bayes)

Sejam $ A_1,A_2,\ldots,A_n $ eventos que formam uma partição do espaço amostral, e assuma que $ \mathbb{P}(A_i) \ > \ 0 $ para todo $ i $. Então, para qualquer evento $ B $ tal que $ \mathbb{P}(B) \ > \ 0 $, temos que

$$\mathbb{P}(A_i|B)=\frac{\mathbb{P}(A_i)\mathbb{P}(B|A_i)}{\mathbb{P}(B)}=\frac{\mathbb{P}(A_i)\mathbb{P}(B|A_i)}{\mathbb{P}(A_1)\mathbb{P}(B|A_1)+\ldots+\mathbb{P}(A_n)\mathbb{P}(B|A_n)}.$$

Para verificar o teorema de Bayes, basta notar que $ \mathbb{P}(A_i)\mathbb{P}(B|A_i) = \mathbb{P}(B)\mathbb{P}(A_i|B) $ já que ambos são iguais a $ \mathbb{P}(A\cap B) $, o que garante a primeira igualdade. A segunda igualdade segue da aplicação do teorema da probabilidade total para $ B $.

Teorema 1.4.4

A probabilidade condicional também é uma probabilidade ($ P(\cdot |B) $, para $ B $ um subconjunto fixo de $ \Omega $), ou seja a probabilidade condicional satisfaz os três axiomas de probabilidade.

Mostremos primeiramente que $ \mathbb{P}(\Omega | B)=1 $ e que $ \mathbb{P}(\emptyset | B)=0 $. De fato, note que

$$\mathbb{P}(\Omega | B)=\frac{\mathbb{P}(\Omega \cap B)}{\mathbb{P}(B)}=\frac{\mathbb{P}(B)}{\mathbb{P}(B)}=1$$

e que

$$\mathbb{P}(\emptyset | B)=\frac{\mathbb{P}(\emptyset \cap B)}{\mathbb{P}(B)}=\frac{\mathbb{P}(\emptyset)}{\mathbb{P}(B)}=\frac{0}{\mathbb{P}(B)}=0$$

o que demonstra o primeiro axioma.

O segundo axioma diz que $ 0 \leq \mathbb{P}(A|B) \leq 1 $, para qualquer $ A\subset \Omega $. Observe que $ \mathbb{P}(A|B)=\cfrac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)} $, e como $ A \cap B \subset B $. Temos que por P4 que $ 0 \leq \mathbb{P}(A \cap B) \leq \mathbb{P}(B) $, o que implica que $ 0 \leq \mathbb{P}(A|B) \leq 1. $

O terceiro e último axioma diz que para qualquer sequência de eventos mutuamente exclusivos $ A_1, A_2, \ldots $, temos que

$$\mathbb{P}(\bigcup_{n=1}^{\infty} A_n | B)=\sum_{n=1}^{\infty}\mathbb{P}(A_n | B).$$

Observamos que:

$$\mathbb{P}(\bigcup_{n=1}^{\infty} A_n | B)= \frac{\mathbb{P}(B\cap\bigcup_{n=1}^{\infty} A_n)}{\mathbb{P}(B)}= \frac{\mathbb{P}(\bigcup_{n=1}^{\infty} A_n \cap B)}{\mathbb{P}(B)}= \frac{\sum_{n=1}^{\infty}\mathbb{P}(A_n \cap B)}{\mathbb{P}(B)}=\sum_{n=1}^{\infty}\mathbb{P}(A_n|B).$$

Logo, a probabilidade condicional satisfaz todos os axiomas da probabilidade, o que implica que a probabilidade condicional também é uma probabilidade. Assim sendo, todas as propriedades de probabilidade também são válidas.

Exemplo 1.4.4

Considere novamente o Exemplo 1.4.3 onde $ A_i $ é o evento de ter um adversário do tipo $ i $ e

$$\mathbb{P}(A_1)=0,5; \qquad \mathbb{P}(A_2)=0,25; \qquad \mathbb{P}(A_3)=0,25.$$

Além disso, $ B $ é evento vencer uma partida e

$$\mathbb{P}(B|A_1)=0,3; \qquad \mathbb{P}(B|A_2)=0,4; \qquad \mathbb{P}(B|A_3)=0,5.$$

Suponha que o jogador disputou uma partida e venceu. Qual a probabilidade $ \mathbb{P}(A_1|B) $ dele ter jogado contra um adversário do tipo $ 1 $?

Usando o teorema de Bayes, temos que

$$\mathbb{P}(A_1|B)=\frac{P(\mathbb{A}_1)\mathbb{P}(B|A_1)}{\mathbb{P}(A_1)\mathbb{P}(B|A_1)+\mathbb{P}(A_2)\mathbb{P}(B|A_2)+\mathbb{P}(A_3)\mathbb{P}(B|A_3)}=0,4.$$

Ou seja, a probabilidade do jogador ter disputado uma partida contra um adversário do tipo $ 1 $, dado que ele venceu a partida é de 40%.

Exemplo 1.4.5 (Monty Hall)

Suponha que uma pessoa está participando de um programa de televisão e lhe é fornecida a possibilidade de escolher entre $ 3 $ portas. Atrás de uma das portas existe um carro e atrás das demais não existe prêmio algum. O participante escolhe uma porta, digamos a porta $ 1 $ e o apresentador abre outra porta, digamos a porta $ 3 $, revelando que não há nada atrás dela e então oferece ao participante a oportunidade de trocar de porta. O que é mais vantajoso, trocar ou não a porta escolhida?

Este é um problema clássico, conhecido como paradoxo de Monty Hall. A resposta intuitiva ao problema, porém errada, é a de que quando o apresentador revelou uma porta não premiada, o concorrente teria à frente um novo dilema com apenas duas portas e um prêmio, portanto as chances de que o prêmio esteja em qualquer uma das duas portas seriam de 50%. O apresentador teria nos ajudado, já que nossas chances subiram de $ 1/3 $ para $ 1/2 $, mas realmente não faria diferença trocar ou não de porta uma vez que ambas teriam as mesmas chances de possuírem o prêmio. No entanto, esta resposta está errada, pois a porta que o apresentador abre depende da porta que o concorrente escolher inicialmente.

Na verdade, é mais vantajoso trocar de porta e, ao fazê-lo a chance do participante ganhar o carro é de $ 2/3 $. Resolveremos este problema de duas formas diferentes. A primeira apenas descrevendo o problema e a segunda, utilizando o diagrama de árvores e probabilidades condicionais.

Primeiramente, consideremos duas estratégias para o participante do programa: a estratégia $ 1 $, onde o participante seleciona uma porta e, se lhe é fornecida a oportunidade de trocar de porta, ele recusa e a estratégia $ 2 $, na qual o participante sempre troca a porta escolhida. Desta forma, utilizando a estratégia $ 1 $, o participante ganhará o carro com probabilidade $ 1/3 $, já que em $ 1/3 $ das vezes a porta que ele escolhe terá o carro com o prêmio. Utilizando a estratégia $ 2 $, o participante somente ganhará o carro se, a princípio escolhe uma porta que não contém o carro como prêmio, o que ocorre em $ 2/3 $ das vezes, ou seja, a probabilidade de ganhar com a estratégia $ 2 $ é de $ 2/3 $ e, portnato, duas vezes maior do que utilizando a estratégia $ 1 $.

Podemos também, resolver este problema utilizando os conceitos de probabilidade condicional. Para isto, consideramos vários estágios. O carro é colocado atrás de uma porta, o participante escolhe uma porta e, finalmente, o apresentador abre uma porta. Então é natural analisar o problema através de um diagrama de árvore. Assumimos que se o apresentador pode escolher entre as portas (ou seja, o participante escolheu a porta com o carro), então ele escolhe cada porta com probabilidade $ 1/2 $. A árvore resultante é mostrada na figura a seguir:

Figura8.1.12

Figura 8.1.12: Representação em árvore do problema de Monty Hall

Agora, supondo que o participante tenha escolhido a porta $ 1 $ e o apresentador a porta $ 3 $, então existem apenas dois caminhos possíveis através da árvore. Para um dos caminhos, o carro está atrás da porta $ 1 $ e para o outro, está atrás da porta $ 2 $. O caminho com o carro atrás da porta 2 é duas vezes mais provável que o caminho com o carro atrás da porta $ 1 $. Assim, a probabilidade condicional do carro estar atrás da porta $ 2 $ é $ 2/3 $ e a probabilidade do carro estar atrás da porta $ 1 $ é $ 1/3 $, ou seja, se o participante trocar de porta, ele tem $ 2/3 $ de chances de ganhar o carro.

Exemplo 1.4.6

Um teste de laboratório detecta uma doença quando ela está presente em 95% dos casos. No entanto, o teste também fornece um resultado “falso positivo” para 1% das pessoas saudáveis testadas. (Isto é, se uma pessoa saudável faz o teste, então, com probabilidade $ 0,01 $, o resultado do teste dirá que ela possui a doença.) Se 0,5% da população tem a doença, qual é a probabilidade de uma pessoa ter a doença dado que o resultado do teste é positivo?

Para resolver este problema, consideramos $ D $ o evento de a pessoa testada ter a doença e $ E $ o evento de que o resultado do teste é positivo. Então, a probabilidade desejada $ \mathbb{P}(D|E) $ é obtida por

$$\mathbb{P}(D|E)=\frac{\mathbb{P}(D\cap E)}{\mathbb{P}(E)}=\frac{\mathbb{P}(E|D)\mathbb{P}(D)}{\mathbb{P}(E|D)\mathbb{P}(D)+\mathbb{P}(E|D^c)\mathbb{P}(D^c)},$$

ou seja,

$$\mathbb{P}(D|E)=\frac{(0,95)(0,005)}{(0,95)(0,005)+(0,01)(0,995)}\approx 0,323.$$

Assim, apenas 32% das pessoas cujos resultados do teste deram positivo realmente possuem a doença.

Exemplo 1.4.7

Em um teste de múltipla escolha, ou um estudante sabe a resposta ou arrisca uma das alternativas. Seja $ p $ a probabilidade do estudante saber a resposta e $ 1 - p $ a probabilidade do estudante arriscar adivinhá-la. Assuma que um estudante que arrisca a resposta acerta a resposta correta com probabilidade $ 1/m $, onde $ m $ é o número de alternativas de múltipla escolha. Qual é a probabilidade condicional de que um estudante soubesse a resposta da questão, dado que ele ou ela respondeu corretamente?

Seja $ C $ o evento de que o estudante responde a questão corretamente e $ K $ o evento de que ele saiba a resposta. Então

$$\mathbb{P}(K|C)=\frac{\mathbb{P}(K\cap C)}{\mathbb{P}(C)}=\frac{\mathbb{P}(C|K)\mathbb{P}(K)}{\mathbb{P}(C|K)\mathbb{P}(K)+\mathbb{P}(C|K^c)\mathbb{P}(K^c)},$$

ou seja,

$$\mathbb{P}(K|C)=\frac{p}{p+(1/m)(1-p )}= \frac{mp}{1+(m-1)p}.$$

Por exemplo, se $ m = 5 $ e $ p = 1/2 $, então a probabilidade de que um estudante saber a resposta de uma questão que ele respondeu corretamente é $ 5/6 $.

Exemplo 1.4.8

Uma companhia de seguros acredita que as pessoas possam ser divididas em duas classes: aquelas que são propícias a sofrerem acidentes e as que não são. Suas estatísticas mostram que uma pessoa propícia a acidentes terá um acidente em algum momento dentro do período de um ano com probabilidade $ 0,4 $, enquanto esta probabilidade diminui para $ 0,2 $ para pessoas não propícias a acidentes. Supondo que 30% da população é propícia a sofrer acidentes, qual é a probabilidade de que um novo segurado sofra um acidente durante um ano em que comprou uma apólice?

Obteremos a probabilidade desejada ao condicionar se o segurado é ou não uma pessoa propícia a sofrer um acidente. Seja $ A_1 $ o evento de que um segurado sofra um acidente durante um ano em que comprou a apólice e $ A $ o evento de que o segurado seja uma pessoa propícia a sofrer um acidente. Então a probabilidade desejada, $ P(A_1) $, é dada por

$$\mathbb{P}(A_1)=\mathbb{P}(A_1|A)\mathbb{P}(A)+\mathbb{P}(A_1|A^c)\mathbb{P}(A^c)=(0,4)(0,3)+(0,2)(0,7)=0,26.$$

Exemplo 1.4.9

Suponha que você deseja enviar uma carta para sua namorada pelo correio, para isto você resolve pedir para um amigo coloca-la para você, entretanto ele pode esquecer-se de envia-la com uma probabilidade de $ 0,1 $. Caso ele não se esqueça de envia-la, a probabilidade que o correio extravie a carta é de $ 0,1 $. E ainda caso o correio a envie a probabilidade de que o carteiro não a entregue é também é de $ 0,1 $. Sabendo que sua namorada não recebeu sua carta qual é a probabilidade de seu amigo ter esquecido de coloca-la no correio?

Esta é uma questão clássica em probabilidade. Vamos começar definindo os eventos definamos $ A=(\text{O amigo enviou a carta}) $; $ B=(\text{O correio não extravia a carta}) $ e $ C=(\text{O carteiro entrega a carta}) $. Pelos dados do problema temos que:

$$\mathbb{P}(A)=0,9; \quad \mathbb{P}(B|A)=0,9 \quad \text{e} \quad \mathbb{P}(C | A \cap B)=0,9.$$

O nosso problema consiste em encontrar $ \mathbb{P}(A^c | C^c) $, utilizando o teorema 1.4.3, concluímos que:

$$\mathbb{P}(A^c|C^c)=\frac{\mathbb{P}(C^c|A^c)\mathbb{P}(A^c)}{\mathbb{P}(C^c|A^c)\mathbb{P}(A^c)+\mathbb{P}(C^c|A)\mathbb{P}(A)}.$$

Note que $ \mathbb{P}(C^c|A^c)=1 $, pois dado que o amigo não enviou a carta o carteiro não vai entrega-la com probabilidade 1. Então vamos calcular a probabilidade de $ \mathbb{P}(C^c|A) $.

$$\mathbb{P}(C^c|A)=\mathbb{P}(C^c \cap B|A)+\mathbb{P}(C^c \cap B^c|A).$$

Sendo assim, precisamos encontrar $ \mathbb{P}(C^c \cap B|A) $. Observe que:

$$\mathbb{P}(C^c \cap B|A)= \frac{\mathbb{P}(C^c\cap B\cap A)}{\mathbb{P}(A)}=\frac{\mathbb{P}(C^c \cap B \cap A)\mathbb{P}(A \cap B)}{\mathbb{P}(A)\mathbb{P}(A\cap B)}=\mathbb{P}(C^c|B\cap A)\mathbb{P}(B|A)=0,1 \cdot 0,9=0,09.$$

Da mesma forma obtemos

$$\mathbb{P}(C^c \cap B^C |A)=\mathbb{P}(C^c | A \cap B^c)\mathbb{P}(B^C|A)=1 \cdot 0,1= 0,1.$$

Substituindo os valores encontrados na formula acima obtemos que

$$\mathbb{P}(C^c|A)=\mathbb{P}(C^c \cap B|A)+\mathbb{P}(C^c \cap B^c|A)=0,09+0,1=0,19.$$

Finalmente substituindo os valores encontrados na formula acima obtemos que

$$\mathbb{P}(A^c|C^c)=\frac{\mathbb{P}(C^c|A^c)\mathbb{P}(A^c)}{\mathbb{P}(C^c|A^c)\mathbb{P}(A^c)+\mathbb{P}(C^c|A)\mathbb{P}(A)}=\frac{1\cdot 0,1}{1 \cdot 0,1+0,19 \cdot 0,9}=\frac{0,1}{0,271}\thickapprox 0,369.$$

E, portanto, a probabilidade de que o amigo não tenha colocado a carta no correio sabendo que a namorada não recebeu a carta é de, aproximadamente, 36,9%.

Exemplo 1.4.10

Vamos supor que vamos selecionar $ 3 $ cartas em um baralho comum (com $ 52 $ cartas) ao acaso e sem reposição. Qual a probabilidade de retirarmos $ 3 $ reis?

Vamos definir o evento $ A_i=(\text{a i-ésima retirada é rei}) $, onde $ i=1,2,3 $. Queremos encontrar a probabilidade $ \mathbb{P}(A_1\cap A_2 \cap A_3) $ pelo teorema 1.4.1 temos que:

$$\mathbb{P}(A_1\cap A_2 \cap A_3)=\mathbb{P}(A_3 | A_1\cap A_2)\cdot \mathbb{P}(A_2|A_1)\cdot \mathbb{P}(A_1)=\frac{2}{50}\cdot \frac{3}{51} \cdot \frac{4}{52}.$$

Exemplo 1.4.11

Suponha que a ocorrência de chuva (ou não) dependa de das condições do tempo no dia imediatamente anterior. Admitamos que se chova hoje, choverá amanhã com probabilidade de $ 0,7 $ e que se não chove hoje, então choverá amanhã com probabilidade de $ 0,4 $. Sabendo que choveu hoje, calcule a probabilidade de chover depois de amanhã.

Consideremos nosso espaço amostral $ \Omega = \lbrace (\omega_1, \omega_2, \omega_3) : \omega_i \in \lbrace \text{chover, não chover} \rbrace \rbrace $. Seja o evento $ A_1= \lbrace \text{chover hoje} \rbrace $, $ A_2= \lbrace \text{chover amanhã} \rbrace $ e $ A_3= \lbrace \text{chover depois de amanhã} \rbrace $. Queremos encontrar $ \mathbb{P}(A_3|A_1) $, mas

$$\mathbb{P}(A_3|A_1)=\mathbb{P}(\Omega \cap A_3|A_1)$$

$$ = \mathbb{P}(A_3 \cap (A_2\cup A_2^c)|A_1)$$

$$ =\mathbb{P}(A_3 \cap A_2 | A_1)+ \mathbb{P}(A_3 \cap A_2^{c} | A_1)$$

$$= \frac{\mathbb{P}(A_1 \cap A_2 \cup A_3)}{\mathbb{P}(A_1)}+\frac{\mathbb{P}(A_1 \cap A_2^c\cup A_3)}{\mathbb{P}(A_1)}$$

$$= \frac{\mathbb{P}(A_3|A_1\cap A_2) \cdot \mathbb{P}(A_2|A_1)\cdot \mathbb{P}(A_1)}{\mathbb{P}(A_1)}+\frac{\mathbb{P}(A_3|A_1\cap A_2^C) \cdot \mathbb{P}(A_2^C|A_1)\cdot \mathbb{P}(A_1)}{\mathbb{P}(A_1)}$$

$$= \mathbb{P}(A_3|A_1\cap A_2)\cdot \mathbb{P}(A_2|A_1) + \mathbb{P}(A_3|A_1\cap A_2^C)\cdot \mathbb{P}(A_2^C|A_1)$$

$$= \mathbb{P}(A_3|A_2)\cdot \mathbb{P}(A_2| A_1)+\mathbb{P}(A_3|A_2^C)\cdot \mathbb{P}(A_2^C| A_1)$$

$$= 0,7 \cdot 0,7 + 0,4 \cdot 0,3$$

$$=0,61$$

Ou seja, sabendo que choveu hoje, a probabilidade de chover depois de amanhã é de 61%.

Exemplo 1.4.12

Em um jogo de dados são jogados dois dados honestos simultaneamente, de forma independente. Considerando que os números das faces voltadas para cima dos dois dados são números diferentes, qual é a probabilidade de que a soma dos números seja $ 6 $?

Primeiramente vamos analisar o nosso espaço amostral. A tabela abaixo mostra todo o espaço amostral:

	1	2	3	4	5	6
1	(1,1)	(1,2)	(1,3)	(1,4)	(1,5)	(1,6)
2	(2,1)	(2,2)	(2,3)	(2,4)	(2,5)	(2,6)
3	(3,1)	(3,2)	(3,3)	(3,4)	(3,5)	(3,6)
4	(4,1)	(4,2)	(4,3)	(4,4)	(4,5)	(4,6)
5	(5,1)	(5,2)	(5,3)	(5,4)	(5,5)	(5,6)
6	(6,1)	(6,2)	(6,3)	(6,4)	(6,5)	(6,6)

Tabela 8.1.4: Espaço amostral

Seja $ A=(\text{Soma dos dados ser 6}) $ e $ B=(\text{O número dos dados serem distintos}) $. Observem na tabela cima que existem $ 30 $ possibilidades das $36$ para as quais os dois números são distintos. E dentre as possibilidades para os quais a soma é $ 6 $, existem $ 4 $ possibilidade para os quais os números são distintos. Assim a probabilidade $ P(A|B) $ é dada por

$$\mathbb{P}(A|B)=\frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)}=\dfrac{\frac{4}{36}}{\frac{30}{36}}=\frac{2}{15}.$$

Exemplo 1.4.13

Seja $ (\Omega, \mathbb{A}, \mathbb{P}) $ um espaço de probabilidade e suponha que todos os conjuntos abaixo pertençam a $ \mathbb{A} $. Prove:

(a) Se os $ A_n $ são disjuntos e $ \mathbb{P}(B|A_n)\geq c $ para todo $ n $, então

$$\mathbb{P}(B|\cup A_n)\geq c$$

(b) O item (a) com “=” no lugar de $ \geq $.

(c) Se $ A_n\supset A_{n+1} $ e $ \mathbb{P}(A_{n+1}|A_n)\leq \frac{1}{2} $ para todo n, então $ \mathbb{P}(A_n)\rightarrow 0 $ quando $ n\rightarrow \infty $.

(d) Se os $ A_n $ são disjuntos e $ \mathbb{P}(B| A_n)=\mathbb{P}(C|A_n) \quad \quad \forall n $, então

$$\mathbb{P}\left(B\bigg |\bigcup A_n\right)=\mathbb{P}\left(C\bigg|\bigcup A_n\right).$$

(e) Se $ A_1, A_2, \dots $ são disjuntos e $ \bigcup A_n=\Omega $, então

$$\mathbb{P}(B|C)=\sum_n \mathbb{P}(A_n|C)\mathbb{P}(B|A_n\cap C).$$

(a) Primeiramente observe que $ [B\cap(\cup A_n)]=\bigcup [B\cap A_n] $ o que implica que

$$\mathbb{P}[B\cap(\cup A_n)]=\sum \mathbb{P}[B\cap A_n].$$

Agora, dado que $ \mathbb{P}(B|A_n)\geq c $ temos que

$$\mathbb{P}(B\cap A_n)\geq c\mathbb{P}(A_n)$$

então temos que

$$\sum_n \mathbb{P}(B\cap A_n)\geq c \sum_n \mathbb{P}(A_n)=c\mathbb{P}\left(\bigcup_n A_n\right)$$

Então

$$\mathbb{P}(B\cap (\cup A_n))\geq c \mathbb{P}(\cup A_n)\Rightarrow \frac{\mathbb{P}(B\cap (\cup A_n))}{\mathbb{P}(\cup A_n)}\geq c\Rightarrow \mathbb{P}(B|\cup A_n)\geq c.$$

(b) A demonstração é análoga e obtemos $ \mathbb{P}(B|\cup A_n)=c. $

$$\mathbb{P}(A_n)=\mathbb{P}(A_1\cap \dots \cap A_{n})=\mathbb{P}(A_1)\mathbb{P}(A_2|A_1)\dots \mathbb{P}(A_n|A_1\cap A_2\cap \dots \cap A_{n-1})$$

$$=\mathbb{P}(A_1)\mathbb{P}(A_2|A_1)\dots \mathbb{P}(A_n|A_{n-1})$$

Agora $ 0\leq \mathbb{P}(A_1)\leq 1 $$ 0\leq \mathbb{P}(A_i|A_{i-1})\leq \frac{1}{2} $, para $ i=1,2,3, \dots $. Desta forma,

$$0\leq \mathbb{P}(A_n)\leq \frac{1}{2^{n-1}}$$

o que implica que

$$0\leq \lim_{n\rightarrow \infty}\mathbb{P}(A_n)\leq 0$$

o que implica que $ \lim_{n\rightarrow \infty}\mathbb{P}(A_n)=0 $.

(d) Então,

$$\mathbb{P}\left(B|\bigcup A_n\right)=\frac{\mathbb{P}(B\cap(\cup A_n))}{\mathbb{P}(\cup A_n)}=\frac{\mathbb{P}(\cup(B\cap A_n))}{\mathbb{P}(\cup A_n)}=\frac{\sum \mathbb{P}(B\cap A_n)}{\mathbb{P}(\cup A_n)}=\frac{\sum_{n}\mathbb{P}(C|A_n)\mathbb{P}(A_n)}{\mathbb{P}(\cup A_n)}$$

$$=\frac{\sum \mathbb{P}(C\cap A_n)}{\mathbb{P}(\cup A_n)}=\frac{\mathbb{P}(\cup C\cap A_n)}{\mathbb{P}(\cup A_n)}=\mathbb{P}(C|\cup A_n)$$

(e) Temos

$$\sum \mathbb{P}(A_n| C)-\mathbb{P}(B| A_n\cap C)=\sum \frac{\mathbb{P}(A_n\cap C)}{\mathbb{P}(C)}\frac{\mathbb{P}(B\cap C\cap A_n)}{\mathbb{P}(A_n\cap C)}=\frac{1}{\mathbb{P}(C)}\sum_n \frac{\mathbb{P}((B\cap C)\cap A_n)}{\mathbb{P}(A_n)}$$

$$=\frac{1}{\mathbb{P}(C)}\sum \mathbb{P}(B\cap C|A_n)=\frac{\mathbb{P}(B\cap C)}{\mathbb{P}(C)}=\mathbb{P}(B|C)$$

Exemplo 1.4.14

Certo experimento consiste em lançar um dado equilibrado duas vezes independentemente. Dado que os dois números sejam diferentes, qual é a probabilidade condicional de

(a) pelo menos um dos números ser 6, e

(b) a soma dos números ser 8?

(a) $ A=(\text{Evento de dois número diferentes}) $, então $ \mathbb{P}(A)=\frac{30}{36}=\frac{5}{6} $.

$ B=(\text{ Pelo menos 1 número ser 6 }) $, $ \mathbb{P}(B)=\frac{11}{36} $, $ \mathbb{P}(B\cap A)=\frac{10}{36}=\frac{5}{18} $

$ C=(\text{ A soma dos numeros é 8 }). $$ \mathbb{P}(C)=\frac{5}{36} $, $ \mathbb{P}(C\cap A)=\frac{4}{36}=\frac{1}{9} $

Então, $ \mathbb{P}(B|A)=\dfrac{\mathbb{P}(B\cap A)}{\mathbb{P}(A)}=\dfrac{\frac{5}{18}}{\frac{5}{6}}=\frac{1}{3} $,

$ \mathbb{P}(C|A)=\dfrac{\mathbb{P}(C\cap A)}{\mathbb{P}(A)}=\dfrac{\frac{1}{9}}{\frac{5}{6}}=\frac{2}{15} $

Exemplo 1.3.15

Durante o mês de novembro a probabilidade de chuva é de 0,3. O Fluminense ganha um jogo em um dia com chuva com a probabilidade 0,4; em um dia sem chuva com a probabilidade 0,6. Se ganhou um jogo em novembro, qual é a probabilidade de que choveu nesse dia ?

Defina $ C= \lbrace \text{ ocorrer chuva em novembro } \rbrace $ e $ G = \lbrace \text{ evento fluminense ganha em novembro } \rbrace $.

$$\mathbb{P}(G|C)=0,4, \quad \quad \mathbb{P}(G^c|C)=0,6 \quad\quad \mathbb{P}(G|C^c)=0,6$$

Então

$$\mathbb{P}(C|G)=\frac{\mathbb{P}(C\cap G)}{\mathbb{P}(G)}=\frac{\mathbb{P}(C)\mathbb{P}(G|C)}{\mathbb{P}(G|C)\mathbb{P}(C)+\mathbb{P}(G|C^c)\mathbb{P}(C^c)}=\frac{0,3\times 0,4}{0,3\times 0,4+0,6\times 0,7}=\frac{2}{9}$$

Exemplo 1.3.16

Sejam $ A_1, \dots, A_n $ eventos aleatórios independentes, com $ p_k=\mathbb{P}(A_k),k=1,\dots, n $. Obtenha a probabilidade de ocorrência dos seguintes eventos em termos das probabilidades $ p_k $

(a) A ocorrência de nenhum dos $ A_k $.

$$B_a=\left[\bigcup_{k=1}^n A_k\right]^c=\left[\bigcap_{k=1}^n A_k^c\right]$$