6.4 Intervalo de Confiança
4.1 - Intervalo de confiança
Um intervalo de confiança (IC) é um intervalo estimado de um parâmetro de interesse de uma população. Em vez de estimar o parâmetro por um único valor, é dado um intervalo de estimativas prováveis. O quanto estas estimativas são prováveis será determinado pelo coeficiente de confiança $(1-\alpha)$, para $\alpha \in (0, 1)$.
Intervalos de confiança são usados para indicar a confiabilidade de uma estimativa. Por exemplo, um IC pode ser usado para descrever o quanto os resultados de uma pesquisa são confiáveis. Sendo todas as estimativas iguais, uma pesquisa que resulte num IC pequeno é mais confiável do que uma que resulte num IC maior.
Se $U$ e $V$ são estatísticas (isto é, funções da amostra) cuja distribuição de probabilidade dependa do parâmetro $\theta$, e
$$\mathbb{P}(U \ < \ \theta \ < \ V \ | \ \theta) = 1-\alpha$$
então o intervalo aleatório $(U,V)$ é um intervalo de confiança com nível $100(1-\alpha)\char37$ para $\theta$. Portanto, podemos interpretar o intervalo de confiança como um intervalo que contém os valores “plausíveis” que o parâmetro $\theta$ pode assumir. Assim, a amplitude do intervalo está associada a incerteza que temos a respeito do parâmetro.
Considere $X_1,X_2,\ldots,X_n$ uma amostra aleatória retirada de uma população com distribuição $f_{\theta}$ que depende do parâmetro $\theta$. Por exemplo, tomamos $X_1,X_2,\ldots,X_n$ uma amostra aleatória com distribuição normal com média $\mu$ desconhecida e desvio padrão conhecido $\sigma = 1$. Para propormos um intervalo de confiança para o parâmetro $\theta$, vamos introduzir o conceito de quantidade pivotal. Uma função $Q$ da amostra $(X_1,X_2,\ldots,X_n)$ e do parâmetro $\theta$ cuja distribuição de probabilidade não depende do parâmetro $\theta$ é denominada quantidade pivotal. Desta forma, dado o nível de confiança $1-\alpha$, tomamos
$$1-\alpha=\mathbb{P}\left(q_1\leq Q(X_1,X_2,\ldots,X_n;\theta)\leq q_2\right)$$
Se a quantidade pivotal $Q$ for inversível, podemos resolver a inequação acima em relação a $\theta$ e obter um intervalo de confiança.
Motivação
Suponha que queiramos estimar a média $\mu$ de uma população com distribuição normal com variância $\sigma^2$ conhecida. O estimador de máxima verossimilhança para a média populacional $\mu$ é dado pela média amostral $\overline{X}$ de uma amostra de tamanho $n$. Assim, temos a seguinte quantidade pivotal $e=(\overline{X}-\mu)\sim N(0,\sigma^2/n)$.
$$\mathbb{P}\left(|e| \ < \ 1,96\ \sigma/\sqrt{n}\right)=0,95$$
$$\mathbb{P}\left(|\overline{X}-\mu| \ < \ 1,96\ \sigma/\sqrt{n}\right)=0,95$$
$$\mathbb{P}\left(\overline{X}-1,96\ \sigma/\sqrt{n} \ < \ \mu \ < \ \overline{X}+1,96\ \sigma/\sqrt{n}\right)=0,95.$$
Para interpretar o intervalo de confiança da média, assumimos que os valores foram amostrados de forma independente e aleatória de um população com distribuição normal com média $\mu$ e variância $\sigma^2$. Dado que estas suposições são válidas, temos 95% de “chance” do intervalo conter o verdadeiro valor da média populacional. Em outras palavras, se produzirmos diversos intervalos de confiança provenientes de diferentes amostras independentes de mesmo tamanho, podemos esperar que aproximadamente 95% destes intervalos devem conter o verdadeiro valor da média populacional.
Figura 6.4.1: Respresentação de Intervalo de confiança com 95% de confiança
4.2 - Intervalo de confiança para média
Quando queremos estimar a média de uma população através de uma amostra temos dois casos distintos a considerar: quando a variância da população é conhecida e quando ela é desconhecida. A seguir, temos os dois casos.
4.2.1 - Variância conhecida
Consideremos uma amostra aleatória simples $X_1,\ldots,X_n$ obtida de uma população com distribuição normal, com média $\mu$ e variância $\sigma^2$ conhecida. Desta forma, a distribuição amostral da média também é Normal com média $\mu$ e variância $\sigma^2/n$, ou seja, $$\overline{X}\sim N\left(\mu,\frac{\sigma^2}{n}\right).$$
Assim, temos que
$$Z=\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1),$$
isto é, a variável $Z$ tem distribuição normal padronizada.
Consideremos que a probabilidade da variável $Z$ tomar valores entre $-Z_{\alpha/2}$ e $Z_{\alpha/2}$ é $1-\alpha$. Os valores $-Z_{\alpha/2}$ e $Z_{\alpha/2}$ são obtidos na tabela da distribuição normal conforme mostra a Figura 6.4.2 a seguir:
Figura 6.4.2 : Representação do intervalo de confiança de $1-\alpha$ entre $-Z_{\alpha/2}$ e $Z_{\alpha/2}$
Então, temos que
$$\mathbb{P}[-Z_{\alpha/2}\leq Z\leq Z_{\alpha/2}]= 1-\alpha$$
ou seja,
$$\mathbb{P}\left[-Z_{\alpha/2}\leq \frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\leq Z_{\alpha/2}\right]=(1-\alpha)$$
o que implica que
$$\mathbb{P}\left[\overline{X}-Z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\leq\mu\leq\overline{X} +Z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right]=1-\alpha.$$
Com isso, o intervalo de confiança da média é dado por
$$IC(\mu,1-\alpha)=\left(\overline{X}-Z_{\alpha/2}\frac{\sigma}{\sqrt{n}};\overline{X}+ Z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right).$$
Caso os dados não tenham distribuição normal, podemos aplicar o teorema central do limite e construir um intervalo de confiança aproximado.
Interpretação
Podemos afirmar que, se pudermos repetir muitas vezes o experimento e coletarmos os dados, aproximadamente em $100(1-\alpha)\char37$ das vezes a média populacional estará no intervalo encontrado.
Exemplo 4.2.1.1
O projetista de uma indústria tomou uma amostra de 36 funcionários para verificar o tempo médio gasto para montar um determinado brinquedo. Lembrando que foi verificado que $\overline{x}= 19,9$ e $\sigma = 5,73$, construir um intervalo de confiança de nível $95\char37$ para $\mu$.
Na tabela da distribuição normal padronizada, obtemos que $Z_{0,025}=1,96$. Substituindo $\overline{x}=19,9, n=36, \sigma=5,73$ e $Z_{0,025}=1,96$ na fórmula para o intervalo de confiança, temos
$$19,9-1,96\frac{5,73}{\sqrt{36}}\leq\mu\leq 19,9+1,96\frac{5,73}{\sqrt{36}}$$
e, portanto,
$$IC(\mu,0,95) = (18,02; \ 21,77)$$
Uma das principais interpretações do intervalo de confiança consiste em avaliar a incerteza que temos a respeito de estimarmos o parâmetro populacional $\mu$ a partir de uma amostra aleatória de tamanho $n$.
4.2.2 - Variânca desconhecida
Tendo os conceitos básicos sobre intervalos de confiança, vamos agora tratar uma situação mais realista: quando a variância $\sigma^2$ da população é desconhecida.
Consideremos uma amostra aleatória simples $X_1,X_2,\ldots,X_n$, obtida de uma população com distribuição normal, com média $\mu$ e variância $\sigma^2$ desconhecidas. Como neste caso a variância é desconhecida, utilizaremos a variância amostral $s^2$ no lugar de $\sigma^2$. Assim, temos que
$$T=\frac{\overline{X}-\mu}{s/\sqrt{n}}\sim t_{(n-1)}$$
ou seja, a variável $T$ tem distribuição t de Student com $n-1$ graus de liberdade.
Então, ao fixarmos o nível de significância $\alpha$, obtemos da Tabela da distribuição t de Student com $n-1$ graus de liberdade, o valor $t_{((n-1),\alpha/2)}$, que satisfaz
$$\mathbb{P}\left(-t_{((n-1),\alpha/2)}\leq T\leq t_{((n-1),\alpha/2)}\right)=1-\alpha$$
ou graficamente
Figura 6.4.3 : Representação do intervalo de confiança de $1-\alpha$ entre $-t_{n-1,\alpha/2}$ e $t_{n-1,\alpha/2}$
Analogamente ao caso anterior, obtemos que
$$\mathbb{P}\left(-t_{((n-1),\alpha/2)}\leq \frac{\overline{X}-\mu}{s/\sqrt{n}}\leq t_{((n-1),\alpha/2)}\right)=1-\alpha$$
ou seja, $$\mathbb{P}\left(\overline{X}-t_{((n-1),\alpha/2)}\frac{s}{\sqrt{n}}\leq\mu\leq \overline{X}+t_{((n-1),\alpha/2)}\frac{s}{\sqrt{n}}\right)=1-\alpha.$$
Logo, o intervalo com $100(1-\alpha)\char37$ de confiança para $\mu$, com variância desconhecida, será dado por
$$IC(\mu,1-\alpha)=\left(\overline{X}-t_{\alpha/2}\frac{s}{\sqrt{n}};\overline{X}+t_{\alpha/2}\frac{s}{\sqrt{n}}\right).$$
Exemplo 4.2.2.1
Consideremos que o projetista de uma indústria tomou uma amostra de 36 funcionários para verificar o tempo médio gasto para montar um determinado brinquedo. Os tempos estão colocados na Tabela 6.4.1 a seguir. Dado que o projetista não tem conhecimento da variabilidade da população, construir um intervalo de confiança com $(1-\alpha) = 0,95$ para a média $\mu$.
| 17,1000 | 16,8930 | 14,6004 | 13,0053 |
| 29,6292 | 19,2500 | 17,7504 | 24,6337 |
| 29,3567 | 25,0798 | 16,7914 | 29,4087 |
| 23,8807 | 15,2133 | 19,1536 | 30,3199 |
| 13,0050 | 24,6795 | 29,3308 | 20,7309 |
| 16,4541 | 26,2017 | 21,7857 | 19,7393 |
| 24,6042 | 18,6442 | 21,2594 | 26,9123 |
| 16,9896 | 32,8977 | 21,3627 | 15,4958 |
| 18,3113 | 23,6931 | 19,5429 | 16,3855 |
Tabela 6.4.1: Dados da amostra ($n=36$)
Analisando esse conjunto de dados temos que $\overline{x}=21,39$ e $s=5,388.$ Substituindo esses valores na fórmula do intervalo de confiança temos que
$$21,39-2,03\cfrac{5,38}{\sqrt{36}}\leq\mu\leq 21,39+2,03\cfrac{5,38}{\sqrt{36}}.$$
Portanto,
$$IC(\mu,0,95) = (19,568;\ 23,214).$$
Exemplo 4.2.2.2
Foram realizados testes glicêmicos em 25 pacientes após um jejum de 8 horas. Os resultados são apresentados na tabela abaixo. Encontrar um intervalo de confiança de nível $95$ % para a média $\mu$.
| 80 | 118 | 100 | 90 | 83 |
| 117 | 95 | 84 | 102 | 80 |
| 112 | 78 | 102 | 121 | 82 |
| 77 | 88 | 73 | 104 | 88 |
| 132 | 91 | 103 | 140 | 101 |
Tabela 6.4.2: Tabela dos resultados dos testes glicêmicos (mg/dL)
Inicialmente, calculamos a média amostral $\overline{X}$ e o desvio padrão amostral $s$, que são dados por
$$\overline{X} = \frac{1}{25}\sum_{i=1}^{25}X_i = 97,64 \qquad s = \sqrt{\frac{1}{24}\sum_{i=1}^{25}\left(X_i-\overline{X}\right)^2}= 17,82.$$
Como a confiança é de 95%, segue $t_{0,025, 24} = 2,06$ e então, substituindo esses valores na fórmula do intervalo de confiança, temos que
$$IC(\mu;0,95)=\left[97,64-2,06\frac{17,82}{\sqrt{25}};97,64+2,06\frac{17,82}{\sqrt{25}}\right]=[90,28;\ 105].$$
4.3 - Intervalo de confiança para proporção
Consideremos $X$ a variável aleatória que representa a presença (ou não) de determinada característica de uma população. Assim temos que $X$ tem distribuição de Bernoulli com parâmetro $p$, no qual $p$ representa a probabilidade de um determinado elemento da amostra ter a característica de interesse. Retiramos uma amostra aleatória $X_1,\ldots,X_n$ desta população. Cada $X_i, i = 1,\ldots,n$ tem distribuição de Bernoulli com parâmetro $p$, isto é,
$$X_1,X_2,\ldots,X_n\sim \ \text{Bernoulli}(p)$$
com média $\mu = p$ e variância $\sigma^2 = p(1-p)$.
Neste caso, o estimador de máxima verossimilhança $(\hat{p})$ para o parâmetro populacional $p$ é dado por $$\hat{p}=\frac{\text{Nº de elementos da amostra com a característica}}{\text{Total de elementos da amostra}}=\displaystyle\cfrac{\displaystyle\sum_{i=1}^nx_i}{n}=\overline{x}.$$
Utilizaremos três métodos diferentes para encontrar o intervalo de confiança para a proporção: Aproximação normal, aproximação normal com correção de continuidade e binomial exata.
4.3.1 - Aproximação normal
Vejamos como construir intervalos de confiança para a proporção $p$, utilizando a aproximação Normal. Consideremos $\hat{p}$ a proporção amostral. Pelo Teorema Central do Limite temos que, para um tamanho de amostra grande, podemos considerar a proporção amostral $\hat{p}$ como tendo aproximadamente distribuição normal com média p e variância p(1-p)/n. Desse modo segue que
$$\hat{p}\sim N\left(p,\frac{p(1-p)}{n}\right).$$
Observemos que a variância de $\hat{p}$ depende do parâmetro desconhecido $p$. No entanto, pelo fato de $n$ ser grande, podemos substituir $p$ por $\hat{p}$. Com isso temos que
$$\frac{\hat{p}-p}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}\sim N(0,1).$$
Considerando o mesmo procedimento de montagem do intervalo para a média, construímos o intervalo com $100(1 - \alpha)\char37$ de confiança para a proporção $p$:
$$IC(p,1-\alpha)=\left(\hat{p}-Z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}},\hat{p}+Z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\right).$$
Exemplo 4.3.1.1
Numa amostra aleatória de tamanho $n=700$ foram encontrados $68$ elementos defeituosos. Achar um intervalo de confiança de nível $95\char37$ para a proporção $p$ de defeituosos.
Temos que $\hat{p}=68/700=0,0971$. Para $\alpha=0,05$, temos pela tabela da distribuição normal que $Z_{0,025}=1,96$. Então o intervalo de confiança é dado por
$$\left(0,0971-1,96\sqrt{\frac{0,0971(0,9028)}{700}};0,0971+1,96\sqrt{\frac{0,0971(0,9028)}{700}}\right)=(0,0752;\ 0,119).$$
4.3.2 - Aproximação normal com correção de continuidade
Uma outra maneira de obtermos um intervalo de confiança para proporção é através da aproximação normal com correção de continuidade. Considerando o processo anterior, a única diferença é que aqui não consideraremos simplesmente a proporção amostral $\hat{p}$, mas sim uma correção dela. Assim, para determinar o intervalo de confiança consideramos uma modificação da proporção $\hat{p}$, dada por:
$$\hat{p}_c= \begin{cases} \displaystyle\hat{p}+\frac{1}{2n} \ \hbox{se} \ \hat{p} \ < \ 0,5 \cr \cr \hat{p}-\frac{1}{2n} \ \hbox{se} \ \hat{p} \ > \ 0,5. \end{cases} $$
Assim, o intervalo de confiança para proporção $p$ com correção de continuidade, é dado por
$$IC(p,1-\alpha)=\left(\hat{p_c} \mp Z_{\alpha/2} \sqrt{\frac{\hat{p}_c(1-\hat{p}_c)}{n}} \right).$$
O fator de continuidade é utilizado para melhorar a aproximação de uma variável aleatória discreta $\hat{p}$ pela distribuição normal que é contínua.
Exemplo 4.3.2.1
Consideremos novamente o Exemplo 4.2.1.1. Vamos agora encontrar o intervalo de confiança com correção de continuidade.
Temos que $\hat{p}=68/700=0,0971$. Assim, $\hat{p} \ < \ 0,5$. Então $\hat{p_c}=0,0971+1/1400=0,0978$. Para α=0,05, temos pela tabela da distribuição normal que $Z_{0,025}$=1,96. Então o intervalo de confiança é dado por:
$$IC(p,0,95)=\left(0,0978-1,96\sqrt{\frac{0,0978(1-0,0978)}{700}};\quad 0,0978+1,96\sqrt{\frac{0,0978(1-0,0978)}{700}}\right)$$
ou seja,
$$IC(p,0,95)=(0,07579;\ 0,1198).$$
4.3.3 - Binomial exata
Consideremos uma amostra aleatória $X_1,\ldots,X_n$ de uma população com distribuição de Bernoulli com parâmetro $p$. Vamos ver como obter um intervalo de confiança para a proporção utilizando o método da Binomial Exata (sem utilizar o teorema central do limite).
Seja $1 - \alpha$ o nível de confiança. Considere $P_1= 1 - \alpha/2$. Seja $Y$ o número de sucessos (ocorrências do evento de interesse) e considere o valor $x = Y - 1$. Encontre na Tabela da distribuição binomial o valor de $P_1$ correspondente aos valores de $n$ e $x$. O valor $p$ encontrado no topo da coluna que contém o valor $P_1$ é o limite inferior do intervalo de confiança. Para encontrar o limite superior considere $P_2= \alpha/2$, $x = Y$ e entre na mesma tabela com os valores de $n$ e $x$ até encontrar o valor de $P_2$. O valor correspondente de $p$ no topo da tabela é o limite superior do intervalo de confiança.
Exemplo 4.3.3.1
Em um lote com $19$ peças, $4$ eram defeituosas. Obter um intervalo de confiança, com $\alpha = 0,05$, para a proporção $p$ de peças defeituosas.
Temos que $P_1= 1-\alpha/2=1-0,025=0,975$, $x=3$ e $n=19$. Assim, obtemos na tabela da distribuição binomial o limite inferior $0,05$. Por outro lado, $P_2= 0,025$ e $x=4$. Assim obtemos que o limite superior é igual a $0,45$.
Então o intervalo com 95% de confiança paa a proporção de defeituosas é $(0,05;0,45)$.
Observação
Este método é utilizado apenas para amostras de tamanho pequeno. Para amostras grande, utilizamos o teorema central do limite para obter o intervalo de confiança.
4.4 - Intervalo de confiança para taxa
Consideremos uma amostra aleatória $X_1,\ldots,X_n$ de uma população com distribuição de Poisson com parâmetro $\lambda$, isto é,
$$X_1,X_2,\ldots,X_n\sim \ \hbox{Poisson}(\lambda).$$
Sabemos que $\hat{\lambda}=\displaystyle \sum_{i=1}^n\frac{X_i}{n}$ é um estimador de máxima verossimilhança para $\lambda$. Utilizando o teorema central do limite, temos
$$\hat{\lambda}=\displaystyle\sum_{i=1}^n\frac{X_i}{n}\sim N\left(\lambda,\frac{\lambda}{n}\right)$$
o que implica que
$$Z=\frac{\hat{\lambda}-\lambda}{\sqrt{\frac{\hat{\lambda}}{n}}}\sim N(0,1).$$
Analogamente aos casos anteriores, obtemos um intervalo com $100(1 - \alpha)\char37$ de confiança para a taxa:
$$IC(\lambda,1-\alpha)=\left(\hat{\lambda}-Z_{\alpha/2}\sqrt{\frac{\hat{\lambda}}{n}};\ \hat{\lambda}+Z_{\alpha/2}\sqrt{\frac{\hat{\lambda}}{n}}\right).$$
Exemplo 4.4.1
Em um processo de uma fábrica, 72 peças foram escolhidas de forma aleatória e o número de defeitos encontrado em cada peça se encontra na Tabela 6.4.3 abaixo. Construa um intervalo de confiança, com $\alpha=0,05$, para a taxa de defeitos nas peças.
| 0 | 0 | 1 | 0 | 2 | 0 | 0 | 0 | 0 | 1 | 0 | 0 |
| 0 | 0 | 1 | 0 | 3 | 1 | 0 | 2 | 0 | 1 | 2 | 1 |
| 1 | 0 | 0 | 0 | 0 | 1 | 0 | 1 | 1 | 1 | 5 | 1 |
| 0 | 0 | 2 | 0 | 0 | 1 | 0 | 3 | 0 | 0 | 0 | 2 |
| 0 | 2 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 2 | 1 |
| 0 | 2 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 1 |
Tabela 6.4.3: Número de defeitos da amostra
Temos que $\hat{\lambda}=\displaystyle\sum_{i=1}^{72} \frac{X_i}{72}=0,64$. Para $\alpha=0,05$, temos pela tabela da distribuição normal que $Z_{0,025}=1,96$. Então, o intervalo de confiança é dado por
$$IC(\lambda,1-\alpha)=\left(0,64-1,96\sqrt{\frac{0,64}{72}};\ 0,64+1,96\sqrt{\frac{0,64}{72}}\right)=(0,455;\ 0,825).$$
Veja a seguir os resultados obtidos pelo software Action Stat.
| Estatística Z | -0.01178511 |
| P-Valor | 0.9905971 |
| Taxa Média Amostral | 0.6388889 |
| Tamanho Amostral | 72 |
| Hipótese Alternativa Diferente de | 0.64 |
| Nível de Confiança | 95% |
| Limite Inferior | 0.4542622 |
| Limite Superior | 0.8235156 |
Tabela 6.4.4: Resultados obtidos pela Action Stat
4.5 - Intervalo de confiança para variância
Consideremos uma amostra aleatória $X_1,\ldots,X_n$ de tamanho $n$ de uma população com distribuição normal com média $\mu$ e variância $\sigma^2$. Um estimador para $\sigma^2$ é a variância amostral $s^2$. Assim, sabemos que a quantidade pivotal $$Q=\frac{(n-1)s^2}{\sigma^2}\sim\chi_{n-1}^2.$$
Seja $1-\alpha$ a probabilidade da variável $Q$, com $n-1$ graus de liberdade, tomar valores entre $Q_{\alpha/2}$ e $Q_{1-\alpha/2}$, valores obtidos na tabela da distribuição qui-quadrado tais que $\mathbb{P}[Q \ < \ Q_{\alpha/2}]=\mathbb{P}[Q \ > \ Q_{1-\alpha/2}]=\alpha/2$.
Figura 6.4.4: Distribuição Qui-quadrado e valores críticos
Observando a equação
$$Q_{\alpha/2}\leq Q\leq Q_{1-\alpha/2}$$
vemos que podemos substituir $Q$ pela expressão acima e então obtemos
$$Q_{\alpha/2}\leq\frac{(n-1)s^2}{\sigma^2}\leq Q_{1-\alpha/2}.$$
Reescrevendo esta desigualdade, obtemos o intervalo de confiança para a variância,
$$\frac{(n-1)s^2}{Q_{1-\alpha/2}} \ < \ \sigma^2 \ < \ \frac{(n-1)s^2}{Q_{\alpha/2}}.$$
Assim,
$$\mathbb{P}\left(\frac{(n-1)s^2}{Q_{1-\alpha/2}} \ < \ \sigma^2 \ < \ \frac{(n-1)s^2}{Q_{\alpha}}\right)=1-\alpha.$$
Logo, o intervalo com nível $100(1-\alpha)\char37$ de confiança para $\sigma^2$ será dado por
$$IC(\sigma^2,1-\alpha)=\left(\frac{(n-1)s^2}{Q_{1-\alpha/2}},\frac{(n-1)s^2}{Q_{\alpha/2}}\right).$$
Exemplo 4.5.1
O peso de componentes mecânicos produzidos por uma determinada empresa é uma variável aleatória que se supõe ter distribuição normal. Pretende-se estudar a variabilidade do peso dos referidos componentes. Para isso, uma amostra de tamanho 11 foi obtida,cujos valores em grama são:
98, 97, 102, 100, 98, 101, 102, 105, 95, 102, 100
Construa um intervalo de confiança para a variância do peso, com um grau de confiança igual a 95%.
Temos que $n=11$, $\overline{x}=100$ e
$$s^2=\sum_{i=1}^11\frac{(x_i-\overline{x})^2}{10}=\frac{4+9+\ldots+25+4+0}{10}=8.$$
Pela Tabela da distribuição qui-quadrado com $10$ graus de liberdade, temos que $Q_{0,025}= 3,25$ e $Q_{0,975} = 20,48$. Assim,
$$IC(\sigma^2,1-\alpha)=\left(\frac{10\times 8}{20,48},\ \frac{10\times 8}{3,25}\right)=(3,90;\ 24,61).$$
4.6 - Intervalo de confiança para razão entre duas variâncias
Vejamos como construir um intervalo de confiança para a razão entre duas variâncias de populações normais independentes. Para isso retiramos uma amostra aleatória $X_1,X_2,\dots,X_{n_1}$ da população 1, com distribuição $N(\mu_1,\sigma^2_1)$, e uma amostra $Y_1,Y_2,\dots,Y_{n_2}$ da população 2, com distribuição $N(\mu_2,\sigma^2_2)$. Como
$$Q_1=\cfrac{(n_1-1)}{\sigma_1^2}s_1^2\sim\chi_{n_1-1}^2 \quad \hbox{(Qui-quadrado com} \ n_1-1 \ \hbox{graus de liberdade)}$$
$$Q_2=\cfrac{(n_2-1)}{\sigma_2^2}s_2^2\sim\chi_{n_2-1}^2 \quad \hbox{(Qui-quadrado com} \ n_2-1 \ \hbox{graus de liberdade)}$$
em que $s^2_1$ é a variância amostral da população 1 e $s^2_2$ a variância amostral da população 2. Neste caso, a expressão $F$ definida por
$$F=\cfrac{\cfrac{Q_1}{N_1-1}}{\cfrac{Q_2}{n_2-1}}=\cfrac{\cfrac{s_1^2}{\sigma_1^2}}{\cfrac{s_2^2}{\sigma_2^2}}=\cfrac{s_1^2}{s_2^2}\cfrac{\sigma_2^2}{\sigma_1^2}$$
tem distribuição F de Snedecor com $n_1-1$ graus de liberdade no numerador e $n_2-1$ graus de liberdade no denominador e denotamos por $F_{(n_1-1;n_2-1)}$.
Consideremos que a probabilidade da variável $F$ tomar valores entre $F_{(\frac{\alpha}{2};n_1-1;n_2-1)}$ e $F_{(1-\frac{\alpha}{2};n_1-1;n_2-1)}$ é $1-\alpha$. Esses valores são obtidos na Tabela da distribuição de Fisher-Snedecor referente ao valor de $\alpha$ e aos graus de liberdade do numerador e do denominador, $n_1-1$ e $n_2-1$, respectivamente. Veja a figura a seguir.
Figura 6.4.5: Distribuição Fisher-Snedecor e valores críticos
Observando a equação
$$F_{\alpha/2} \ < \ F \ < \ F_{(1-\alpha/2)}$$
vemos que podemos substituir $F$ pela expressão acima e assim temos
$$F_{\alpha/2} \ < \frac{s_1^2}{s_2^2}\frac{\sigma_2^2}{\sigma_1^2} \ < \ F_{(1-\alpha/2)}.$$
Reescrevendo esta equação obtemos:
$$\cfrac{1}{F_{(1-\alpha/2)}}\frac{s_1^2}{s_2^2} \ < \ \frac{\sigma_1^2}{\sigma_2^2} \ < \ \frac{1}{F_{\alpha/2}}\frac{s_1^2}{s_2^2}.$$
Assim,
$$P\left(\frac{1}{F_{(1-\alpha/2)}}\frac{s_1^2}{s_2^2} \ < \ \frac{\sigma_1^2}{\sigma_2^2} \ < \ \frac{1}{F_{\alpha/2}}\frac{s_1^2}{s_2^2}\right)=1-\alpha.$$
Observe que $F_{(1-\alpha/2,n_1-1,n_2-1)}=\frac{1}{F_{(\alpha/2,n_2-1,n_1-1)}}$ e $F_{(\alpha/2,n_1-1,n_2-1)}=\frac{1}{F_{(1-\alpha/2,n_2-1,n_1-1)}}$.
Logo, o intervalo de confiança com nível $100(1-\alpha)\char37$ para a razão entre duas variâncias será dado por
$$IC(\sigma_1^2/\sigma_2^2,1-\alpha)=\left(\frac{1}{F_{(1-\alpha/2)}}\frac{s_1^2}{s_2^2};\ \frac{1}{F_{(\alpha/2)}}\frac{s_1^2}{s_2^2}\right).$$
4.7 - Intervalo de confiança para a diferença de médias
4.7.1 - 1º Caso: Variâncias conhecidas
Consideremos duas amostras aleatórias, $X_1,X_2,\ldots,X_{n1}$ de tamanho $n_1$ e $Y_1,Y_2,\ldots,Y_{n2}$ de tamanho $n_2$, ambas com distribuição normal, médias $\mu_1$ e $\mu_2$ e variâncias $\sigma_1^2$ e $\sigma_2^2$, respectivamente. Assim,
$$\overline{X}\sim N\left(\mu_1,\frac{\sigma_1^2}{n_1}\right) \ \hbox{e} \ \overline{Y}\sim N\left(\mu_2,\frac{\sigma_2^2}{n_2}\right).$$
Daí, temos que,
$$\overline{X}-\overline{Y}\sim N\left(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}\right)$$
o que implica que
$$Z=\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1).$$
Consideremos que a probabilidade da variável $Z$ tomar valores entre $-Z_{\alpha/2}$ e $Z_{\alpha/2}$ é $1-\alpha$. Observando a equação
$$-Z_{\alpha/2}\leq Z\leq Z_{\alpha/2}$$
vemos que podemos substituir $Z$ pela expressão acima e assim obtemos
$$-Z_{\alpha/2}\leq\frac{\overline{X}-\overline{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\leq Z_{\alpha/2}.$$
Reescrevendo esta desigualdade, obtemos o intervalo de confiança para a diferença das médias $\mu_1-\mu_2$
$$IC(\mu_1-\mu_2,1-\alpha)=\left((\overline{X}-\overline{Y})-Z_{\alpha/2}\left(\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\right);(\overline{X}-\overline{Y})+Z_{\alpha/2}\left(\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\right)\right)$$
e podemos afirmar que se pudéssemos construir uma quantidade grande de intervalos $IC(\mu_1-\mu_2,1-\alpha)$, todos baseados em amostras de tamanho $n_1$ e $n_2$, em torno de $100(1-\alpha)\char37$ deles conteriam o valor verdadeiro da média populacional.
4.7.2 - 2º Caso: Variâncias desconhecidas - porém iguais
Consideremos agora duas amostras aleatórias, $X_1,X_2,\ldots,X_{n1}$ de tamanho $n_1$ e $Y_1,Y_2,\ldots,Y_{n2}$ de tamanho $n_2$, com apenas uma diferença do caso anterior: as variâncias são desconhecidas, porém iguais, isto é, $\sigma_1^2 = \sigma_2^2 = \sigma^2$. Como
$$\frac{(n_1-1)s_1^2}{\sigma^2}\sim\chi_{n_1-1}^2 \quad \hbox{e} \quad \frac{(n_2-1)s_2^2}{\sigma_2}\sim\chi_{n_2-1}^2$$
onde $s_1^2$ é a variância amostral da população $1$ e $s_2^2$ é a variância amostral da população $2$, temos que
$$T=\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t_{n_1+n_2-2}$$
onde $$s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}.$$
Daí, utilizando a tabela da distribuição t de Student com $\nu=(n_1+n_2- 2)$ graus de liberdade, obtemos o valor de $t_{(a,\alpha/2)}$ de forma que
$$-t_{(\nu,\alpha/2)} \ < \ \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \ < \ t_{(\nu,\alpha/2)}.$$
Reescrevendo esta desigualdade, obtemos o intervalo de confiança para a diferença das médias $\mu_1-\mu_2$ quando as variâncias são desconhecidas, porém iguais,
$$(\overline{X}-\overline{Y})-t_{(\nu,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\leq\mu_1-\mu_2\leq (\overline{X}-\overline{Y})+t_{(\nu,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$$
ou seja,
$$\text{IC}(\mu_1-\mu_2,1-\alpha)=\left((\overline{X}-\overline{Y})-t_{(\nu,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}};(\overline{X}-\overline{Y})+t_{(\nu,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right)$$
e podemos afirmar que se pudéssemos construir uma grande quantidade de intervalos $\text{IC}(\mu_1-\mu_2, 1 - \alpha)$, todos baseados em amostras de tamanho $n_1$ e $n_2$, em torno de $100(1-\alpha)\char37$ deles conteriam a verdadeira diferença das médias populacionais.
4.7.3 - 3º Caso: Variâncias desconhecidas e diferentes
Consideremos duas amostras aleatórias, $X_1,X_2,\ldots,X_{n1}$ de tamanho $n_1$ e $Y_1,Y_2,\ldots,Y_{n2}$ de tamanho $n_2$, com distribuições normais, mas agora com variâncias desconhecidas e diferentes, isto é, $\sigma_1^2\neq\sigma_2^2$. Como as variâncias populacionais são desconhecidas, usaremos as variâncias amostrais $s_1^2$ e $s_2^2$ em seus lugares. Consideremos a variável $T$ tal que
$$T=\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\sim t_{\nu}$$
ou seja, a variável $T$ dada pela equação acima tem distribuição t de Student com $\nu$ graus de liberdade, onde
$$\nu=\frac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\frac{\left(\frac{s_1^2}{n_1}\right)^2}{n_1-1}+\frac{\left(\frac{s_2^2}{n_2}\right)^2}{n_2-1}}.$$
Fazendo uma construção análoga a do caso anterior, obtemos o intervalo de confiança para a diferença de duas médias com variâncias desconhecidas e desiguais:
$$\text{IC}(\mu_1-\mu_2,1-\alpha)=\left((\overline{X}-\overline{Y})-t_{(\nu,\alpha/2)}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}};\ (\overline{X}-\overline{Y})+t_{(\nu,\alpha/2)}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right).$$
Exemplo 4.7.3.1
Os dados a seguir correspondem a teores de um elemento indicador da qualidade de um certo produto. Foram coletadas $2$ amostras referente a $2$ métodos de produção. Construa um intervalo de confiança para a diferença das médias dos dois métodos.
| Método 1 | 0,9 | 2,5 | 9,2 | 3,2 | 3,7 | 1,3 | 1,2 | 2,4 | 3,6 | 8,3 |
| Método 2 | 5,3 | 6,3 | 5,5 | 3,6 | 4,1 | 2,7 | 2,0 | 1,5 | 5,1 | 3,5 |
Tabela 6.4.5: Duas amostras referente a dois métodos de produção
A média referente ao método $1$ é $\overline{x}_1 = 3,63$ e do método $2$ é $\overline{x}_2 = 3,96$. Calculando as variâncias amostrais, obtemos
$$s_1^2=\sum_{i=1}^{10}\frac{(x_{1i}-\overline{x}_1)^2}{9}=8,29 \quad s_2^2=\sum^{10}_{i=1}\frac{(x_{2i}-\overline{x}_2)^2}{9}=2,53$$
em que $x_{1i}$ são os teores referentes ao método $1$ e $x_{2i}$ ao método $2$, $i = 1, …, 10$. Os graus de liberdade são dados por
$$\nu=\frac{\left(\frac{8,29}{10}+\frac{2,53}{10}\right)^2}{\frac{\left(\frac{8,29}{10}\right)^2}{9}+\frac{\left(\frac{2,35}{10}\right)^2}{9}}=14,028.$$
Assim, da Tabela da distribuição t de Student obtemos que $t_{14,0,025}= 2,145$ e então temos que
$$\text{IC}(\mu_1-\mu_2,1-\alpha)=\left((3,63-3,96)(-2,145)\sqrt{\frac{8,29}{10}+\frac{2,53}{10}};(3,63-3,96)(2,145)\sqrt{\frac{8,29}{10}+\frac{2,53}{10}}\right),$$
ou seja, $\text{IC}(\mu_1-\mu_2,1-\alpha)=(-2,56;1,90)$.
Usando o software Action Stat temos os seguintes resultados:
| Informação | Valor |
|---|---|
| Estatística T | -0.3172124 |
| Graus de Liberdade | 14.01997 |
| P-valor | 0.7557571 |
| Média da Amostra 1 | 3.63 |
| Média da Amostra 2 | 3.96 |
| Desvio Padrão da Amostra 1 | 2.88 |
| Desvio Padrão da Amostra 2 | 1.59 |
| Hipótese Alternativa Diferente de | 0 |
| Nível de Confiança | 95% |
| Limite Inferior | -2.56095 |
| Limite Superior | 1.90095 |
Tabela 6.4.6: Resultados do Intervalo de Confiança para duas amostras de variâncias populacionais desconhecidas e diferentes
4.8 - Intervalo de tolerância
Na ciência estatística existe a possibilidade da criação de diversos tipos de intervalos diferentes. Dendo do paradigma Bayesiano existe o intervalo de credibilidade. Em relação à inferência clássica existe o amplamente conhecido intervalo de confiança. Ainda, tem-se a existência de outros intervalos, como por exemplo o intervalo de previsão.
O intervalo de confiança clássico tem por finalidade trazer uma maior confiança à respeito de uma estimativa pontual, gerando dois valores (limites inferior e superior) nos quais a probabilidade desse intervalo conter o verdadeiro parâmetro populacional é $\gamma$, chamado de nível de confiança. Esse intervalo está sempre associado a uma medida populacional (média, variância, entre outros).
Ao contrário do intervalo de confiança supracitado, o intervalo de tolerância tem por objetivo construir limites de tal forma que ao menos uma determinada proporção populacional esteja contida entre os limites inferior e superior com um nível de confiança $\gamma$. Sendo assim, o principal fator que distingue ambos intervalos é o fato de que, enquanto o intervalo de confiança é relativo a um parâmetro populacional, o intervalo de tolerância está associado a própria distribuição dos dados.
Esse protocolo contém as técnicas estatísticas para a construção de intervalos de confiança bilateral e unilateral para dados resultantes de distribuições contínuas.
Assim, seja $X$ uma variável aleatória contínua com distribuição de probabilidade $f_X(x)$ e função de distribuição acumulada $F_X(x)$. Ainda, $\mathbb{P}(\cdot)$ denota uma medida de probabilidade.
A forma geral dos intervalos de tolerância são:
- Intervalo de tolerância unilateral inferior
Então um intervalo de tolerância unilateral inferior para uma população populacional de ao menos $P$ e com confiança $\gamma = 1 - \alpha$ será constituído por um limite inferior $L$ tal que:
$$\mathbb{P}\left[1-F_{X}(L ; \theta) \geq P\right] \geq 1-\alpha. \tag{4.8.1}$$
- Intervalo de tolerância unilateral superior;
Define-se o intervalo de tolerância unilateral superior para uma população populacional de ao menos $P$ e com confiança $\gamma = 1 - \alpha$ como sendo o limite superior $U$, tal que:
$$\mathbb{P}\left[F_{X}(U ; \theta) \geq P\right] \geq 1-\alpha. \tag{4.8.2}$$
- Intervalo de tolerância bilateral;
O intervalo de tolerância bilateral para uma proporção populacional de ao menos $P$ com confiança $1-\alpha$ é formado por valores $L$ e $U$ tais que:
$$\mathbb{P}\left[F_{X}(U ; \theta) - F_{X}(L ; \theta) \geq P\right] \geq 1-\alpha. \tag{4.8.3}$$
As formulações acima são genéricas. Para cada distribuição de probabilidade tem-se que elas resultaram em expressões diferentes.
Ademais, é possível construir intervalos de tolerância sem supor uma distribuição probabilística para os dados. Esse tipo de intervalo é chamado de intervalo de tolerância não paramétrico (ou livre de distribuição).
4.8.1 - Intervalo de tolerância paramétrico
O intervalo de tolerância paramétrico consiste em atribuir uma distribuição probabilística aos dados amostrais. Assim, a partir das equações $4.8.1,\ 4.8.2 \ $ e $\ 4.8.3$, obtém-se a forma do intervalo de tolerância para cada distribuição.
A suposição de uma distribuição de probabilidade pode ser justificada a partir de um teste de hipótese para a qualidade do ajuste. Alguns destes testes são: Anderson - Darling, Kolmogorov - Smirnov e Cramér–von Mises. Outrossim, a suposição de uma distribuição pode ser verificada graficamente a partir de histogramas, distribuição acumulada empírica e por meio dos gráficos de quantis.
Abaixo é apresentado as formas do intervalo de tolerância para sete distribuições diferentes.
Distribuição Normal
Uma variável aleatória $X$ possui distribuição normal se a sua função de distribuição acumulada puder ser escrita na forma: $$ F_{X}(x ; \mu, \sigma)=\int_{t=-\infty}^{t = x}\left(2 \pi \sigma^{2}\right)^{-1 / 2} e^{-\frac{(t-\mu)^{2}}{2 \sigma^{2}}} d t. $$
Em que $-\infty < x < -\infty$, $-\infty < \mu < -\infty$ e $\sigma^2 > 0$.
Ainda, considera-se os estimadores para $\mu$ e $\sigma$: $\widehat{\mu} = \overline{X}$ e $\widehat{\sigma} = S$ (média e desvio padrão amostral). Dessa maneira, para dados normalmente distribuídos, o intervalo de tolerância consistirá em: $$\widehat{\mu} \pm k \cdot \widehat{\sigma} \text{, para um intervalo bilateral}.$$ $$\widehat{\mu} - k \cdot \widehat{\sigma} \text{, para um intervalo unilateral inferior}.$$ $$\widehat{\mu} + k \cdot \widehat{\sigma} \text{, para um intervalo unilateral superior}.$$
Intervalo Bilateral
Da equação $4.8.3$, vem: $$\mathbb{P}_{\tilde{X},S} \lbrace \mathbb{P}_X (\bar{X}-k_2S \leq X \leq \bar{X}+k_2S \mid \bar{X},S) \geq P \rbrace \geq 1-\alpha $$
Padronizando a variável, tem-se: $$\mathbb{P}_{Z_n, U}(F_X (Z_n+k_2 U)- F_X (Z_n-k_2 U) \geq P) \geq 1-\alpha. $$
Em que $Z_{n} = \frac{\overline{X} - \mu}{\sigma} \sim N(0, \frac{1}{n})$ independente de $U^2 = \frac{S^2}{\sigma^2} \sim \frac{\chi^2_{(n-1)}}{n-1}$.
Agora, tem-se que $k$ é a solução da equação: $$ \sqrt{\frac{2 n}{\pi}} \int_{0}^{\infty} \mathbb{P}\left(\chi_{n-1}^{2}>\frac{(n-1) \cdot \chi_{1 ; P}^{2}\left(z^{2}\right)}{k^{2}}\right) e^{-\frac{1}{2} n z^{2}} d z=1-\alpha. $$
Existem alguns métodos para resolver essa equação e encontrar o valor de k. O utilizado pelo Action Stat é o método de Howe (Howe, 1969).
$$ k = z_{\frac{1+P}{2}} \sqrt{1+n^{-1}} \cdot \sqrt{\frac{n-1}{\chi_{n-1 ; \alpha}^{2}}} \cdot \sqrt{1+\frac{n-3-\chi_{n-1 ; \alpha}^{2}}{2(n+1)^{2}}}. $$
Em que $z_{\frac{1+P}{2}}$ é o quantil $\frac{1 + P}{2}$ da normal padrão.
Intervalo Unilateral
Abaixo expõe-se a obtenção do valor $k$ para o intervalo unilateral superior. O mesmo valor de $k$ é obtido para o intervalo unilateral inferior.
Da equação $4.8.2$, junto com o fato de que o intervalo pode ser escrito da seguinte forma $\widehat{\mu} + k \cdot \widehat{\sigma}$, vem: $$ \mathbb{P}_{\bar{X}, S}\left \lbrace \mathbb{P}\left(X<\bar{X}+k_1 S \mid \bar{X}, S\right)>P\right \rbrace =1-\alpha. $$
Padronizando tem-se: $$ \mathbb{P}_{Z_n, U}\left \lbrace F_X \left(Z_n+k_1 U\right)\geq P\right \rbrace = 1 - \alpha $$
Em que $Z_{n} = \frac{\overline{X} - \mu}{\sigma} \sim N(0, \frac{1}{n})$ independente de $U^2 = \frac{S^2}{\sigma^2} \sim \frac{\chi^2_{(n-1)}}{n-1}$.
Desse modo, o valor de $k$ é: $$ k = \frac{1}{\sqrt{n}} t_{n-1 ; 1-\alpha}\left(z_{P} \sqrt{n}\right). $$
Em que $z_P$ é o P-ésimo percentil da normal padrão.
Distribuição Log Normal
Uma variável aleatória $X$ possui distribuição log-normal quando o seu logaritmo natural possui distribuição normal. Ou seja, se uma variável aleatória $Y$ for normalmente distribuído, então $X = e^Y$ possui distribuição log-normal.
Devido ao fato explicitado acima, para a construção do intervalo de tolerância para dados distribuídos segundo à Log Normal, toma-se o logaritmo natural dos dados, constrói-se o intervalo de acordo com a teoria explicitada na seção $\textbf{4.8.1}$ e, posteriormente, toma-se a exponencial dos intervalos obtidos.
Distribuição Exponencial
Uma variável aleatória $X$ possui distribuição exponencial com média $\lambda$ se a sua função de distribuição acumulada for do tipo: $$F_{X}(x ; \lambda)=1-e^{- \frac{x}{\lambda}}.$$
De acordo com as equações $4.8.1$ e $4.8.2$ as fórmulas para obtenção dos limites do intervalos de tolerância unilateral são: $$ L =\frac{2 n \hat{\lambda} \ln (1/P)}{\chi_{2 n ; 1-\alpha}^{2}}$$ $$ U =\frac{2 n \hat{\lambda} \ln (1/(1-P))}{\chi_{2 n ; \alpha}^{2}} $$
Em que:
- $\hat{\lambda}$: estimador de máxima verossimilhança de $\lambda$;
- n: tamanho amostral;
- P: proporção populacional;
- $\alpha$: nível de significância;
- $\chi_{2 n ; 1-\alpha}^{2}$: quantil $1 - \alpha$ da distribuição qui-quadrado com $2n$ graus de liberdade.
Intervalo de tolerância bilateral podem ser obtidos aproximadamente trocando $\alpha$ por $\alpha/2$ e $P$ por $(P+1)/2$.
Distribuição Logística
Uma variável aleatória $X$ possui distribuição logística se a sua função de distribuição acumulada for do tipo: $$ F_{X}(x ; \theta, \sigma)=\int_{t=-\infty}^{x}\left[1+e^{-\frac{\pi(t-\theta)}{\sqrt{3 \sigma}^{2}}}\right]^{-1} d t $$
Em que $-\infty < x < -\infty$, $-\infty < \theta < -\infty$ e $\sigma > 0$.
De acordo com $4.8.1,\ 4.8.2\ $ e $\ 4.8.3$ as fórmulas para encontrar $L$ e $U$, para dados que seguem a distribuição logística, são: $$ L =\hat{\theta}-k_{1} \hat{\sigma} $$ $$ U =\hat{\theta}+k_{2} \hat{\sigma} $$ Para limites unilaterais os valores de $k_1$ e $k_2$ são: $$ k_{1} \approx \frac{t_{1}+\sqrt{t_{1}^{2}-u v}}{v}$$ $$k_{2} \approx \frac{t_{2}+\sqrt{t_{2}^{2}-u v}}{v}$$
Tal que: $$t_{1} =F_{X}^{-1}(P ; \theta=0, \sigma=1)-\hat{\sigma}_{1,2} z_{1-\alpha}^{2}$$ $$t_{2} =F_{X}^{-1}(P ; \theta=0, \sigma=1)+\hat{\sigma}_{1,2} z_{1-\alpha}^{2}$$ $$u =\left[F_{X}^{-1}(P ; \theta=0, \sigma=1)\right]^{2}-\hat{\sigma}_{1}^{2} z_{1-\alpha}^{2}$$ $$v =1-\hat{\sigma}_{2}^{2} z_{1-\alpha}^{2}$$
Ainda, intervalo bilaterais podem ser obtidos substituindo $\alpha$ por $\alpha/2$ e $P$ por $(P+1)/2$.
Distribuição Gama
Uma variável aleatória $X$ possui distribuição gama se a sua função de distribuição acumulada for do tipo: $$ F_{X}(x ; \theta, \beta)=\int_{t=0}^{x} \frac{t^{\theta-1} e^{-t / \beta}}{\beta^{\theta} \Gamma(\theta)} d t. $$
Com $x > 0$, $\theta > 0$ e $\beta > 0$.
Conforme discutido em (Krishnamoorthy, 2008), se uma variável aleatória $X$ tem distribuição gama com parâmetros $\theta$ e $\beta$, então $X^{\frac{1}{3}}$ tem distribuição aproximadamente normal com parâmetros: $$ \mu =\frac{\beta^{1 / 3} \Gamma(\theta+1 / 3)}{\Gamma(\theta)},$$ $$\sigma^{2} =\frac{\beta^{2 / 3} \Gamma(\theta+2 / 3)}{\Gamma(\theta)}-\mu^{2}.$$
Para obter as estimativas dos mesmos, basta substituir $\theta$ e $\beta$ por suas respectivas estimativas. Sendo assim, os limites são obtidos com base no intervalo de tolerância para a distribuição normal: $$ L_{N}=\hat{\mu}-k \hat{\sigma} $$ $$ U_{N}=\hat{\mu}+k \hat{\sigma}.$$
O valor de $k$ é obtido conforme apresentados na seção $\textbf{4.8.1}$. E, posteriormente, é aplicado nesses limites a operação ao cubo para obter os limites do intervalo de tolerância para a distribuição gama. $$L=L_{N}^{3},$$ $$U=U_{N}^{3}$$
Distribuição Weibull
Uma variável aleatória $X$ possui distribuição Weibull se a sua função de distribuição acumulada for do tipo: $$ F_{X}(x ; \theta, \beta)=1-e^{-(x / \theta)^{\beta}}. $$
Em que $x > 0$, $\beta > 0$ e $\theta > 0$.
Ainda, toma-se uma variável aleatória que função de $X$, $Y = \ln(X)$. Então $Y$ tem distribuição de valor extremo, também conhecido como distribuição Gumbel para o mínimo, de tal forma que a sua distribuição acumulada é: $$ F_{Y}(y ; \xi, \delta)=1-\exp \left \lbrace -e^{\frac{y-\xi}{\delta}}\right \rbrace . $$
Onde $-\infty < y < \infty$, $- \infty < \xi = \ln(\theta) < \infty$ e $\delta = \beta^{-1} > 0$.
Isto posto, as equações para a obtenção do intervalo de tolerância unilateral para a distribuição de valores extremos para o mínimo é: $$ L=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right)}{\sqrt{n-1}},$$ $$U=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right)}{\sqrt{n-1}}. $$
Além disso, o intervalo unilateral para a distribuição Weibull é dado por: $$L_{W} =e^{L},$$ $$U_{W} =e^{U}.$$
Para encontrar intervalo bilaterais basta substituir $\alpha$ por $\alpha/2$ e $P$ por $(P + 1)/2$.
Distribuição Gumbel
Por fim, dentro das distribuições que este protocolo se propõe a descrever, tem-se a distribuição Gumbel para o máximo que possui distribuição acumulada como abaixo: $$ F_{Z}(z ; \xi, \delta)=1-\exp \left \lbrace -e^{-\left(\frac{z-\xi}{\delta}\right)}\right \rbrace , $$ com $-\infty< z <+\infty$, $-\infty< \xi <+\infty$ e $\delta > 0$.
Finalmente, para a distribuição Gumbel para o máximo os limites inferior e superior são dados por: $$ L=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right)}{\sqrt{n-1}},$$ $$ U=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right)}{\sqrt{n-1}}. $$
Para obter intervalos bilaterais aproximados basta substituir $\alpha$ por $\alpha/2$ e $P$ por $(P+1)/2$.
4.8.2 - Aplicações
Apresenta-se uma aplicação da metodologia de intervalo de tolerância.
Normal
Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.
| 29,52 | 37,22 | 18,44 | 32,47 | 29,96 | 36,73 | 35,24 | 31,97 | 34,99 | 29,04 |
| 41,83 | 24,53 | 24,71 | 24,05 | 32,10 | 25,22 | 23,35 | 47,82 | 37,37 | 18,04 |
| 42,66 | 24,29 | 24,47 | 32,41 | 39,01 | 13,82 | 25,39 | 20,30 | 27,77 | 8,87 |
Tabela 6.4.7: Dados provenientes de uma distribuição normal com média 30 e desvio padrão 9
Para esses dados tem-se:
- Média amostral: $\overline{x} = 29,1197$;
- Desvio padrão amostral: $s = 8,7690$.
Intervalo unilateral
Tem-se que $k$ é dados por: $$ k = \frac{1}{\sqrt{n}} t_{n-1 ; 1-\alpha}\left(z_{P} \sqrt{n}\right). $$
No caso:
- $n = 30$;
- $1/\sqrt{n} = 0,1825742$;
- $z_P = 1,281552$;
- $t_{n-1 ; 1-\alpha}\left(z_{P} \sqrt{n}\right) = 9,734831$.
Logo, $$ k = 0,1825742 \cdot 9,734831 = 1,777329. $$
Sendo, assim o intervalo de tolerância unilateral inferior é: $$IT_{100\cdot(1-\alpha) \char37 }[P] = [\overline{x} - k\cdot s ; \infty] $$ $$ IT_{95\char37}[90\char37] = [29,1197 - 1,777329 \cdot 8,7690 ; \infty] = [13,5343 ; \infty].$$
Enquanto que o superior é: $$IT_{100\cdot(1-\alpha)\char37}[P] = [-\infty ; \overline{x} + k\cdot s] $$ $$IT_{95\char37}[90\char37] = [-\infty ; 29,1197 + 1,777329 \cdot 8,7690] = [-\infty ; 44,7051].$$
Com o Action Stat tem-se os seguintes resultados:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 13.5342207 | 44.7051126 |
Tabela 6.4.8: Resultados do Intervalo unilateral de Tolerância (de distribuição normal) com a Action Stat
Intervalo bilateral
No caso bilateral, tem-se que $k$ é dados por: $$ k = z_{\frac{1+P}{2}} \sqrt{1+n^{-1}} \cdot \sqrt{\frac{n-1}{\chi_{n-1 ; \alpha}^{2}}} \cdot \sqrt{1+\frac{n-3-\chi_{n-1 ; \alpha}^{2}}{2(n+1)^{2}}}. $$
No caso:
- $P = 0,9$;
- $n = 30$;
- $\alpha = 0,05$;
- $z_{\frac{1+P}{2}} = 1,644854$;
- $\sqrt{1+n^{-1}} = 1,01653$;
- $\chi_{n-1 ; \alpha}^{2} = 17,70837$;
- $\sqrt{\frac{n-1}{\chi_{n-1 ; \alpha}^{2}}} = 1,279705$;
- $\sqrt{1+\frac{n-3-\chi_{n-1 ; \alpha}^{2}}{2(n+1)^{2}}} = 1,002414$.
Logo, $$ k = 1,644854 \cdot 1,01653 \cdot 1,279705 \cdot 1,002414 = 2,144888 $$
E, consequentemente, o intervalo de tolerância é: $$IT_{100\cdot(1-\alpha)\char37}[P] = [\overline{x} - k\cdot s ; \overline{x} - k\cdot s] $$ $$IT_{95\char37}[90\char37] = [29,1197 - 2,144888 \cdot 8,7690 ; 29,1197 + 2,144888 \cdot 8,7690]$$ $$IT_{95\char37}[90\char37] = [10,3112 ; 47,9282]$$
Com o Action Stat tem-se os seguintes resultados:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 10.3111 | 47.9282 |
Tabela 6.4.9: Resultados do Intervalo bilateral de Tolerância (de distribuição normal) com a Action Stat
Log Normal
Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.
| 6612612988005,81 | 27847248463,48 | 106349853386,77 |
| 1467365074548577024,00 | 118982792768420,97 | 76629252025051,09 |
| 3365135824271395840,00 | 10267451919698,46 | 586087048871485505536,00 |
| 14602950613189902,00 | 87267567199064,16 | 654904512,15 |
| 45003225413,33 | 87463678566640976,00 | 1570232354786859,25 |
| 35400790947,99 | 8946152978611619,00 | 16966208067273982,00 |
| 101950708,05 | 89723629552,60 | 1149099835437,40 |
| 53878642861,33 | 1004499,53 | 4091775093419,58 |
| 42382441591,17 | 2016218253651770,50 | 68339603,31 |
| 126340277771542,59 | 13828534337,99 | 7115,28 |
Tabela 6.4.10: Dados provenientes de uma distribuição Log normal
Para esses dados, tomamos o logaritmo natural e construímos o intervalo com base na distribuição normal, conforme descrito na seção 4.8.1 deste protocolo estatístico.
Ao tomar a exponencial dos dados, chega-se nos mesmos valores presentes na Tabela 6.4.21, que são normalmente distribuídos. Sendo assim, basta calcular o intervalo para os dados com distribuição normal e, posteriormente, aplicar a função exponencial.
Intervalo unilateral
Sendo, assim o intervalo de tolerância unilateral inferior é:
$$IT_{100\cdot(1-\alpha)\char37}[P] = [\exp \lbrace 13,53422 \rbrace ; \infty]$$ $$IT_{95\char37}[90\char37] = [754809 ; \infty].$$
Enquanto que o superior é:
$$IT_{100\cdot(1-\alpha)\char37}[P] = [ -\infty ; \exp \lbrace 44,70511 \rbrace ]$$ $$IT_{95\char37}[90\char37] = [-\infty ; 2,601253 \cdot 10^{19}].$$
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 754809.5123 | 26012597896719430000 |
Tabela 6.4.11: Resultados do Intervalo bilateral de Tolerância (de distribuição normal) com a Action Stat
Intervalo bilateral
No caso bilateral, tem-se que: $$ IT_{100\cdot(1-\alpha)\char37}[P] = [\exp \lbrace 10,31109 \rbrace ; \exp \lbrace 47,92824 \rbrace ]$$ $$IT_{95\char37}[90\char37] = [30064,19 ; 6,530857 \cdot 10^{20}].$$
No Action Stat, tem-se:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 30064.2008 | 653087585678552900000 |
Tabela 6.4.12: Resultados do Intervalo unilateral de Tolerância (de distribuição normal) com a Action Stat
Exponencial
Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.
| 3,25 | 0,57 | 0,16 | 4,08 | 3,77 | 1,12 | 3,88 | 1,39 | 1,32 | 0,83 |
| 1,48 | 0,57 | 0,10 | 0,84 | 1,21 | 0,13 | 0,30 | 0,30 | 6,40 | 1,20 |
| 2,33 | 0,25 | 3,75 | 1,21 | 1,01 | 0,54 | 3,10 | 0,38 | 0,22 | 0,16 |
| 3,61 | 0,60 | 3,77 | 2,87 | 0,47 | 3,47 | 3,11 | 3,81 | 0,30 | 17,72 |
Tabela 6.4.13: Dados provenientes de uma distribuição exponencial com média 2
Para esses dados temos $\widehat{\lambda} = 2,1395$.
Intervalo unilateral
Para o intervalo de tolerância unilateral da distribuição exponencial temos:
$$L =\frac{2 n \hat{\lambda} \ln (1/P)}{\chi_{2 n ; 1-\alpha}^{2}}$$ $$U =\frac{2 n \hat{\lambda} \ln (1/(1-P))}{\chi_{2 n ; \alpha}^{2}}$$
No caso:
- $n = 40$;
- $\widehat{\lambda} = 2,1395$;
- $P = 0,90$;
- $\alpha = 0,05$;
- $\chi_{2 n ; 1-\alpha}^{2} = 101,8795$;
- $\chi_{2 n ; \alpha}^{2} = 60,39148$.
Logo, $$L =\frac{2 \cdot 40 \cdot 2,1395 \cdot \ln (1/0,9)}{101,8795} = 0,1770082$$ $$U =\frac{2 \cdot 40 \cdot 2,1395 \cdot \ln (1/(1-0,9))}{60,39148} = 6,525928$$
Sendo, assim o intervalo de tolerância unilateral inferior é: $$IT_{95\char37}[90\char37] = [0,1770082 ; \infty]$$
Resultados:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 0.177 | 6.5259 |
Tabela 6.4.14: Resultados do Intervalo unilateral de Tolerância (de distribuição exponencial) com a Action Stat
Intervalo bilateral
Para o intervalo de tolerância bilateral da distribuição exponencial temos: $$L =\frac{2 n \hat{\lambda} \ln (2/(1+P))}{\chi_{2 n ; 1-\alpha/2}^{2}}$$ $$U =\frac{2 n \hat{\lambda} \ln (2/(1-P))}{\chi_{2 n ; \alpha/2}^{2}}$$
No caso:
- $n = 40$;
- $\widehat{\lambda} = 2,1395$;
- $P = 0,90$;
- $\alpha = 0,05$;
- $\chi_{2 n ; 1-\alpha/2}^{2} = 106,6286$;
- $\chi_{2 n ; \alpha/2}^{2} = 57,15317$.
Sendo assim, $$L =\frac{2 \cdot 40 \cdot 2,1395 \cdot \ln (2/(1+0,9))}{106,6286} = 0,0823359$$ $$U =\frac{2 \cdot 40 \cdot 2,1395 \cdot \ln (2/(1-0,9))}{57,15317} = 8,971498$$
Portanto, o intervalo de tolerância bilateral é: $$IT_{95\char37}[90\char37] = [0,0823359 ; 8,971498].$$
Resultados:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 0.0823 | 8.9715 |
Tabela 6.4.15: Resultados do Intervalo bilateral de Tolerância (de distribuição exponencial) com a Action Stat
Logística
Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.
| 13,65 | 18,29 | 8,02 | 23,67 | 7,19 | 31,77 | 17,06 | 12,30 | 4,45 | 11,26 |
| 12,13 | 12,76 | 27,56 | 16,44 | 18,30 | 7,98 | 15,64 | 18,94 | 14,63 | 18,97 |
| 2,36 | 14,21 | 5,87 | 8,19 | 11,45 | 11,62 | 4,81 | 16,50 | 15,53 | 10,35 |
| 21,15 | 12,51 | 10,32 | 6,28 | 21,40 | 13,44 | 25,93 | 12,94 | 8,26 | 7,17 |
| 18,61 | 10,65 | 16,08 | 19,27 | 15,99 | 11,34 | 33,83 | 18,54 | 3,73 | 18,72 |
Tabela 6.4.16: Dados provenientes de uma distribuição logística com parâmetro de locação igual a 15 e de escala igual a 4
Para esses dados tem-se:
- $\widehat{\theta} = 13,96957$;
- $\widehat{\sigma} = 6,829025$;
- $\widehat{\sigma}^2_1 = 0,8545755$;
- $\widehat{\sigma}^2_2 = 0,1973863$;
- $\widehat{\sigma}_{1,2} = 0,01130623$.
Intervalo unilateral
O intervalo de tolerância é dado por: $$L =\hat{\theta}-k_{1} \hat{\sigma}$$ $$U =\hat{\theta}+k_{2} \hat{\sigma}$$
Para limites unilaterais os valores de $k_1$ e $k_2$ são: $$k_{1} \approx \frac{t_{1}+\sqrt{t_{1}^{2}-u v}}{v}$$ $$k_{2} \approx \frac{t_{2}+\sqrt{t_{2}^{2}-u v}}{v} $$
Tal que: $$ t_{1} =F_{X}^{-1}(P ; \theta=0, \sigma=1)-\hat{\sigma}_{1,2} z_{1-\alpha}^{2}$$ $$t_{2} =F_{X}^{-1}(P ; \theta=0, \sigma=1)+\hat{\sigma}_{1,2} z_{1-\alpha}^{2}$$ $$u =\left[F_{X}^{-1}(P ; \theta=0, \sigma=1)\right]^{2}-\hat{\sigma}_{1}^{2} z_{1-\alpha}^{2}$$ $$v =1-\hat{\sigma}_{2}^{2} z_{1-\alpha}^{2} $$
No caso, tem-se:
- $n = 50$;
- $\alpha = 5\char37$;
- $P = 90\char37$;
- $z_{1-\alpha}^{2} = 2,705543$;
- $F_{X}^{-1}(P ; \theta=0, \sigma=1) = 1,211393$;
- $t_1 = 1,211393 - 0,01130623 \cdot 2,705543 = 1,180804$;
- $t_2 = 1,211393 + 0,01130623 \cdot 2,705543 = 1,241982$;
- $u = 1,211393^2 - 0,8545755 \cdot 2,705543 = -0,8446178$;
- $v = 1 - 0,1973863 \cdot 2,705543 = 0,4659629$.
Ficando, $$k_{1} \approx \frac{1,180804+\sqrt{1,180804^{2}-(-0,8446178) \cdots 0,4659629}}{0,4659629} = 5,403676$$ $$k_{2} \approx \frac{1,241982+\sqrt{1,241982^{2}-(-0,8446178) \cdot 0,4659629}}{0,4659629} = 5,651551.$$
Finalmente, o intervalo de tolerância unilateral inferior fica: $$IT_{95\char37}[90\char37] = [13,96957 - 5,403676 \cdot 6,829025 ; \infty]= [-22,93227 ; \infty].$$
Enquanto que o intervalo superior fica: $$IT_{95\char37}[90\char37] = [ -\infty ; 13,96957 + 5,651554 \cdot 6,829025] = [-\infty ; 52,56417].$$
Intervalo bilateral
Tem-se agora um exemplo de intervalo bilateral. O intervalo de tolerância bilateral é dado por: $$L =\hat{\theta}-k_{1} \hat{\sigma}$$ $$U =\hat{\theta}+k_{2} \hat{\sigma}$$
Para limites bilaterais os valores de $k_1$ e $k_2$ são: $$k_{1} \approx \frac{t_{1}+\sqrt{t_{1}^{2}-u v}}{v}$$ $$k_{2} \approx \frac{t_{2}+\sqrt{t_{2}^{2}-u v}}{v}$$
Tal que: $$t_{1} =F_{X}^{-1}((P+1)/2 ; \theta=0, \sigma=1)-\hat{\sigma}_{1,2} z_{1-\alpha/2}^{2}$$ $$t_{2} =F_{X}^{-1}((P+1)/2 ; \theta=0, \sigma=1)+\hat{\sigma}_{1,2} z_{1-\alpha/2}^{2}$$ $$u =\left[F_{X}^{-1}((P+1)/2 ; \theta=0, \sigma=1)\right]^{2}-\hat{\sigma}_{1}^{2} z_{1-\alpha/2}^{2}$$ $$v =1-\hat{\sigma}_{2}^{2} z_{1-\alpha/2}^{2}$$
No caso, tem-se:
- $n = 50$;
- $\alpha = 5\char37$;
- $P = 90\char37$;
- $z_{1-\alpha/2}^{2} = 3,841459$;
- $F_{X}^{-1}((P+1)/2 ; \theta=0, \sigma=1) = 1,623354$;
- $t_1 = 1,623354 - 0,01130623 \cdot 3,841459 = 1,579922$;
- $t_2 = 1,623354 + 0,01130623 \cdot 3,841459 = 1,666786$;
- $u = 1,623354^2 - 0,8545755 \cdot 3,841459 = -0,6475385$;
- $v = 1 - 0,1973863 \cdot 3,841459 = 0,2417486$.
Ficando, $$k_{1} \approx \frac{1,579922+\sqrt{1,579922^{2}-(-0,6475385) \cdot 0,2417486}}{0,2417486} = 13,2726$$ $$k_{2} \approx \frac{1,666786+\sqrt{1,666786^{2}-(-0,6475385) \cdot 0,2417486}}{0,2417486} = 13,9810.$$
Finalmente, o intervalo de tolerância unilateral inferior fica:
$$IT_{95\char37}[90\char37] = [13,96957 - 13,2726 \cdot 6,829025 ; 13,96957 + 13,9810 \cdot 6,829025]$$ $$IT_{95\char37}[90\char37] = [-76,66935 ; 109,4462].$$
Gama
Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.
| 9,34 | 5,29 | 6,15 | 12,18 | 9,23 | 4,48 | 40,14 | 25,35 | 10,67 | 6,86 |
| 11,46 | 12,73 | 1,17 | 18,66 | 8,55 | 3,17 | 23,45 | 2,64 | 22,09 | 24,71 |
| 10,04 | 11,87 | 32,86 | 4,80 | 19,68 | 13,18 | 10,10 | 9,79 | 6,25 | 3,55 |
| 4,61 | 23,75 | 3,54 | 2,43 | 18,18 | 15,23 | 4,76 | 44,95 | 14,05 | 24,31 |
| 29,62 | 13,50 | 13,70 | 20,37 | 6,95 | 4,62 | 14,84 | 11,16 | 2,91 | 4,93 |
Tabela 4.9: Dados provenientes de uma distribuição gama com parâmetro de forma igual a 2 e de escala igual a 7
Para esses dados, as estimativas são obtidos via métodos de otimização. No caso tem-se:
- $\widehat{\theta} = 1,892514$;
- $\widehat{\beta} = 6,96269$.
Ainda, $$\widehat{\mu} =\frac{6,96269^{1 / 3} \Gamma(1,892514+1 / 3)}{\Gamma(1,892514)} = 2,224858,$$ $$\widehat{\sigma}^{2} =\frac{6,96269^{2 / 3} \Gamma(1,892514+2 / 3)}{\Gamma(1,892514)}-2,224858^{2} =0,3224228.$$
Intervalo unilateral
Conforme apresentado em \ref{gamma_dist}, utiliza-se a aproximação normal para obter o valor de $k$, então: $$k = \frac{1}{\sqrt{n}} t_{n-1 ; 1-\alpha}\left(z_{P} \sqrt{n}\right).$$
No caso:
- $n = 50$;
- $1/\sqrt{n} = 0,1414214$;
- $z_P = 1,281552$;
- $t_{n-1 ; 1-\alpha}\left(z_{P} \sqrt{n}\right) = 11,6359$.
Logo, $$k = 0,1414214 \cdot 11,6359 = 1,645565.$$
Sendo, assim o intervalo de tolerância unilateral inferior é: $$IT_{100\cdot(1-\alpha)\char37}[P] = [ \left \lbrace \widehat{\mu} - k\cdot \sqrt{\widehat{\sigma}^2} \right \rbrace ^3 ; +\infty]$$ $$IT_{95\char37}[90\char37] = [\left \lbrace 2,224858 - 1,645565 \cdot \sqrt{0,3224228} \right \rbrace ^3 ; +\infty]$$ $$IT_{95\char37}[90\char37] = [2.1786 ; +\infty].$$
Enquanto que o superior é:
$$IT_{100\cdot(1-\alpha)\char37}[P] = [-\infty ; \left \lbrace \widehat{\mu} + k\cdot \sqrt{\widehat{\sigma}^2} \right \rbrace ^3]$$ $$IT_{95\char37}[90\char37] = [-\infty ; \left \lbrace 2,224858 + 1,645565 \cdot \sqrt{0,3224228} \right \rbrace ^3 ]$$ $$IT_{95\char37}[90\char37] = [-\infty ; 31.9613].$$
Resultados:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 2.1786 | 31.9618 |
Tabela 6.4.17: Resultados do Intervalo unilateral de Tolerância (de distribuição gama) com a Action Stat
Intervalo bilateral
No caso bilateral, tem-se que $k$ é dados por: $$k = z_{\frac{1+P}{2}} \sqrt{1+n^{-1}} \cdot \sqrt{\frac{n-1}{\chi_{n-1 ; \alpha}^{2}}} \cdot \sqrt{1+\frac{n-3-\chi_{n-1 ; \alpha}^{2}}{2(n+1)^{2}}}.$$
No caso:
- $P = 0,9$;
- $n = 50$;
- $\alpha = 0,05$;
- $z_{\frac{1+P}{2}} = 1,644854$;
- $\sqrt{1+n^{-1}} = 1,00995$;
- $\chi_{n-1 ; \alpha}^{2} = 33,93031$;
- $\sqrt{\frac{n-1}{\chi_{n-1 ; \alpha}^{2}}} = 1,201722$;
- $\sqrt{1+\frac{n-3-\chi_{n-1 ; \alpha}^{2}}{2(n+1)^{2}}} = 1,001255$.
Logo, $$k = 1,644854 \cdot 1,00995 \cdot 1,201722 \cdot 1,001255 = 1,998832.$$
Assim, o intervalo de tolerância bilateral é:
$$IT_{100\cdot(1-\alpha)\char37}[P] = \left[\left \lbrace \widehat{\mu} - k\cdot \sqrt{\widehat{\sigma}^2} \right \rbrace ^3 ; \left \lbrace \widehat{\mu} + k\cdot \sqrt{\widehat{\sigma}^2} \right \rbrace ^3 \right]$$ $$IT_{95\char37}[90\char37] = \left[\left \lbrace 2,224858 - 1,998832\cdot \sqrt{0,3224228} \right \rbrace ^3\right. ; \left. \left \lbrace 2,224858 + 1,998832\cdot \sqrt{0,3224228} \right \rbrace ^3 \right]$$ $$IT_{95\char37}[90\char37] = \left[ 1,095213^3 ; 3.374694^3 \right] = [1,3137; 38,433].$$
Resultados:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 1.3137 | 38.4329 |
Tabela 6.4.18: Resultados do Intervalo bilateral de Tolerância (de distribuição gama) com a Action Stat
Weibull
Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.
| 8,52 | 6,82 | 4,28 | 7,21 | 3,54 | 7,39 | 4,69 | 7,74 | 7,50 | 7,94 |
| 5,19 | 9,01 | 7,55 | 5,55 | 5,50 | 6,29 | 8,06 | 6,65 | 5,55 | 7,02 |
| 8,07 | 7,78 | 6,91 | 6,56 | 6,24 | 6,91 | 7,93 | 7,33 | 6,58 | 9,64 |
| 5,85 | 9,18 | 4,01 | 6,74 | 4,48 | 9,26 | 7,20 | 7,56 | 5,47 | 6,92 |
| 9,43 | 4,15 | 7,77 | 7,63 | 7,19 | 8,73 | 7,90 | 8,71 | 6,17 | 6,57 |
Tabela 4.10: Dados da distribuição Weibull com forma igual a 5 e escala igual a 8
Para esses dados tem-se as seguintes estimativas de máximo verossimilhança.
- $\widehat{\beta}: 5,580786$ (forma);
- $\widehat{\theta}: 7,516806$ (escala).
Intervalo unilateral
Os limites do intervalo são dados por: $$L=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right)}{\sqrt{n-1}},$$ $$U=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right)}{\sqrt{n-1}}.$$
Em que:
- $\widehat{\xi} = \ln(\widehat{\theta}) = 2,017141$;
- $\widehat{\delta} = \widehat{\beta}^{-1} = 0,1791862$;
- $t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right) = 19,60841$;
- $t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right) = -8,04657$.
Portanto, $$L=2,017141-\frac{0,1791862 \cdot 19,60841}{7} = 1,515204,$$ $$U=2,017141-\frac{0,1791862 \cdot (-8,04657)}{7} = 2,223117.$$
Sendo o intervalo de tolerância unilateral inferior como abaixo: $$IT_{95\char37}[90\char37] = \left[\exp(1,515204) ; \infty \right] = [4,550349 ; \infty].$$
Em seguida tem-se o superior:
$$IT_{95\char37}[90\char37] = \left[0 ; \exp(2,223117) \right] = [0 ; 9,236075].$$
Resultados:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 4.5504 | 9.2361 |
Tabela 6.4.19: Resultados do Intervalo unilateral de Tolerância (de distribuição Weibull) com a Action Stat
Intervalo bilateral
Os limites do intervalo são dados por: $$L=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; 1-\alpha/2}^{*}\left(-\sqrt{n} \lambda_{(P+1)/2}\right)}{\sqrt{n-1}},$$ $$U=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; \alpha/2}^{*}\left(-\sqrt{n} \lambda_{(1-P)/2}\right)}{\sqrt{n-1}}.$$
Em que:
- $\widehat{\xi} = \ln(\widehat{\theta}) = 2,017141$;
- $\widehat{\delta} = \widehat{\beta}^{-1} = 0,1791862$;
- $t_{n-1 ; 1-\alpha/2}^{*}\left(-\sqrt{n} \lambda_{(P+1)/2}\right) = 26,63338$;
- $t_{n-1 ; \alpha/2}^{*}\left(-\sqrt{n} \lambda_{(1-P)/2}\right) = -10,66064$.
Portanto, $$L=2,017141-\frac{0,1791862 \cdot 26,63338}{7} = 1,335379,$$ $$U=2,017141-\frac{0,1791862 \cdot (-10,66064)}{7} = 2,290032.$$
O intervalo de tolerância bilateral é: $$IT_{95\char37}[90\char37] = \left[ \exp(1,335379) ; \exp(2,290032) \right] = [3,801436 ; 9,875254].$$
Resultados:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 3.8014 | 9.8753 |
Tabela 6.4.20: Resultados do Intervalo unilateral de Tolerância (de distribuição Weibull) com a Action Stat
Gumbel
A distribuição Gumbel é uma distribuição para valores extremos. No caso do Action ela é uma distribuição para o máximo.
Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.
| 14,24 | 15,86 | 11,71 | 13,93 | 16,53 | 9,36 | 8,21 | 8,82 | 5,53 | 9,46 |
| 17,28 | 11,55 | 8,94 | 12,53 | 8,13 | 13,60 | 7,41 | 11,91 | 4,32 | 8,47 |
| 6,25 | 8,28 | 8,70 | 9,96 | 10,54 | 22,52 | 18,98 | 8,38 | 9,02 | 9,36 |
| 4,84 | 5,61 | 12,79 | 8,66 | 5,45 | 24,50 | 2,49 | 7,98 | 7,64 | 21,04 |
| 4,56 | 12,75 | 11,69 | 9,44 | 4,28 | 13,70 | 12,29 | 14,38 | 8,33 | 22,78 |
Tabela 6.4.21: Dados provenientes da distribuição Gumbel com parâmetro de locação igual a 9 e de escala igual a 4
Para esses dados os estimadores de máxima verossimilhança são:
- $\hat{\xi} = 8,643191$;
- $\hat{\delta} = 3,878154$.
Intervalo unilateral
O intervalo de tolerância para a distribuição Gumbel é dado por $$L=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right)}{\sqrt{n-1}},$$ $$U=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right)}{\sqrt{n-1}}.$$
Em que:
- $n = 50$;
- $\sqrt{n - 1} = \sqrt{50 - 1} = 7$;
- $P = 0,90$;
- $\lambda_{1 - P} = \ln(-\ln(1 - 0,90)) = 0,8340324$;
- $\lambda_{P} = \ln(-\ln(0,90)) = -2,250367$;
- $\alpha = 0,05$;
- $t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right) = -8,04657$;
- $t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right) = 19,60841$.
Assim, $$L=8,643191+\frac{3,878154 \cdot -8,04657}{7} = 4,185214,$$ $$U=8,643191+\frac{3,878154 \cdot 19,60841}{7} = 19,50668.$$
O intervalo de tolerância unilateral inferior é:
$$IT_{95\char37}[90\char37] = \left[4,185214 ; \infty \right].$$
Em seguida, tem-se o superior:
$$IT_{95\char37}[90\char37] = [0 ; 19,50668].$$
Resultados:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 4.1852 | 19.5067 |
Tabela 6.4.22: Resultados do Intervalo unilateral de Tolerância (de distribuição Gumbel) com a Action Stat
O intervalo de tolerância bilateral para a distribuição Gumbel é dado por $$L=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; \alpha/2}^{*}\left(-\sqrt{n} \lambda_{(1-P)/2}\right)}{\sqrt{n-1}},$$ $$U=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; 1-\alpha/2}^{*}\left(-\sqrt{n} \lambda_{(1 + P)/2}\right)}{\sqrt{n-1}}.$$
Em que:
- $n = 50$;
- $\sqrt{n - 1} = \sqrt{50 - 1} = 7$;
- $P = 0,90$;
- $\lambda_{(1 - P)/2} = \ln(-\ln((1 - 0,90)/2)) = 1,097189$;
- $\lambda_{(1 + P)/2} = \ln(-\ln((1 + 0,90)/2)) = -2,970195$;
- $t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{(1-P)/2}\right) = -10,66064$;
- $t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{(1+P)/2}\right) = 26,63338$.
Assim, $$L=8,643191+\frac{3,878154 \cdot -10,66064}{7} = 2,736962,$$ $$U=8,643191+\frac{3,878154 \cdot 26,63338}{7} = 23,39867.$$
O intervalo de tolerância bilateral é: $$IT_{95\char37}[90\char37] = \left[2,736962 ; 23,39867 \right].$$
Resultados:
| Nível de significância | Proporção populacional | Limite inferior | Limite Superior |
|---|---|---|---|
| 0.05 | 0.9 | 2.737 | 23.3987 |
Tabela 6.4.23: Resultados do Intervalo bilateral de Tolerância (de distribuição Gumbel) com a Action Stat