6.4 Intervalo de Confiança

4.1 - Intervalo de confiança

Um intervalo de confiança (IC) é um intervalo estimado de um parâmetro de interesse de uma população. Em vez de estimar o parâmetro por um único valor, é dado um intervalo de estimativas prováveis. O quanto estas estimativas são prováveis será determinado pelo coeficiente de confiança $(1-\alpha)$, para $\alpha \in (0, 1)$.

Intervalos de confiança são usados para indicar a confiabilidade de uma estimativa. Por exemplo, um IC pode ser usado para descrever o quanto os resultados de uma pesquisa são confiáveis. Sendo todas as estimativas iguais, uma pesquisa que resulte num IC pequeno é mais confiável do que uma que resulte num IC maior.

Se $U$ e $V$ são estatísticas (isto é, funções da amostra) cuja distribuição de probabilidade dependa do parâmetro $\theta$, e

$$\mathbb{P}(U \ < \ \theta \ < \ V \ | \ \theta) = 1-\alpha$$

então o intervalo aleatório $(U,V)$ é um intervalo de confiança com nível $100(1-\alpha)\char37$ para $\theta$. Portanto, podemos interpretar o intervalo de confiança como um intervalo que contém os valores “plausíveis” que o parâmetro $\theta$ pode assumir. Assim, a amplitude do intervalo está associada a incerteza que temos a respeito do parâmetro.

Considere $X_1,X_2,\ldots,X_n$ uma amostra aleatória retirada de uma população com distribuição $f_{\theta}$ que depende do parâmetro $\theta$. Por exemplo, tomamos $X_1,X_2,\ldots,X_n$ uma amostra aleatória com distribuição normal com média $\mu$ desconhecida e desvio padrão conhecido $\sigma = 1$. Para propormos um intervalo de confiança para o parâmetro $\theta$, vamos introduzir o conceito de quantidade pivotal. Uma função $Q$ da amostra $(X_1,X_2,\ldots,X_n)$ e do parâmetro $\theta$ cuja distribuição de probabilidade não depende do parâmetro $\theta$ é denominada quantidade pivotal. Desta forma, dado o nível de confiança $1-\alpha$, tomamos

$$1-\alpha=\mathbb{P}\left(q_1\leq Q(X_1,X_2,\ldots,X_n;\theta)\leq q_2\right)$$

Se a quantidade pivotal $Q$ for inversível, podemos resolver a inequação acima em relação a $\theta$ e obter um intervalo de confiança.

Motivação

Suponha que queiramos estimar a média $\mu$ de uma população com distribuição normal com variância $\sigma^2$ conhecida. O estimador de máxima verossimilhança para a média populacional $\mu$ é dado pela média amostral $\overline{X}$ de uma amostra de tamanho $n$. Assim, temos a seguinte quantidade pivotal $e=(\overline{X}-\mu)\sim N(0,\sigma^2/n)$.

$$\mathbb{P}\left(|e| \ < \ 1,96\ \sigma/\sqrt{n}\right)=0,95$$

$$\mathbb{P}\left(|\overline{X}-\mu| \ < \ 1,96\ \sigma/\sqrt{n}\right)=0,95$$

$$\mathbb{P}\left(\overline{X}-1,96\ \sigma/\sqrt{n} \ < \ \mu \ < \ \overline{X}+1,96\ \sigma/\sqrt{n}\right)=0,95.$$

Para interpretar o intervalo de confiança da média, assumimos que os valores foram amostrados de forma independente e aleatória de um população com distribuição normal com média $\mu$ e variância $\sigma^2$. Dado que estas suposições são válidas, temos 95% de “chance” do intervalo conter o verdadeiro valor da média populacional. Em outras palavras, se produzirmos diversos intervalos de confiança provenientes de diferentes amostras independentes de mesmo tamanho, podemos esperar que aproximadamente 95% destes intervalos devem conter o verdadeiro valor da média populacional.

Figura6.4.1.svg

Figura 6.4.1: Respresentação de Intervalo de confiança com 95% de confiança

4.2 - Intervalo de confiança para média

Quando queremos estimar a média de uma população através de uma amostra temos dois casos distintos a considerar: quando a variância da população é conhecida e quando ela é desconhecida. A seguir, temos os dois casos.

4.2.1 - Variância conhecida

Consideremos uma amostra aleatória simples $X_1,\ldots,X_n$ obtida de uma população com distribuição normal, com média $\mu$ e variância $\sigma^2$ conhecida. Desta forma, a distribuição amostral da média também é Normal com média $\mu$ e variância $\sigma^2/n$, ou seja, $$\overline{X}\sim N\left(\mu,\frac{\sigma^2}{n}\right).$$

Assim, temos que

$$Z=\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1),$$

isto é, a variável $Z$ tem distribuição normal padronizada.

Consideremos que a probabilidade da variável $Z$ tomar valores entre $-Z_{\alpha/2}$ e $Z_{\alpha/2}$ é $1-\alpha$. Os valores $-Z_{\alpha/2}$ e $Z_{\alpha/2}$ são obtidos na tabela da distribuição normal conforme mostra a Figura 6.4.2 a seguir:

Figura6.4.2.svg

Figura 6.4.2 : Representação do intervalo de confiança de $1-\alpha$ entre $-Z_{\alpha/2}$ e $Z_{\alpha/2}$

Então, temos que

$$\mathbb{P}[-Z_{\alpha/2}\leq Z\leq Z_{\alpha/2}]= 1-\alpha$$

ou seja,

$$\mathbb{P}\left[-Z_{\alpha/2}\leq \frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\leq Z_{\alpha/2}\right]=(1-\alpha)$$

o que implica que

$$\mathbb{P}\left[\overline{X}-Z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\leq\mu\leq\overline{X} +Z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right]=1-\alpha.$$

Com isso, o intervalo de confiança da média é dado por

$$IC(\mu,1-\alpha)=\left(\overline{X}-Z_{\alpha/2}\frac{\sigma}{\sqrt{n}};\overline{X}+ Z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right).$$

Caso os dados não tenham distribuição normal, podemos aplicar o teorema central do limite e construir um intervalo de confiança aproximado.

Interpretação

Podemos afirmar que, se pudermos repetir muitas vezes o experimento e coletarmos os dados, aproximadamente em $100(1-\alpha)\char37$ das vezes a média populacional estará no intervalo encontrado.

Exemplo 4.2.1.1

O projetista de uma indústria tomou uma amostra de 36 funcionários para verificar o tempo médio gasto para montar um determinado brinquedo. Lembrando que foi verificado que $\overline{x}= 19,9$ e $\sigma = 5,73$, construir um intervalo de confiança de nível $95\char37$ para $\mu$.

Na tabela da distribuição normal padronizada, obtemos que $Z_{0,025}=1,96$. Substituindo $\overline{x}=19,9, n=36, \sigma=5,73$ e $Z_{0,025}=1,96$ na fórmula para o intervalo de confiança, temos

$$19,9-1,96\frac{5,73}{\sqrt{36}}\leq\mu\leq 19,9+1,96\frac{5,73}{\sqrt{36}}$$

e, portanto,

$$IC(\mu,0,95) = (18,02; \ 21,77)$$

Uma das principais interpretações do intervalo de confiança consiste em avaliar a incerteza que temos a respeito de estimarmos o parâmetro populacional $\mu$ a partir de uma amostra aleatória de tamanho $n$.

4.2.2 - Variânca desconhecida

Tendo os conceitos básicos sobre intervalos de confiança, vamos agora tratar uma situação mais realista: quando a variância $\sigma^2$ da população é desconhecida.

Consideremos uma amostra aleatória simples $X_1,X_2,\ldots,X_n$, obtida de uma população com distribuição normal, com média $\mu$ e variância $\sigma^2$ desconhecidas. Como neste caso a variância é desconhecida, utilizaremos a variância amostral $s^2$ no lugar de $\sigma^2$. Assim, temos que

$$T=\frac{\overline{X}-\mu}{s/\sqrt{n}}\sim t_{(n-1)}$$

ou seja, a variável $T$ tem distribuição t de Student com $n-1$ graus de liberdade.

Então, ao fixarmos o nível de significância $\alpha$, obtemos da Tabela da distribuição t de Student com $n-1$ graus de liberdade, o valor $t_{((n-1),\alpha/2)}$, que satisfaz

$$\mathbb{P}\left(-t_{((n-1),\alpha/2)}\leq T\leq t_{((n-1),\alpha/2)}\right)=1-\alpha$$

ou graficamente

Figura6.4.3.svg

Figura 6.4.3 : Representação do intervalo de confiança de $1-\alpha$ entre $-t_{n-1,\alpha/2}$ e $t_{n-1,\alpha/2}$

Analogamente ao caso anterior, obtemos que

$$\mathbb{P}\left(-t_{((n-1),\alpha/2)}\leq \frac{\overline{X}-\mu}{s/\sqrt{n}}\leq t_{((n-1),\alpha/2)}\right)=1-\alpha$$

ou seja, $$\mathbb{P}\left(\overline{X}-t_{((n-1),\alpha/2)}\frac{s}{\sqrt{n}}\leq\mu\leq \overline{X}+t_{((n-1),\alpha/2)}\frac{s}{\sqrt{n}}\right)=1-\alpha.$$

Logo, o intervalo com $100(1-\alpha)\char37$ de confiança para $\mu$, com variância desconhecida, será dado por

$$IC(\mu,1-\alpha)=\left(\overline{X}-t_{\alpha/2}\frac{s}{\sqrt{n}};\overline{X}+t_{\alpha/2}\frac{s}{\sqrt{n}}\right).$$

Exemplo 4.2.2.1

Consideremos que o projetista de uma indústria tomou uma amostra de 36 funcionários para verificar o tempo médio gasto para montar um determinado brinquedo. Os tempos estão colocados na Tabela 6.4.1 a seguir. Dado que o projetista não tem conhecimento da variabilidade da população, construir um intervalo de confiança com $(1-\alpha) = 0,95$ para a média $\mu$.

17,1000 16,8930 14,6004 13,0053
29,6292 19,2500 17,7504 24,6337
29,3567 25,0798 16,7914 29,4087
23,8807 15,2133 19,1536 30,3199
13,0050 24,6795 29,3308 20,7309
16,4541 26,2017 21,7857 19,7393
24,6042 18,6442 21,2594 26,9123
16,9896 32,8977 21,3627 15,4958
18,3113 23,6931 19,5429 16,3855

Tabela 6.4.1: Dados da amostra ($n=36$)

Analisando esse conjunto de dados temos que $\overline{x}=21,39$ e $s=5,388.$ Substituindo esses valores na fórmula do intervalo de confiança temos que

$$21,39-2,03\cfrac{5,38}{\sqrt{36}}\leq\mu\leq 21,39+2,03\cfrac{5,38}{\sqrt{36}}.$$

Portanto,

$$IC(\mu,0,95) = (19,568;\ 23,214).$$

Exemplo 4.2.2.2

Foram realizados testes glicêmicos em 25 pacientes após um jejum de 8 horas. Os resultados são apresentados na tabela abaixo. Encontrar um intervalo de confiança de nível $95$ % para a média $\mu$.

80 118 100 90 83
117 95 84 102 80
112 78 102 121 82
77 88 73 104 88
132 91 103 140 101

Tabela 6.4.2: Tabela dos resultados dos testes glicêmicos (mg/dL)

Inicialmente, calculamos a média amostral $\overline{X}$ e o desvio padrão amostral $s$, que são dados por

$$\overline{X} = \frac{1}{25}\sum_{i=1}^{25}X_i = 97,64 \qquad s = \sqrt{\frac{1}{24}\sum_{i=1}^{25}\left(X_i-\overline{X}\right)^2}= 17,82.$$

Como a confiança é de 95%, segue $t_{0,025, 24} = 2,06$ e então, substituindo esses valores na fórmula do intervalo de confiança, temos que

$$IC(\mu;0,95)=\left[97,64-2,06\frac{17,82}{\sqrt{25}};97,64+2,06\frac{17,82}{\sqrt{25}}\right]=[90,28;\ 105].$$

4.3 - Intervalo de confiança para proporção

Consideremos $X$ a variável aleatória que representa a presença (ou não) de determinada característica de uma população. Assim temos que $X$ tem distribuição de Bernoulli com parâmetro $p$, no qual $p$ representa a probabilidade de um determinado elemento da amostra ter a característica de interesse. Retiramos uma amostra aleatória $X_1,\ldots,X_n$ desta população. Cada $X_i, i = 1,\ldots,n$ tem distribuição de Bernoulli com parâmetro $p$, isto é,

$$X_1,X_2,\ldots,X_n\sim \ \text{Bernoulli}(p)$$

com média $\mu = p$ e variância $\sigma^2 = p(1-p)$.

Neste caso, o estimador de máxima verossimilhança $(\hat{p})$ para o parâmetro populacional $p$ é dado por $$\hat{p}=\frac{\text{Nº de elementos da amostra com a característica}}{\text{Total de elementos da amostra}}=\displaystyle\cfrac{\displaystyle\sum_{i=1}^nx_i}{n}=\overline{x}.$$

Utilizaremos três métodos diferentes para encontrar o intervalo de confiança para a proporção: Aproximação normal, aproximação normal com correção de continuidade e binomial exata.

4.3.1 - Aproximação normal

Vejamos como construir intervalos de confiança para a proporção $p$, utilizando a aproximação Normal. Consideremos $\hat{p}$ a proporção amostral. Pelo Teorema Central do Limite temos que, para um tamanho de amostra grande, podemos considerar a proporção amostral $\hat{p}$ como tendo aproximadamente distribuição normal com média p e variância p(1-p)/n. Desse modo segue que

$$\hat{p}\sim N\left(p,\frac{p(1-p)}{n}\right).$$

Observemos que a variância de $\hat{p}$ depende do parâmetro desconhecido $p$. No entanto, pelo fato de $n$ ser grande, podemos substituir $p$ por $\hat{p}$. Com isso temos que

$$\frac{\hat{p}-p}{\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}}\sim N(0,1).$$

Considerando o mesmo procedimento de montagem do intervalo para a média, construímos o intervalo com $100(1 - \alpha)\char37$ de confiança para a proporção $p$:

$$IC(p,1-\alpha)=\left(\hat{p}-Z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}},\hat{p}+Z_{\alpha/2}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\right).$$

Exemplo 4.3.1.1

Numa amostra aleatória de tamanho $n=700$ foram encontrados $68$ elementos defeituosos. Achar um intervalo de confiança de nível $95\char37$ para a proporção $p$ de defeituosos.

Temos que $\hat{p}=68/700=0,0971$. Para $\alpha=0,05$, temos pela tabela da distribuição normal que $Z_{0,025}=1,96$. Então o intervalo de confiança é dado por

$$\left(0,0971-1,96\sqrt{\frac{0,0971(0,9028)}{700}};0,0971+1,96\sqrt{\frac{0,0971(0,9028)}{700}}\right)=(0,0752;\ 0,119).$$

4.3.2 - Aproximação normal com correção de continuidade

Uma outra maneira de obtermos um intervalo de confiança para proporção é através da aproximação normal com correção de continuidade. Considerando o processo anterior, a única diferença é que aqui não consideraremos simplesmente a proporção amostral $\hat{p}$, mas sim uma correção dela. Assim, para determinar o intervalo de confiança consideramos uma modificação da proporção $\hat{p}$, dada por:

$$\hat{p}_c= \begin{cases} \displaystyle\hat{p}+\frac{1}{2n} \ \hbox{se} \ \hat{p} \ < \ 0,5 \cr \cr \hat{p}-\frac{1}{2n} \ \hbox{se} \ \hat{p} \ > \ 0,5. \end{cases} $$

Assim, o intervalo de confiança para proporção $p$ com correção de continuidade, é dado por

$$IC(p,1-\alpha)=\left(\hat{p_c} \mp Z_{\alpha/2} \sqrt{\frac{\hat{p}_c(1-\hat{p}_c)}{n}} \right).$$

O fator de continuidade é utilizado para melhorar a aproximação de uma variável aleatória discreta $\hat{p}$ pela distribuição normal que é contínua.

Exemplo 4.3.2.1

Consideremos novamente o Exemplo 4.2.1.1. Vamos agora encontrar o intervalo de confiança com correção de continuidade.

Temos que $\hat{p}=68/700=0,0971$. Assim, $\hat{p} \ < \ 0,5$. Então $\hat{p_c}=0,0971+1/1400=0,0978$. Para α=0,05, temos pela tabela da distribuição normal que $Z_{0,025}$=1,96. Então o intervalo de confiança é dado por:

$$IC(p,0,95)=\left(0,0978-1,96\sqrt{\frac{0,0978(1-0,0978)}{700}};\quad 0,0978+1,96\sqrt{\frac{0,0978(1-0,0978)}{700}}\right)$$

ou seja,

$$IC(p,0,95)=(0,07579;\ 0,1198).$$

4.3.3 - Binomial exata

Consideremos uma amostra aleatória $X_1,\ldots,X_n$ de uma população com distribuição de Bernoulli com parâmetro $p$. Vamos ver como obter um intervalo de confiança para a proporção utilizando o método da Binomial Exata (sem utilizar o teorema central do limite).

Seja $1 - \alpha$ o nível de confiança. Considere $P_1= 1 - \alpha/2$. Seja $Y$ o número de sucessos (ocorrências do evento de interesse) e considere o valor $x = Y - 1$. Encontre na Tabela da distribuição binomial o valor de $P_1$ correspondente aos valores de $n$ e $x$. O valor $p$ encontrado no topo da coluna que contém o valor $P_1$ é o limite inferior do intervalo de confiança. Para encontrar o limite superior considere $P_2= \alpha/2$, $x = Y$ e entre na mesma tabela com os valores de $n$ e $x$ até encontrar o valor de $P_2$. O valor correspondente de $p$ no topo da tabela é o limite superior do intervalo de confiança.

Exemplo 4.3.3.1

Em um lote com $19$ peças, $4$ eram defeituosas. Obter um intervalo de confiança, com $\alpha = 0,05$, para a proporção $p$ de peças defeituosas.

Temos que $P_1= 1-\alpha/2=1-0,025=0,975$, $x=3$ e $n=19$. Assim, obtemos na tabela da distribuição binomial o limite inferior $0,05$. Por outro lado, $P_2= 0,025$ e $x=4$. Assim obtemos que o limite superior é igual a $0,45$.

Então o intervalo com 95% de confiança paa a proporção de defeituosas é $(0,05;0,45)$.

Observação

Este método é utilizado apenas para amostras de tamanho pequeno. Para amostras grande, utilizamos o teorema central do limite para obter o intervalo de confiança.

4.4 - Intervalo de confiança para taxa

Consideremos uma amostra aleatória $X_1,\ldots,X_n$ de uma população com distribuição de Poisson com parâmetro $\lambda$, isto é,

$$X_1,X_2,\ldots,X_n\sim \ \hbox{Poisson}(\lambda).$$

Sabemos que $\hat{\lambda}=\displaystyle \sum_{i=1}^n\frac{X_i}{n}$ é um estimador de máxima verossimilhança para $\lambda$. Utilizando o teorema central do limite, temos

$$\hat{\lambda}=\displaystyle\sum_{i=1}^n\frac{X_i}{n}\sim N\left(\lambda,\frac{\lambda}{n}\right)$$

o que implica que

$$Z=\frac{\hat{\lambda}-\lambda}{\sqrt{\frac{\hat{\lambda}}{n}}}\sim N(0,1).$$

Analogamente aos casos anteriores, obtemos um intervalo com $100(1 - \alpha)\char37$ de confiança para a taxa:

$$IC(\lambda,1-\alpha)=\left(\hat{\lambda}-Z_{\alpha/2}\sqrt{\frac{\hat{\lambda}}{n}};\ \hat{\lambda}+Z_{\alpha/2}\sqrt{\frac{\hat{\lambda}}{n}}\right).$$

Exemplo 4.4.1

Em um processo de uma fábrica, 72 peças foram escolhidas de forma aleatória e o número de defeitos encontrado em cada peça se encontra na Tabela 6.4.3 abaixo. Construa um intervalo de confiança, com $\alpha=0,05$, para a taxa de defeitos nas peças.

0 0 1 0 2 0 0 0 0 1 0 0
0 0 1 0 3 1 0 2 0 1 2 1
1 0 0 0 0 1 0 1 1 1 5 1
0 0 2 0 0 1 0 3 0 0 0 2
0 2 1 0 0 1 0 0 0 0 2 1
0 2 0 0 0 1 0 0 0 1 0 1

Tabela 6.4.3: Número de defeitos da amostra

Temos que $\hat{\lambda}=\displaystyle\sum_{i=1}^{72} \frac{X_i}{72}=0,64$. Para $\alpha=0,05$, temos pela tabela da distribuição normal que $Z_{0,025}=1,96$. Então, o intervalo de confiança é dado por

$$IC(\lambda,1-\alpha)=\left(0,64-1,96\sqrt{\frac{0,64}{72}};\ 0,64+1,96\sqrt{\frac{0,64}{72}}\right)=(0,455;\ 0,825).$$

Veja a seguir os resultados obtidos pelo software Action Stat.

Estatística Z -0.01178511
P-Valor 0.9905971
Taxa Média Amostral 0.6388889
Tamanho Amostral 72
Hipótese Alternativa Diferente de 0.64
Nível de Confiança 95%
Limite Inferior 0.4542622
Limite Superior 0.8235156

Tabela 6.4.4: Resultados obtidos pela Action Stat

4.5 - Intervalo de confiança para variância

Consideremos uma amostra aleatória $X_1,\ldots,X_n$ de tamanho $n$ de uma população com distribuição normal com média $\mu$ e variância $\sigma^2$. Um estimador para $\sigma^2$ é a variância amostral $s^2$. Assim, sabemos que a quantidade pivotal $$Q=\frac{(n-1)s^2}{\sigma^2}\sim\chi_{n-1}^2.$$

Seja $1-\alpha$ a probabilidade da variável $Q$, com $n-1$ graus de liberdade, tomar valores entre $Q_{\alpha/2}$ e $Q_{1-\alpha/2}$, valores obtidos na tabela da distribuição qui-quadrado tais que $\mathbb{P}[Q \ < \ Q_{\alpha/2}]=\mathbb{P}[Q \ > \ Q_{1-\alpha/2}]=\alpha/2$.

Figura6.4.4.svg

Figura 6.4.4: Distribuição Qui-quadrado e valores críticos

Observando a equação

$$Q_{\alpha/2}\leq Q\leq Q_{1-\alpha/2}$$

vemos que podemos substituir $Q$ pela expressão acima e então obtemos

$$Q_{\alpha/2}\leq\frac{(n-1)s^2}{\sigma^2}\leq Q_{1-\alpha/2}.$$

Reescrevendo esta desigualdade, obtemos o intervalo de confiança para a variância,

$$\frac{(n-1)s^2}{Q_{1-\alpha/2}} \ < \ \sigma^2 \ < \ \frac{(n-1)s^2}{Q_{\alpha/2}}.$$

Assim,

$$\mathbb{P}\left(\frac{(n-1)s^2}{Q_{1-\alpha/2}} \ < \ \sigma^2 \ < \ \frac{(n-1)s^2}{Q_{\alpha}}\right)=1-\alpha.$$

Logo, o intervalo com nível $100(1-\alpha)\char37$ de confiança para $\sigma^2$ será dado por

$$IC(\sigma^2,1-\alpha)=\left(\frac{(n-1)s^2}{Q_{1-\alpha/2}},\frac{(n-1)s^2}{Q_{\alpha/2}}\right).$$

Exemplo 4.5.1

O peso de componentes mecânicos produzidos por uma determinada empresa é uma variável aleatória que se supõe ter distribuição normal. Pretende-se estudar a variabilidade do peso dos referidos componentes. Para isso, uma amostra de tamanho 11 foi obtida,cujos valores em grama são:

98, 97, 102, 100, 98, 101, 102, 105, 95, 102, 100

Construa um intervalo de confiança para a variância do peso, com um grau de confiança igual a 95%.

Temos que $n=11$, $\overline{x}=100$ e

$$s^2=\sum_{i=1}^11\frac{(x_i-\overline{x})^2}{10}=\frac{4+9+\ldots+25+4+0}{10}=8.$$

Pela Tabela da distribuição qui-quadrado com $10$ graus de liberdade, temos que $Q_{0,025}= 3,25$ e $Q_{0,975} = 20,48$. Assim,

$$IC(\sigma^2,1-\alpha)=\left(\frac{10\times 8}{20,48},\ \frac{10\times 8}{3,25}\right)=(3,90;\ 24,61).$$

4.6 - Intervalo de confiança para razão entre duas variâncias

Vejamos como construir um intervalo de confiança para a razão entre duas variâncias de populações normais independentes. Para isso retiramos uma amostra aleatória $X_1,X_2,\dots,X_{n_1}$ da população 1, com distribuição $N(\mu_1,\sigma^2_1)$, e uma amostra $Y_1,Y_2,\dots,Y_{n_2}$ da população 2, com distribuição $N(\mu_2,\sigma^2_2)$. Como

$$Q_1=\cfrac{(n_1-1)}{\sigma_1^2}s_1^2\sim\chi_{n_1-1}^2 \quad \hbox{(Qui-quadrado com} \ n_1-1 \ \hbox{graus de liberdade)}$$

$$Q_2=\cfrac{(n_2-1)}{\sigma_2^2}s_2^2\sim\chi_{n_2-1}^2 \quad \hbox{(Qui-quadrado com} \ n_2-1 \ \hbox{graus de liberdade)}$$

em que $s^2_1$ é a variância amostral da população 1 e $s^2_2$ a variância amostral da população 2. Neste caso, a expressão $F$ definida por

$$F=\cfrac{\cfrac{Q_1}{N_1-1}}{\cfrac{Q_2}{n_2-1}}=\cfrac{\cfrac{s_1^2}{\sigma_1^2}}{\cfrac{s_2^2}{\sigma_2^2}}=\cfrac{s_1^2}{s_2^2}\cfrac{\sigma_2^2}{\sigma_1^2}$$

tem distribuição F de Snedecor com $n_1-1$ graus de liberdade no numerador e $n_2-1$ graus de liberdade no denominador e denotamos por $F_{(n_1-1;n_2-1)}$.

Consideremos que a probabilidade da variável $F$ tomar valores entre $F_{(\frac{\alpha}{2};n_1-1;n_2-1)}$ e $F_{(1-\frac{\alpha}{2};n_1-1;n_2-1)}$ é $1-\alpha$. Esses valores são obtidos na Tabela da distribuição de Fisher-Snedecor referente ao valor de $\alpha$ e aos graus de liberdade do numerador e do denominador, $n_1-1$ e $n_2-1$, respectivamente. Veja a figura a seguir.

Figura6.4.5.svg

Figura 6.4.5: Distribuição Fisher-Snedecor e valores críticos

Observando a equação

$$F_{\alpha/2} \ < \ F \ < \ F_{(1-\alpha/2)}$$

vemos que podemos substituir $F$ pela expressão acima e assim temos

$$F_{\alpha/2} \ < \frac{s_1^2}{s_2^2}\frac{\sigma_2^2}{\sigma_1^2} \ < \ F_{(1-\alpha/2)}.$$

Reescrevendo esta equação obtemos:

$$\cfrac{1}{F_{(1-\alpha/2)}}\frac{s_1^2}{s_2^2} \ < \ \frac{\sigma_1^2}{\sigma_2^2} \ < \ \frac{1}{F_{\alpha/2}}\frac{s_1^2}{s_2^2}.$$

Assim,

$$P\left(\frac{1}{F_{(1-\alpha/2)}}\frac{s_1^2}{s_2^2} \ < \ \frac{\sigma_1^2}{\sigma_2^2} \ < \ \frac{1}{F_{\alpha/2}}\frac{s_1^2}{s_2^2}\right)=1-\alpha.$$

Observe que $F_{(1-\alpha/2,n_1-1,n_2-1)}=\frac{1}{F_{(\alpha/2,n_2-1,n_1-1)}}$ e $F_{(\alpha/2,n_1-1,n_2-1)}=\frac{1}{F_{(1-\alpha/2,n_2-1,n_1-1)}}$.

Logo, o intervalo de confiança com nível $100(1-\alpha)\char37$ para a razão entre duas variâncias será dado por

$$IC(\sigma_1^2/\sigma_2^2,1-\alpha)=\left(\frac{1}{F_{(1-\alpha/2)}}\frac{s_1^2}{s_2^2};\ \frac{1}{F_{(\alpha/2)}}\frac{s_1^2}{s_2^2}\right).$$

4.7 - Intervalo de confiança para a diferença de médias

4.7.1 - 1º Caso: Variâncias conhecidas

Consideremos duas amostras aleatórias, $X_1,X_2,\ldots,X_{n1}$ de tamanho $n_1$ e $Y_1,Y_2,\ldots,Y_{n2}$ de tamanho $n_2$, ambas com distribuição normal, médias $\mu_1$ e $\mu_2$ e variâncias $\sigma_1^2$ e $\sigma_2^2$, respectivamente. Assim,

$$\overline{X}\sim N\left(\mu_1,\frac{\sigma_1^2}{n_1}\right) \ \hbox{e} \ \overline{Y}\sim N\left(\mu_2,\frac{\sigma_2^2}{n_2}\right).$$

Daí, temos que,

$$\overline{X}-\overline{Y}\sim N\left(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}\right)$$

o que implica que

$$Z=\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1).$$

Consideremos que a probabilidade da variável $Z$ tomar valores entre $-Z_{\alpha/2}$ e $Z_{\alpha/2}$ é $1-\alpha$. Observando a equação

$$-Z_{\alpha/2}\leq Z\leq Z_{\alpha/2}$$

vemos que podemos substituir $Z$ pela expressão acima e assim obtemos

$$-Z_{\alpha/2}\leq\frac{\overline{X}-\overline{Y}-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\leq Z_{\alpha/2}.$$

Reescrevendo esta desigualdade, obtemos o intervalo de confiança para a diferença das médias $\mu_1-\mu_2$

$$IC(\mu_1-\mu_2,1-\alpha)=\left((\overline{X}-\overline{Y})-Z_{\alpha/2}\left(\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\right);(\overline{X}-\overline{Y})+Z_{\alpha/2}\left(\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}\right)\right)$$

e podemos afirmar que se pudéssemos construir uma quantidade grande de intervalos $IC(\mu_1-\mu_2,1-\alpha)$, todos baseados em amostras de tamanho $n_1$ e $n_2$, em torno de $100(1-\alpha)\char37$ deles conteriam o valor verdadeiro da média populacional.

4.7.2 - 2º Caso: Variâncias desconhecidas - porém iguais

Consideremos agora duas amostras aleatórias, $X_1,X_2,\ldots,X_{n1}$ de tamanho $n_1$ e $Y_1,Y_2,\ldots,Y_{n2}$ de tamanho $n_2$, com apenas uma diferença do caso anterior: as variâncias são desconhecidas, porém iguais, isto é, $\sigma_1^2 = \sigma_2^2 = \sigma^2$. Como

$$\frac{(n_1-1)s_1^2}{\sigma^2}\sim\chi_{n_1-1}^2 \quad \hbox{e} \quad \frac{(n_2-1)s_2^2}{\sigma_2}\sim\chi_{n_2-1}^2$$

onde $s_1^2$ é a variância amostral da população $1$ e $s_2^2$ é a variância amostral da população $2$, temos que

$$T=\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t_{n_1+n_2-2}$$

onde $$s_p=\sqrt{\frac{(n_1-1)s_1^2+(n_2-1)s_2^2}{n_1+n_2-2}}.$$

Daí, utilizando a tabela da distribuição t de Student com $\nu=(n_1+n_2- 2)$ graus de liberdade, obtemos o valor de $t_{(a,\alpha/2)}$ de forma que

$$-t_{(\nu,\alpha/2)} \ < \ \frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \ < \ t_{(\nu,\alpha/2)}.$$

Reescrevendo esta desigualdade, obtemos o intervalo de confiança para a diferença das médias $\mu_1-\mu_2$ quando as variâncias são desconhecidas, porém iguais,

$$(\overline{X}-\overline{Y})-t_{(\nu,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\leq\mu_1-\mu_2\leq (\overline{X}-\overline{Y})+t_{(\nu,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}$$

ou seja,

$$\text{IC}(\mu_1-\mu_2,1-\alpha)=\left((\overline{X}-\overline{Y})-t_{(\nu,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}};(\overline{X}-\overline{Y})+t_{(\nu,\alpha/2)}s_p\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}\right)$$

e podemos afirmar que se pudéssemos construir uma grande quantidade de intervalos $\text{IC}(\mu_1-\mu_2, 1 - \alpha)$, todos baseados em amostras de tamanho $n_1$ e $n_2$, em torno de $100(1-\alpha)\char37$ deles conteriam a verdadeira diferença das médias populacionais.

4.7.3 - 3º Caso: Variâncias desconhecidas e diferentes

Consideremos duas amostras aleatórias, $X_1,X_2,\ldots,X_{n1}$ de tamanho $n_1$ e $Y_1,Y_2,\ldots,Y_{n2}$ de tamanho $n_2$, com distribuições normais, mas agora com variâncias desconhecidas e diferentes, isto é, $\sigma_1^2\neq\sigma_2^2$. Como as variâncias populacionais são desconhecidas, usaremos as variâncias amostrais $s_1^2$ e $s_2^2$ em seus lugares. Consideremos a variável $T$ tal que

$$T=\frac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}\sim t_{\nu}$$

ou seja, a variável $T$ dada pela equação acima tem distribuição t de Student com $\nu$ graus de liberdade, onde

$$\nu=\frac{\left(\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}\right)^2}{\frac{\left(\frac{s_1^2}{n_1}\right)^2}{n_1-1}+\frac{\left(\frac{s_2^2}{n_2}\right)^2}{n_2-1}}.$$

Fazendo uma construção análoga a do caso anterior, obtemos o intervalo de confiança para a diferença de duas médias com variâncias desconhecidas e desiguais:

$$\text{IC}(\mu_1-\mu_2,1-\alpha)=\left((\overline{X}-\overline{Y})-t_{(\nu,\alpha/2)}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}};\ (\overline{X}-\overline{Y})+t_{(\nu,\alpha/2)}\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}\right).$$

Exemplo 4.7.3.1

Os dados a seguir correspondem a teores de um elemento indicador da qualidade de um certo produto. Foram coletadas $2$ amostras referente a $2$ métodos de produção. Construa um intervalo de confiança para a diferença das médias dos dois métodos.

Método 1 0,9 2,5 9,2 3,2 3,7 1,3 1,2 2,4 3,6 8,3
Método 2 5,3 6,3 5,5 3,6 4,1 2,7 2,0 1,5 5,1 3,5

Tabela 6.4.5: Duas amostras referente a dois métodos de produção

A média referente ao método $1$ é $\overline{x}_1 = 3,63$ e do método $2$ é $\overline{x}_2 = 3,96$. Calculando as variâncias amostrais, obtemos

$$s_1^2=\sum_{i=1}^{10}\frac{(x_{1i}-\overline{x}_1)^2}{9}=8,29 \quad s_2^2=\sum^{10}_{i=1}\frac{(x_{2i}-\overline{x}_2)^2}{9}=2,53$$

em que $x_{1i}$ são os teores referentes ao método $1$ e $x_{2i}$ ao método $2$, $i = 1, …, 10$. Os graus de liberdade são dados por

$$\nu=\frac{\left(\frac{8,29}{10}+\frac{2,53}{10}\right)^2}{\frac{\left(\frac{8,29}{10}\right)^2}{9}+\frac{\left(\frac{2,35}{10}\right)^2}{9}}=14,028.$$

Assim, da Tabela da distribuição t de Student obtemos que $t_{14,0,025}= 2,145$ e então temos que

$$\text{IC}(\mu_1-\mu_2,1-\alpha)=\left((3,63-3,96)(-2,145)\sqrt{\frac{8,29}{10}+\frac{2,53}{10}};(3,63-3,96)(2,145)\sqrt{\frac{8,29}{10}+\frac{2,53}{10}}\right),$$

ou seja, $\text{IC}(\mu_1-\mu_2,1-\alpha)=(-2,56;1,90)$.

Usando o software Action Stat temos os seguintes resultados:

Informação Valor
Estatística T -0.3172124
Graus de Liberdade 14.01997
P-valor 0.7557571
Média da Amostra 1 3.63
Média da Amostra 2 3.96
Desvio Padrão da Amostra 1 2.88
Desvio Padrão da Amostra 2 1.59
Hipótese Alternativa Diferente de 0
Nível de Confiança 95%
Limite Inferior -2.56095
Limite Superior 1.90095

Tabela 6.4.6: Resultados do Intervalo de Confiança para duas amostras de variâncias populacionais desconhecidas e diferentes

4.8 - Intervalo de tolerância

Na ciência estatística existe a possibilidade da criação de diversos tipos de intervalos diferentes. Dendo do paradigma Bayesiano existe o intervalo de credibilidade. Em relação à inferência clássica existe o amplamente conhecido intervalo de confiança. Ainda, tem-se a existência de outros intervalos, como por exemplo o intervalo de previsão.

O intervalo de confiança clássico tem por finalidade trazer uma maior confiança à respeito de uma estimativa pontual, gerando dois valores (limites inferior e superior) nos quais a probabilidade desse intervalo conter o verdadeiro parâmetro populacional é $\gamma$, chamado de nível de confiança. Esse intervalo está sempre associado a uma medida populacional (média, variância, entre outros).

Ao contrário do intervalo de confiança supracitado, o intervalo de tolerância tem por objetivo construir limites de tal forma que ao menos uma determinada proporção populacional esteja contida entre os limites inferior e superior com um nível de confiança $\gamma$. Sendo assim, o principal fator que distingue ambos intervalos é o fato de que, enquanto o intervalo de confiança é relativo a um parâmetro populacional, o intervalo de tolerância está associado a própria distribuição dos dados.

Esse protocolo contém as técnicas estatísticas para a construção de intervalos de confiança bilateral e unilateral para dados resultantes de distribuições contínuas.

Assim, seja $X$ uma variável aleatória contínua com distribuição de probabilidade $f_X(x)$ e função de distribuição acumulada $F_X(x)$. Ainda, $\mathbb{P}(\cdot)$ denota uma medida de probabilidade.

A forma geral dos intervalos de tolerância são:

  • Intervalo de tolerância unilateral inferior

Então um intervalo de tolerância unilateral inferior para uma população populacional de ao menos $P$ e com confiança $\gamma = 1 - \alpha$ será constituído por um limite inferior $L$ tal que:

$$\mathbb{P}\left[1-F_{X}(L ; \theta) \geq P\right] \geq 1-\alpha. \tag{4.8.1}$$

  • Intervalo de tolerância unilateral superior;

Define-se o intervalo de tolerância unilateral superior para uma população populacional de ao menos $P$ e com confiança $\gamma = 1 - \alpha$ como sendo o limite superior $U$, tal que:

$$\mathbb{P}\left[F_{X}(U ; \theta) \geq P\right] \geq 1-\alpha. \tag{4.8.2}$$

  • Intervalo de tolerância bilateral;

O intervalo de tolerância bilateral para uma proporção populacional de ao menos $P$ com confiança $1-\alpha$ é formado por valores $L$ e $U$ tais que:

$$\mathbb{P}\left[F_{X}(U ; \theta) - F_{X}(L ; \theta) \geq P\right] \geq 1-\alpha. \tag{4.8.3}$$

As formulações acima são genéricas. Para cada distribuição de probabilidade tem-se que elas resultaram em expressões diferentes.

Ademais, é possível construir intervalos de tolerância sem supor uma distribuição probabilística para os dados. Esse tipo de intervalo é chamado de intervalo de tolerância não paramétrico (ou livre de distribuição).

4.8.1 - Intervalo de tolerância paramétrico

O intervalo de tolerância paramétrico consiste em atribuir uma distribuição probabilística aos dados amostrais. Assim, a partir das equações $4.8.1,\ 4.8.2 \ $ e $\ 4.8.3$, obtém-se a forma do intervalo de tolerância para cada distribuição.

A suposição de uma distribuição de probabilidade pode ser justificada a partir de um teste de hipótese para a qualidade do ajuste. Alguns destes testes são: Anderson - Darling, Kolmogorov - Smirnov e Cramér–von Mises. Outrossim, a suposição de uma distribuição pode ser verificada graficamente a partir de histogramas, distribuição acumulada empírica e por meio dos gráficos de quantis.

Abaixo é apresentado as formas do intervalo de tolerância para sete distribuições diferentes.

Distribuição Normal

Uma variável aleatória $X$ possui distribuição normal se a sua função de distribuição acumulada puder ser escrita na forma: $$ F_{X}(x ; \mu, \sigma)=\int_{t=-\infty}^{t = x}\left(2 \pi \sigma^{2}\right)^{-1 / 2} e^{-\frac{(t-\mu)^{2}}{2 \sigma^{2}}} d t. $$

Em que $-\infty < x < -\infty$, $-\infty < \mu < -\infty$ e $\sigma^2 > 0$.

Ainda, considera-se os estimadores para $\mu$ e $\sigma$: $\widehat{\mu} = \overline{X}$ e $\widehat{\sigma} = S$ (média e desvio padrão amostral). Dessa maneira, para dados normalmente distribuídos, o intervalo de tolerância consistirá em: $$\widehat{\mu} \pm k \cdot \widehat{\sigma} \text{, para um intervalo bilateral}.$$ $$\widehat{\mu} - k \cdot \widehat{\sigma} \text{, para um intervalo unilateral inferior}.$$ $$\widehat{\mu} + k \cdot \widehat{\sigma} \text{, para um intervalo unilateral superior}.$$

Intervalo Bilateral

Da equação $4.8.3$, vem: $$\mathbb{P}_{\tilde{X},S} \lbrace \mathbb{P}_X (\bar{X}-k_2S \leq X \leq \bar{X}+k_2S \mid \bar{X},S) \geq P \rbrace \geq 1-\alpha $$

Padronizando a variável, tem-se: $$\mathbb{P}_{Z_n, U}(F_X (Z_n+k_2 U)- F_X (Z_n-k_2 U) \geq P) \geq 1-\alpha. $$

Em que $Z_{n} = \frac{\overline{X} - \mu}{\sigma} \sim N(0, \frac{1}{n})$ independente de $U^2 = \frac{S^2}{\sigma^2} \sim \frac{\chi^2_{(n-1)}}{n-1}$.

Agora, tem-se que $k$ é a solução da equação: $$ \sqrt{\frac{2 n}{\pi}} \int_{0}^{\infty} \mathbb{P}\left(\chi_{n-1}^{2}>\frac{(n-1) \cdot \chi_{1 ; P}^{2}\left(z^{2}\right)}{k^{2}}\right) e^{-\frac{1}{2} n z^{2}} d z=1-\alpha. $$

Existem alguns métodos para resolver essa equação e encontrar o valor de k. O utilizado pelo Action Stat é o método de Howe (Howe, 1969).

$$ k = z_{\frac{1+P}{2}} \sqrt{1+n^{-1}} \cdot \sqrt{\frac{n-1}{\chi_{n-1 ; \alpha}^{2}}} \cdot \sqrt{1+\frac{n-3-\chi_{n-1 ; \alpha}^{2}}{2(n+1)^{2}}}. $$

Em que $z_{\frac{1+P}{2}}$ é o quantil $\frac{1 + P}{2}$ da normal padrão.

Intervalo Unilateral

Abaixo expõe-se a obtenção do valor $k$ para o intervalo unilateral superior. O mesmo valor de $k$ é obtido para o intervalo unilateral inferior.

Da equação $4.8.2$, junto com o fato de que o intervalo pode ser escrito da seguinte forma $\widehat{\mu} + k \cdot \widehat{\sigma}$, vem: $$ \mathbb{P}_{\bar{X}, S}\left \lbrace \mathbb{P}\left(X<\bar{X}+k_1 S \mid \bar{X}, S\right)>P\right \rbrace =1-\alpha. $$

Padronizando tem-se: $$ \mathbb{P}_{Z_n, U}\left \lbrace F_X \left(Z_n+k_1 U\right)\geq P\right \rbrace = 1 - \alpha $$

Em que $Z_{n} = \frac{\overline{X} - \mu}{\sigma} \sim N(0, \frac{1}{n})$ independente de $U^2 = \frac{S^2}{\sigma^2} \sim \frac{\chi^2_{(n-1)}}{n-1}$.

Desse modo, o valor de $k$ é: $$ k = \frac{1}{\sqrt{n}} t_{n-1 ; 1-\alpha}\left(z_{P} \sqrt{n}\right). $$

Em que $z_P$ é o P-ésimo percentil da normal padrão.

Distribuição Log Normal

Uma variável aleatória $X$ possui distribuição log-normal quando o seu logaritmo natural possui distribuição normal. Ou seja, se uma variável aleatória $Y$ for normalmente distribuído, então $X = e^Y$ possui distribuição log-normal.

Devido ao fato explicitado acima, para a construção do intervalo de tolerância para dados distribuídos segundo à Log Normal, toma-se o logaritmo natural dos dados, constrói-se o intervalo de acordo com a teoria explicitada na seção $\textbf{4.8.1}$ e, posteriormente, toma-se a exponencial dos intervalos obtidos.

Distribuição Exponencial

Uma variável aleatória $X$ possui distribuição exponencial com média $\lambda$ se a sua função de distribuição acumulada for do tipo: $$F_{X}(x ; \lambda)=1-e^{- \frac{x}{\lambda}}.$$

De acordo com as equações $4.8.1$ e $4.8.2$ as fórmulas para obtenção dos limites do intervalos de tolerância unilateral são: $$ L =\frac{2 n \hat{\lambda} \ln (1/P)}{\chi_{2 n ; 1-\alpha}^{2}}$$ $$ U =\frac{2 n \hat{\lambda} \ln (1/(1-P))}{\chi_{2 n ; \alpha}^{2}} $$

Em que:

  • $\hat{\lambda}$: estimador de máxima verossimilhança de $\lambda$;
  • n: tamanho amostral;
  • P: proporção populacional;
  • $\alpha$: nível de significância;
  • $\chi_{2 n ; 1-\alpha}^{2}$: quantil $1 - \alpha$ da distribuição qui-quadrado com $2n$ graus de liberdade.

Intervalo de tolerância bilateral podem ser obtidos aproximadamente trocando $\alpha$ por $\alpha/2$ e $P$ por $(P+1)/2$.

Distribuição Logística

Uma variável aleatória $X$ possui distribuição logística se a sua função de distribuição acumulada for do tipo: $$ F_{X}(x ; \theta, \sigma)=\int_{t=-\infty}^{x}\left[1+e^{-\frac{\pi(t-\theta)}{\sqrt{3 \sigma}^{2}}}\right]^{-1} d t $$

Em que $-\infty < x < -\infty$, $-\infty < \theta < -\infty$ e $\sigma > 0$.

De acordo com $4.8.1,\ 4.8.2\ $ e $\ 4.8.3$ as fórmulas para encontrar $L$ e $U$, para dados que seguem a distribuição logística, são: $$ L =\hat{\theta}-k_{1} \hat{\sigma} $$ $$ U =\hat{\theta}+k_{2} \hat{\sigma} $$ Para limites unilaterais os valores de $k_1$ e $k_2$ são: $$ k_{1} \approx \frac{t_{1}+\sqrt{t_{1}^{2}-u v}}{v}$$ $$k_{2} \approx \frac{t_{2}+\sqrt{t_{2}^{2}-u v}}{v}$$

Tal que: $$t_{1} =F_{X}^{-1}(P ; \theta=0, \sigma=1)-\hat{\sigma}_{1,2} z_{1-\alpha}^{2}$$ $$t_{2} =F_{X}^{-1}(P ; \theta=0, \sigma=1)+\hat{\sigma}_{1,2} z_{1-\alpha}^{2}$$ $$u =\left[F_{X}^{-1}(P ; \theta=0, \sigma=1)\right]^{2}-\hat{\sigma}_{1}^{2} z_{1-\alpha}^{2}$$ $$v =1-\hat{\sigma}_{2}^{2} z_{1-\alpha}^{2}$$

Ainda, intervalo bilaterais podem ser obtidos substituindo $\alpha$ por $\alpha/2$ e $P$ por $(P+1)/2$.

Distribuição Gama

Uma variável aleatória $X$ possui distribuição gama se a sua função de distribuição acumulada for do tipo: $$ F_{X}(x ; \theta, \beta)=\int_{t=0}^{x} \frac{t^{\theta-1} e^{-t / \beta}}{\beta^{\theta} \Gamma(\theta)} d t. $$

Com $x > 0$, $\theta > 0$ e $\beta > 0$.

Conforme discutido em (Krishnamoorthy, 2008), se uma variável aleatória $X$ tem distribuição gama com parâmetros $\theta$ e $\beta$, então $X^{\frac{1}{3}}$ tem distribuição aproximadamente normal com parâmetros: $$ \mu =\frac{\beta^{1 / 3} \Gamma(\theta+1 / 3)}{\Gamma(\theta)},$$ $$\sigma^{2} =\frac{\beta^{2 / 3} \Gamma(\theta+2 / 3)}{\Gamma(\theta)}-\mu^{2}.$$

Para obter as estimativas dos mesmos, basta substituir $\theta$ e $\beta$ por suas respectivas estimativas. Sendo assim, os limites são obtidos com base no intervalo de tolerância para a distribuição normal: $$ L_{N}=\hat{\mu}-k \hat{\sigma} $$ $$ U_{N}=\hat{\mu}+k \hat{\sigma}.$$

O valor de $k$ é obtido conforme apresentados na seção $\textbf{4.8.1}$. E, posteriormente, é aplicado nesses limites a operação ao cubo para obter os limites do intervalo de tolerância para a distribuição gama. $$L=L_{N}^{3},$$ $$U=U_{N}^{3}$$

Distribuição Weibull

Uma variável aleatória $X$ possui distribuição Weibull se a sua função de distribuição acumulada for do tipo: $$ F_{X}(x ; \theta, \beta)=1-e^{-(x / \theta)^{\beta}}. $$

Em que $x > 0$, $\beta > 0$ e $\theta > 0$.

Ainda, toma-se uma variável aleatória que função de $X$, $Y = \ln(X)$. Então $Y$ tem distribuição de valor extremo, também conhecido como distribuição Gumbel para o mínimo, de tal forma que a sua distribuição acumulada é: $$ F_{Y}(y ; \xi, \delta)=1-\exp \left \lbrace -e^{\frac{y-\xi}{\delta}}\right \rbrace . $$

Onde $-\infty < y < \infty$, $- \infty < \xi = \ln(\theta) < \infty$ e $\delta = \beta^{-1} > 0$.

Isto posto, as equações para a obtenção do intervalo de tolerância unilateral para a distribuição de valores extremos para o mínimo é: $$ L=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right)}{\sqrt{n-1}},$$ $$U=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right)}{\sqrt{n-1}}. $$

Além disso, o intervalo unilateral para a distribuição Weibull é dado por: $$L_{W} =e^{L},$$ $$U_{W} =e^{U}.$$

Para encontrar intervalo bilaterais basta substituir $\alpha$ por $\alpha/2$ e $P$ por $(P + 1)/2$.

Distribuição Gumbel

Por fim, dentro das distribuições que este protocolo se propõe a descrever, tem-se a distribuição Gumbel para o máximo que possui distribuição acumulada como abaixo: $$ F_{Z}(z ; \xi, \delta)=1-\exp \left \lbrace -e^{-\left(\frac{z-\xi}{\delta}\right)}\right \rbrace , $$ com $-\infty< z <+\infty$, $-\infty< \xi <+\infty$ e $\delta > 0$.

Finalmente, para a distribuição Gumbel para o máximo os limites inferior e superior são dados por: $$ L=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right)}{\sqrt{n-1}},$$ $$ U=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right)}{\sqrt{n-1}}. $$

Para obter intervalos bilaterais aproximados basta substituir $\alpha$ por $\alpha/2$ e $P$ por $(P+1)/2$.

4.8.2 - Aplicações

Apresenta-se uma aplicação da metodologia de intervalo de tolerância.

Normal

Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.

29,52 37,22 18,44 32,47 29,96 36,73 35,24 31,97 34,99 29,04
41,83 24,53 24,71 24,05 32,10 25,22 23,35 47,82 37,37 18,04
42,66 24,29 24,47 32,41 39,01 13,82 25,39 20,30 27,77 8,87

Tabela 6.4.7: Dados provenientes de uma distribuição normal com média 30 e desvio padrão 9

Para esses dados tem-se:

  • Média amostral: $\overline{x} = 29,1197$;
  • Desvio padrão amostral: $s = 8,7690$.

Intervalo unilateral

Tem-se que $k$ é dados por: $$ k = \frac{1}{\sqrt{n}} t_{n-1 ; 1-\alpha}\left(z_{P} \sqrt{n}\right). $$

No caso:

  • $n = 30$;
  • $1/\sqrt{n} = 0,1825742$;
  • $z_P = 1,281552$;
  • $t_{n-1 ; 1-\alpha}\left(z_{P} \sqrt{n}\right) = 9,734831$.

Logo, $$ k = 0,1825742 \cdot 9,734831 = 1,777329. $$

Sendo, assim o intervalo de tolerância unilateral inferior é: $$IT_{100\cdot(1-\alpha) \char37 }[P] = [\overline{x} - k\cdot s ; \infty] $$ $$ IT_{95\char37}[90\char37] = [29,1197 - 1,777329 \cdot 8,7690 ; \infty] = [13,5343 ; \infty].$$

Enquanto que o superior é: $$IT_{100\cdot(1-\alpha)\char37}[P] = [-\infty ; \overline{x} + k\cdot s] $$ $$IT_{95\char37}[90\char37] = [-\infty ; 29,1197 + 1,777329 \cdot 8,7690] = [-\infty ; 44,7051].$$

Com o Action Stat tem-se os seguintes resultados:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 13.5342207 44.7051126

Tabela 6.4.8: Resultados do Intervalo unilateral de Tolerância (de distribuição normal) com a Action Stat

Intervalo bilateral

No caso bilateral, tem-se que $k$ é dados por: $$ k = z_{\frac{1+P}{2}} \sqrt{1+n^{-1}} \cdot \sqrt{\frac{n-1}{\chi_{n-1 ; \alpha}^{2}}} \cdot \sqrt{1+\frac{n-3-\chi_{n-1 ; \alpha}^{2}}{2(n+1)^{2}}}. $$

No caso:

  • $P = 0,9$;
  • $n = 30$;
  • $\alpha = 0,05$;
  • $z_{\frac{1+P}{2}} = 1,644854$;
  • $\sqrt{1+n^{-1}} = 1,01653$;
  • $\chi_{n-1 ; \alpha}^{2} = 17,70837$;
  • $\sqrt{\frac{n-1}{\chi_{n-1 ; \alpha}^{2}}} = 1,279705$;
  • $\sqrt{1+\frac{n-3-\chi_{n-1 ; \alpha}^{2}}{2(n+1)^{2}}} = 1,002414$.

Logo, $$ k = 1,644854 \cdot 1,01653 \cdot 1,279705 \cdot 1,002414 = 2,144888 $$

E, consequentemente, o intervalo de tolerância é: $$IT_{100\cdot(1-\alpha)\char37}[P] = [\overline{x} - k\cdot s ; \overline{x} - k\cdot s] $$ $$IT_{95\char37}[90\char37] = [29,1197 - 2,144888 \cdot 8,7690 ; 29,1197 + 2,144888 \cdot 8,7690]$$ $$IT_{95\char37}[90\char37] = [10,3112 ; 47,9282]$$

Com o Action Stat tem-se os seguintes resultados:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 10.3111 47.9282

Tabela 6.4.9: Resultados do Intervalo bilateral de Tolerância (de distribuição normal) com a Action Stat

Log Normal

Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.

6612612988005,81 27847248463,48 106349853386,77
1467365074548577024,00 118982792768420,97 76629252025051,09
3365135824271395840,00 10267451919698,46 586087048871485505536,00
14602950613189902,00 87267567199064,16 654904512,15
45003225413,33 87463678566640976,00 1570232354786859,25
35400790947,99 8946152978611619,00 16966208067273982,00
101950708,05 89723629552,60 1149099835437,40
53878642861,33 1004499,53 4091775093419,58
42382441591,17 2016218253651770,50 68339603,31
126340277771542,59 13828534337,99 7115,28

Tabela 6.4.10: Dados provenientes de uma distribuição Log normal

Para esses dados, tomamos o logaritmo natural e construímos o intervalo com base na distribuição normal, conforme descrito na seção 4.8.1 deste protocolo estatístico.

Ao tomar a exponencial dos dados, chega-se nos mesmos valores presentes na Tabela 6.4.21, que são normalmente distribuídos. Sendo assim, basta calcular o intervalo para os dados com distribuição normal e, posteriormente, aplicar a função exponencial.

Intervalo unilateral

Sendo, assim o intervalo de tolerância unilateral inferior é:

$$IT_{100\cdot(1-\alpha)\char37}[P] = [\exp \lbrace 13,53422 \rbrace ; \infty]$$ $$IT_{95\char37}[90\char37] = [754809 ; \infty].$$

Enquanto que o superior é:

$$IT_{100\cdot(1-\alpha)\char37}[P] = [ -\infty ; \exp \lbrace 44,70511 \rbrace ]$$ $$IT_{95\char37}[90\char37] = [-\infty ; 2,601253 \cdot 10^{19}].$$

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 754809.5123 26012597896719430000

Tabela 6.4.11: Resultados do Intervalo bilateral de Tolerância (de distribuição normal) com a Action Stat

Intervalo bilateral

No caso bilateral, tem-se que: $$ IT_{100\cdot(1-\alpha)\char37}[P] = [\exp \lbrace 10,31109 \rbrace ; \exp \lbrace 47,92824 \rbrace ]$$ $$IT_{95\char37}[90\char37] = [30064,19 ; 6,530857 \cdot 10^{20}].$$

No Action Stat, tem-se:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 30064.2008 653087585678552900000

Tabela 6.4.12: Resultados do Intervalo unilateral de Tolerância (de distribuição normal) com a Action Stat

Exponencial

Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.

3,25 0,57 0,16 4,08 3,77 1,12 3,88 1,39 1,32 0,83
1,48 0,57 0,10 0,84 1,21 0,13 0,30 0,30 6,40 1,20
2,33 0,25 3,75 1,21 1,01 0,54 3,10 0,38 0,22 0,16
3,61 0,60 3,77 2,87 0,47 3,47 3,11 3,81 0,30 17,72

Tabela 6.4.13: Dados provenientes de uma distribuição exponencial com média 2

Para esses dados temos $\widehat{\lambda} = 2,1395$.

Intervalo unilateral

Para o intervalo de tolerância unilateral da distribuição exponencial temos:

$$L =\frac{2 n \hat{\lambda} \ln (1/P)}{\chi_{2 n ; 1-\alpha}^{2}}$$ $$U =\frac{2 n \hat{\lambda} \ln (1/(1-P))}{\chi_{2 n ; \alpha}^{2}}$$

No caso:

  • $n = 40$;
  • $\widehat{\lambda} = 2,1395$;
  • $P = 0,90$;
  • $\alpha = 0,05$;
  • $\chi_{2 n ; 1-\alpha}^{2} = 101,8795$;
  • $\chi_{2 n ; \alpha}^{2} = 60,39148$.

Logo, $$L =\frac{2 \cdot 40 \cdot 2,1395 \cdot \ln (1/0,9)}{101,8795} = 0,1770082$$ $$U =\frac{2 \cdot 40 \cdot 2,1395 \cdot \ln (1/(1-0,9))}{60,39148} = 6,525928$$

Sendo, assim o intervalo de tolerância unilateral inferior é: $$IT_{95\char37}[90\char37] = [0,1770082 ; \infty]$$

Resultados:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 0.177 6.5259

Tabela 6.4.14: Resultados do Intervalo unilateral de Tolerância (de distribuição exponencial) com a Action Stat

Intervalo bilateral

Para o intervalo de tolerância bilateral da distribuição exponencial temos: $$L =\frac{2 n \hat{\lambda} \ln (2/(1+P))}{\chi_{2 n ; 1-\alpha/2}^{2}}$$ $$U =\frac{2 n \hat{\lambda} \ln (2/(1-P))}{\chi_{2 n ; \alpha/2}^{2}}$$

No caso:

  • $n = 40$;
  • $\widehat{\lambda} = 2,1395$;
  • $P = 0,90$;
  • $\alpha = 0,05$;
  • $\chi_{2 n ; 1-\alpha/2}^{2} = 106,6286$;
  • $\chi_{2 n ; \alpha/2}^{2} = 57,15317$.

Sendo assim, $$L =\frac{2 \cdot 40 \cdot 2,1395 \cdot \ln (2/(1+0,9))}{106,6286} = 0,0823359$$ $$U =\frac{2 \cdot 40 \cdot 2,1395 \cdot \ln (2/(1-0,9))}{57,15317} = 8,971498$$

Portanto, o intervalo de tolerância bilateral é: $$IT_{95\char37}[90\char37] = [0,0823359 ; 8,971498].$$

Resultados:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 0.0823 8.9715

Tabela 6.4.15: Resultados do Intervalo bilateral de Tolerância (de distribuição exponencial) com a Action Stat

Logística

Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.

13,65 18,29 8,02 23,67 7,19 31,77 17,06 12,30 4,45 11,26
12,13 12,76 27,56 16,44 18,30 7,98 15,64 18,94 14,63 18,97
2,36 14,21 5,87 8,19 11,45 11,62 4,81 16,50 15,53 10,35
21,15 12,51 10,32 6,28 21,40 13,44 25,93 12,94 8,26 7,17
18,61 10,65 16,08 19,27 15,99 11,34 33,83 18,54 3,73 18,72

Tabela 6.4.16: Dados provenientes de uma distribuição logística com parâmetro de locação igual a 15 e de escala igual a 4

Para esses dados tem-se:

  • $\widehat{\theta} = 13,96957$;
  • $\widehat{\sigma} = 6,829025$;
  • $\widehat{\sigma}^2_1 = 0,8545755$;
  • $\widehat{\sigma}^2_2 = 0,1973863$;
  • $\widehat{\sigma}_{1,2} = 0,01130623$.

Intervalo unilateral

O intervalo de tolerância é dado por: $$L =\hat{\theta}-k_{1} \hat{\sigma}$$ $$U =\hat{\theta}+k_{2} \hat{\sigma}$$

Para limites unilaterais os valores de $k_1$ e $k_2$ são: $$k_{1} \approx \frac{t_{1}+\sqrt{t_{1}^{2}-u v}}{v}$$ $$k_{2} \approx \frac{t_{2}+\sqrt{t_{2}^{2}-u v}}{v} $$

Tal que: $$ t_{1} =F_{X}^{-1}(P ; \theta=0, \sigma=1)-\hat{\sigma}_{1,2} z_{1-\alpha}^{2}$$ $$t_{2} =F_{X}^{-1}(P ; \theta=0, \sigma=1)+\hat{\sigma}_{1,2} z_{1-\alpha}^{2}$$ $$u =\left[F_{X}^{-1}(P ; \theta=0, \sigma=1)\right]^{2}-\hat{\sigma}_{1}^{2} z_{1-\alpha}^{2}$$ $$v =1-\hat{\sigma}_{2}^{2} z_{1-\alpha}^{2} $$

No caso, tem-se:

  • $n = 50$;
  • $\alpha = 5\char37$;
  • $P = 90\char37$;
  • $z_{1-\alpha}^{2} = 2,705543$;
  • $F_{X}^{-1}(P ; \theta=0, \sigma=1) = 1,211393$;
  • $t_1 = 1,211393 - 0,01130623 \cdot 2,705543 = 1,180804$;
  • $t_2 = 1,211393 + 0,01130623 \cdot 2,705543 = 1,241982$;
  • $u = 1,211393^2 - 0,8545755 \cdot 2,705543 = -0,8446178$;
  • $v = 1 - 0,1973863 \cdot 2,705543 = 0,4659629$.

Ficando, $$k_{1} \approx \frac{1,180804+\sqrt{1,180804^{2}-(-0,8446178) \cdots 0,4659629}}{0,4659629} = 5,403676$$ $$k_{2} \approx \frac{1,241982+\sqrt{1,241982^{2}-(-0,8446178) \cdot 0,4659629}}{0,4659629} = 5,651551.$$

Finalmente, o intervalo de tolerância unilateral inferior fica: $$IT_{95\char37}[90\char37] = [13,96957 - 5,403676 \cdot 6,829025 ; \infty]= [-22,93227 ; \infty].$$

Enquanto que o intervalo superior fica: $$IT_{95\char37}[90\char37] = [ -\infty ; 13,96957 + 5,651554 \cdot 6,829025] = [-\infty ; 52,56417].$$

Intervalo bilateral

Tem-se agora um exemplo de intervalo bilateral. O intervalo de tolerância bilateral é dado por: $$L =\hat{\theta}-k_{1} \hat{\sigma}$$ $$U =\hat{\theta}+k_{2} \hat{\sigma}$$

Para limites bilaterais os valores de $k_1$ e $k_2$ são: $$k_{1} \approx \frac{t_{1}+\sqrt{t_{1}^{2}-u v}}{v}$$ $$k_{2} \approx \frac{t_{2}+\sqrt{t_{2}^{2}-u v}}{v}$$

Tal que: $$t_{1} =F_{X}^{-1}((P+1)/2 ; \theta=0, \sigma=1)-\hat{\sigma}_{1,2} z_{1-\alpha/2}^{2}$$ $$t_{2} =F_{X}^{-1}((P+1)/2 ; \theta=0, \sigma=1)+\hat{\sigma}_{1,2} z_{1-\alpha/2}^{2}$$ $$u =\left[F_{X}^{-1}((P+1)/2 ; \theta=0, \sigma=1)\right]^{2}-\hat{\sigma}_{1}^{2} z_{1-\alpha/2}^{2}$$ $$v =1-\hat{\sigma}_{2}^{2} z_{1-\alpha/2}^{2}$$

No caso, tem-se:

  • $n = 50$;
  • $\alpha = 5\char37$;
  • $P = 90\char37$;
  • $z_{1-\alpha/2}^{2} = 3,841459$;
  • $F_{X}^{-1}((P+1)/2 ; \theta=0, \sigma=1) = 1,623354$;
  • $t_1 = 1,623354 - 0,01130623 \cdot 3,841459 = 1,579922$;
  • $t_2 = 1,623354 + 0,01130623 \cdot 3,841459 = 1,666786$;
  • $u = 1,623354^2 - 0,8545755 \cdot 3,841459 = -0,6475385$;
  • $v = 1 - 0,1973863 \cdot 3,841459 = 0,2417486$.

Ficando, $$k_{1} \approx \frac{1,579922+\sqrt{1,579922^{2}-(-0,6475385) \cdot 0,2417486}}{0,2417486} = 13,2726$$ $$k_{2} \approx \frac{1,666786+\sqrt{1,666786^{2}-(-0,6475385) \cdot 0,2417486}}{0,2417486} = 13,9810.$$

Finalmente, o intervalo de tolerância unilateral inferior fica:

$$IT_{95\char37}[90\char37] = [13,96957 - 13,2726 \cdot 6,829025 ; 13,96957 + 13,9810 \cdot 6,829025]$$ $$IT_{95\char37}[90\char37] = [-76,66935 ; 109,4462].$$

Gama

Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.

9,34 5,29 6,15 12,18 9,23 4,48 40,14 25,35 10,67 6,86
11,46 12,73 1,17 18,66 8,55 3,17 23,45 2,64 22,09 24,71
10,04 11,87 32,86 4,80 19,68 13,18 10,10 9,79 6,25 3,55
4,61 23,75 3,54 2,43 18,18 15,23 4,76 44,95 14,05 24,31
29,62 13,50 13,70 20,37 6,95 4,62 14,84 11,16 2,91 4,93

Tabela 4.9: Dados provenientes de uma distribuição gama com parâmetro de forma igual a 2 e de escala igual a 7

Para esses dados, as estimativas são obtidos via métodos de otimização. No caso tem-se:

  • $\widehat{\theta} = 1,892514$;
  • $\widehat{\beta} = 6,96269$.

Ainda, $$\widehat{\mu} =\frac{6,96269^{1 / 3} \Gamma(1,892514+1 / 3)}{\Gamma(1,892514)} = 2,224858,$$ $$\widehat{\sigma}^{2} =\frac{6,96269^{2 / 3} \Gamma(1,892514+2 / 3)}{\Gamma(1,892514)}-2,224858^{2} =0,3224228.$$

Intervalo unilateral

Conforme apresentado em \ref{gamma_dist}, utiliza-se a aproximação normal para obter o valor de $k$, então: $$k = \frac{1}{\sqrt{n}} t_{n-1 ; 1-\alpha}\left(z_{P} \sqrt{n}\right).$$

No caso:

  • $n = 50$;
  • $1/\sqrt{n} = 0,1414214$;
  • $z_P = 1,281552$;
  • $t_{n-1 ; 1-\alpha}\left(z_{P} \sqrt{n}\right) = 11,6359$.

Logo, $$k = 0,1414214 \cdot 11,6359 = 1,645565.$$

Sendo, assim o intervalo de tolerância unilateral inferior é: $$IT_{100\cdot(1-\alpha)\char37}[P] = [ \left \lbrace \widehat{\mu} - k\cdot \sqrt{\widehat{\sigma}^2} \right \rbrace ^3 ; +\infty]$$ $$IT_{95\char37}[90\char37] = [\left \lbrace 2,224858 - 1,645565 \cdot \sqrt{0,3224228} \right \rbrace ^3 ; +\infty]$$ $$IT_{95\char37}[90\char37] = [2.1786 ; +\infty].$$

Enquanto que o superior é:

$$IT_{100\cdot(1-\alpha)\char37}[P] = [-\infty ; \left \lbrace \widehat{\mu} + k\cdot \sqrt{\widehat{\sigma}^2} \right \rbrace ^3]$$ $$IT_{95\char37}[90\char37] = [-\infty ; \left \lbrace 2,224858 + 1,645565 \cdot \sqrt{0,3224228} \right \rbrace ^3 ]$$ $$IT_{95\char37}[90\char37] = [-\infty ; 31.9613].$$

Resultados:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 2.1786 31.9618

Tabela 6.4.17: Resultados do Intervalo unilateral de Tolerância (de distribuição gama) com a Action Stat

Intervalo bilateral

No caso bilateral, tem-se que $k$ é dados por: $$k = z_{\frac{1+P}{2}} \sqrt{1+n^{-1}} \cdot \sqrt{\frac{n-1}{\chi_{n-1 ; \alpha}^{2}}} \cdot \sqrt{1+\frac{n-3-\chi_{n-1 ; \alpha}^{2}}{2(n+1)^{2}}}.$$

No caso:

  • $P = 0,9$;
  • $n = 50$;
  • $\alpha = 0,05$;
  • $z_{\frac{1+P}{2}} = 1,644854$;
  • $\sqrt{1+n^{-1}} = 1,00995$;
  • $\chi_{n-1 ; \alpha}^{2} = 33,93031$;
  • $\sqrt{\frac{n-1}{\chi_{n-1 ; \alpha}^{2}}} = 1,201722$;
  • $\sqrt{1+\frac{n-3-\chi_{n-1 ; \alpha}^{2}}{2(n+1)^{2}}} = 1,001255$.

Logo, $$k = 1,644854 \cdot 1,00995 \cdot 1,201722 \cdot 1,001255 = 1,998832.$$

Assim, o intervalo de tolerância bilateral é:

$$IT_{100\cdot(1-\alpha)\char37}[P] = \left[\left \lbrace \widehat{\mu} - k\cdot \sqrt{\widehat{\sigma}^2} \right \rbrace ^3 ; \left \lbrace \widehat{\mu} + k\cdot \sqrt{\widehat{\sigma}^2} \right \rbrace ^3 \right]$$ $$IT_{95\char37}[90\char37] = \left[\left \lbrace 2,224858 - 1,998832\cdot \sqrt{0,3224228} \right \rbrace ^3\right. ; \left. \left \lbrace 2,224858 + 1,998832\cdot \sqrt{0,3224228} \right \rbrace ^3 \right]$$ $$IT_{95\char37}[90\char37] = \left[ 1,095213^3 ; 3.374694^3 \right] = [1,3137; 38,433].$$

Resultados:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 1.3137 38.4329

Tabela 6.4.18: Resultados do Intervalo bilateral de Tolerância (de distribuição gama) com a Action Stat

Weibull

Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.

8,52 6,82 4,28 7,21 3,54 7,39 4,69 7,74 7,50 7,94
5,19 9,01 7,55 5,55 5,50 6,29 8,06 6,65 5,55 7,02
8,07 7,78 6,91 6,56 6,24 6,91 7,93 7,33 6,58 9,64
5,85 9,18 4,01 6,74 4,48 9,26 7,20 7,56 5,47 6,92
9,43 4,15 7,77 7,63 7,19 8,73 7,90 8,71 6,17 6,57

Tabela 4.10: Dados da distribuição Weibull com forma igual a 5 e escala igual a 8

Para esses dados tem-se as seguintes estimativas de máximo verossimilhança.

  • $\widehat{\beta}: 5,580786$ (forma);
  • $\widehat{\theta}: 7,516806$ (escala).

Intervalo unilateral

Os limites do intervalo são dados por: $$L=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right)}{\sqrt{n-1}},$$ $$U=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right)}{\sqrt{n-1}}.$$

Em que:

  • $\widehat{\xi} = \ln(\widehat{\theta}) = 2,017141$;
  • $\widehat{\delta} = \widehat{\beta}^{-1} = 0,1791862$;
  • $t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right) = 19,60841$;
  • $t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right) = -8,04657$.

Portanto, $$L=2,017141-\frac{0,1791862 \cdot 19,60841}{7} = 1,515204,$$ $$U=2,017141-\frac{0,1791862 \cdot (-8,04657)}{7} = 2,223117.$$

Sendo o intervalo de tolerância unilateral inferior como abaixo: $$IT_{95\char37}[90\char37] = \left[\exp(1,515204) ; \infty \right] = [4,550349 ; \infty].$$

Em seguida tem-se o superior:

$$IT_{95\char37}[90\char37] = \left[0 ; \exp(2,223117) \right] = [0 ; 9,236075].$$

Resultados:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 4.5504 9.2361

Tabela 6.4.19: Resultados do Intervalo unilateral de Tolerância (de distribuição Weibull) com a Action Stat

Intervalo bilateral

Os limites do intervalo são dados por: $$L=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; 1-\alpha/2}^{*}\left(-\sqrt{n} \lambda_{(P+1)/2}\right)}{\sqrt{n-1}},$$ $$U=\hat{\xi}-\frac{\hat{\delta} t_{n-1 ; \alpha/2}^{*}\left(-\sqrt{n} \lambda_{(1-P)/2}\right)}{\sqrt{n-1}}.$$

Em que:

  • $\widehat{\xi} = \ln(\widehat{\theta}) = 2,017141$;
  • $\widehat{\delta} = \widehat{\beta}^{-1} = 0,1791862$;
  • $t_{n-1 ; 1-\alpha/2}^{*}\left(-\sqrt{n} \lambda_{(P+1)/2}\right) = 26,63338$;
  • $t_{n-1 ; \alpha/2}^{*}\left(-\sqrt{n} \lambda_{(1-P)/2}\right) = -10,66064$.

Portanto, $$L=2,017141-\frac{0,1791862 \cdot 26,63338}{7} = 1,335379,$$ $$U=2,017141-\frac{0,1791862 \cdot (-10,66064)}{7} = 2,290032.$$

O intervalo de tolerância bilateral é: $$IT_{95\char37}[90\char37] = \left[ \exp(1,335379) ; \exp(2,290032) \right] = [3,801436 ; 9,875254].$$

Resultados:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 3.8014 9.8753

Tabela 6.4.20: Resultados do Intervalo unilateral de Tolerância (de distribuição Weibull) com a Action Stat

Gumbel

A distribuição Gumbel é uma distribuição para valores extremos. No caso do Action ela é uma distribuição para o máximo.

Deseja-se construir um intervalo de tolerância com ao menos $90\char37$ de população populacional com $95\char37$ de confiança. Para isso, considere o vetor de dados abaixo.

14,24 15,86 11,71 13,93 16,53 9,36 8,21 8,82 5,53 9,46
17,28 11,55 8,94 12,53 8,13 13,60 7,41 11,91 4,32 8,47
6,25 8,28 8,70 9,96 10,54 22,52 18,98 8,38 9,02 9,36
4,84 5,61 12,79 8,66 5,45 24,50 2,49 7,98 7,64 21,04
4,56 12,75 11,69 9,44 4,28 13,70 12,29 14,38 8,33 22,78

Tabela 6.4.21: Dados provenientes da distribuição Gumbel com parâmetro de locação igual a 9 e de escala igual a 4

Para esses dados os estimadores de máxima verossimilhança são:

  • $\hat{\xi} = 8,643191$;
  • $\hat{\delta} = 3,878154$.

Intervalo unilateral

O intervalo de tolerância para a distribuição Gumbel é dado por $$L=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right)}{\sqrt{n-1}},$$ $$U=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right)}{\sqrt{n-1}}.$$

Em que:

  • $n = 50$;
  • $\sqrt{n - 1} = \sqrt{50 - 1} = 7$;
  • $P = 0,90$;
  • $\lambda_{1 - P} = \ln(-\ln(1 - 0,90)) = 0,8340324$;
  • $\lambda_{P} = \ln(-\ln(0,90)) = -2,250367$;
  • $\alpha = 0,05$;
  • $t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{1-P}\right) = -8,04657$;
  • $t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{P}\right) = 19,60841$.

Assim, $$L=8,643191+\frac{3,878154 \cdot -8,04657}{7} = 4,185214,$$ $$U=8,643191+\frac{3,878154 \cdot 19,60841}{7} = 19,50668.$$

O intervalo de tolerância unilateral inferior é:

$$IT_{95\char37}[90\char37] = \left[4,185214 ; \infty \right].$$

Em seguida, tem-se o superior:

$$IT_{95\char37}[90\char37] = [0 ; 19,50668].$$

Resultados:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 4.1852 19.5067

Tabela 6.4.22: Resultados do Intervalo unilateral de Tolerância (de distribuição Gumbel) com a Action Stat

O intervalo de tolerância bilateral para a distribuição Gumbel é dado por $$L=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; \alpha/2}^{*}\left(-\sqrt{n} \lambda_{(1-P)/2}\right)}{\sqrt{n-1}},$$ $$U=\hat{\xi}+\frac{\hat{\delta} t_{n-1 ; 1-\alpha/2}^{*}\left(-\sqrt{n} \lambda_{(1 + P)/2}\right)}{\sqrt{n-1}}.$$

Em que:

  • $n = 50$;
  • $\sqrt{n - 1} = \sqrt{50 - 1} = 7$;
  • $P = 0,90$;
  • $\lambda_{(1 - P)/2} = \ln(-\ln((1 - 0,90)/2)) = 1,097189$;
  • $\lambda_{(1 + P)/2} = \ln(-\ln((1 + 0,90)/2)) = -2,970195$;
  • $t_{n-1 ; \alpha}^{*}\left(-\sqrt{n} \lambda_{(1-P)/2}\right) = -10,66064$;
  • $t_{n-1 ; 1-\alpha}^{*}\left(-\sqrt{n} \lambda_{(1+P)/2}\right) = 26,63338$.

Assim, $$L=8,643191+\frac{3,878154 \cdot -10,66064}{7} = 2,736962,$$ $$U=8,643191+\frac{3,878154 \cdot 26,63338}{7} = 23,39867.$$

O intervalo de tolerância bilateral é: $$IT_{95\char37}[90\char37] = \left[2,736962 ; 23,39867 \right].$$

Resultados:

Nível de significância Proporção populacional Limite inferior Limite Superior
0.05 0.9 2.737 23.3987

Tabela 6.4.23: Resultados do Intervalo bilateral de Tolerância (de distribuição Gumbel) com a Action Stat