1.3 Estimação Não-Paramétrica da Função de Confiabilidade

Em geral, os conjuntos de dados amostrais de tempos de falha apresentam censuras, o que requer técnicas estatísticas especializadas para acomodar a informação contida nestas observações. As observações censuradas nos dão somente parte da informação sobre o tempo de falha dos itens sob teste. Isto é, a observação censurada informa que o tempo até a falha é maior do que aquele onde a censura foi registrada. Os problemas gerados por observações censuradas podem ser ilustrados numa situação bem simples, por exemplo, na construção de um histograma. Se a amostra não contiver observações censuradas, a construção de um histograma consiste na divisão do eixo do tempo em um certo número de intervalos. Em seguida, conta-se o número de falhas em cada intervalo. Entretanto, quando existem censuras não é possível construir um histograma, pois não sabemos a frequência exata associada a alguns intervalos.

A seguir apresentamos técnicas estatísticas usadas para analisar dados de tempo de falha na presença de censuras. Em particular, introduzimos dois estimadores não-paramétricos (Tabela de vida e Kaplan-Meier) para a função de confiabilidade.

3.1 - Tabela de Vida

A tabela de vida ou método atuarial é uma das mais antigas técnicas estatísticas utilizadas para estimar características associadas à distribuição dos tempos de falha. A tabela de vida é essencialmente uma extensão do histograma para o caso de dados censurados. Veremos a seguir como se constrói uma tabela de vida. Dados os pontos

$$0 = t_0~<~t_1~<~t_2~<~\cdots~<~t_k~<~t_{k+1} = \infty$$

dividimos o eixo do tempo $[0, \infty)$ em k+1 intervalos $[0,t_{1}), \ldots, [t_{k-1}, t_{k}), [t_{k}, +\infty).$ Para cada intervalo $I_{j}$ = $[t_{j-1}$, $t_{j})$ considere as seguintes probabilidades

$$p_j = P(T~>~t_j |~T~>~t_{j-1}),$$

$$q_j = P(T~<~t_j |~T~>~t_{j-1}) = 1 - p_j,$$

em que $p_{j}$ representa a probabilidade de um item sobreviver além do intervalo $I_{j}$ (depois de $t_{j}$), dado que ele não falhou até o início do intervalo $I_{j}$ (tempo $t_{j-1}$) e $q_{j}$ representa a probabilidade de um item falhar no intervalo no intervalo $I_{j}$ (entre $t_{j-1}$ e $t_{j}$) dado que ele não falhou até o início do intervalo $I_{j}$ (tempo $t_{j-1}$), j = 1, …, k+1.

Além disso, observe que

$$p_j = P(T~>~t_j |~T~>~t_{j-1})$$

$$ = \dfrac{P(T~>~t_{j},~T~>~t_{j-1})}{P(T~>~t_{j-1})}$$

$$ = \dfrac{R(t_j)}{R(t_{j-1})} \tag{3.1.1}$$

para j = 1, …, k + 1. Note que $p_{k+1}$ = 0, pois $R(t_{k+1})$ = 0. Portanto, da equação (3.1.1) temos que

$$R(t_j) = p_j R(t_{j-1}),~~~~~~~~j = 1, \ldots, k+1 \tag{3.1.2}$$

Com isso, concluímos que

$$R(t_j) = p_j \times p_{j-1} \times \cdots \times p_1, ~~~~~~~~j = 1,\ldots, k+1 \tag{3.1.3}$$

Como $q_{j}$ = 1 - $p_{j}$, podemos reescrever as equações (3.1.2) e (3.1.3) como

$$R(t_j) = (1 - q_j)R(t_{j-1}) \tag{3.1.4}$$

$$R(t_j) = (1 - q_j)\times \cdots \times(1-q_{1})~~~~~~~j = 1, \ldots, k + 1 \tag{3.1.5}$$

Observe que $R(t_{0})$ = 1 e $R(t_{k+1})$= 0.

Com isso, podemos obter uma estimativa para a confiabilidade em $t_{j}$ a partir de uma estimativa para a probabilidade $q_{j}$. Uma estimativa intuitiva para $q_{j}$ é dada por

$$\widehat{q_j} = \dfrac{\hbox{nº de itens que falharam em }[t_{j-1},t_{j})}{\hbox{nº de itens em risco em } t_{j-1} - \dfrac{\hbox{nº de censuras em } [t_{j-1}, t_{j})}{2}} \tag{3.1.6}$$

em que um item é considerado em risco em $t_{j}$ se ainda não falhou nem foi censurado até esse tempo, j = 1, …, k+1.

A explicação para o segundo termo do denominador da expressão (3.1.6) é que produtos para os quais a censura ocorreu no intervalo $[t_{j-1}$, $t_{j})$ são tratados com se estivessem sob risco durante a metade do intervalo considerado. Em muitos dos estudos de durabilidade as censuras ocorrem somente no último intervalo de tempo, fazendo com que essa correção não venha ser utilizada. Esse é os caso dos conjuntos de dados de confiabilidade com mecanismos de censura do tipo I e II.

Com as estimativas de $\widehat{q_j}$ obtidas em (3.1.6), podemos reescrever as equações (3.1.4) e (3.1.5) obtendo as seguintes formas equivalentes para a estimativa da confiabilidade $R(t_{j})$ no tempo $t_{j}$

$$\widehat{R}(t_j) = (1 - \widehat{q_j})\widehat{R}(t_{j-1}) \tag{3.1.7}$$

$$\widehat{R}(t_j) = (1 - \widehat{q_j})\times \cdots \times (1 -\widehat{q}_1),~~~~~~~ j = 1, \ldots, k + 1 \tag{3.1.8}$$

No entanto, para a construção da tabela de vida é mais conveniente a utilização da forma recursiva dada em (3.1.7).

Uma estimativa gráfica para a função de confiabilidade é uma função escada, com valor constante para cada intervalo de tempo. A função de confiabilidade estimada no primeiro intervalo, $[0, t_{1})$, é igual a 1. Por outro lado, a função de confiabilidade estimada no último intervalo, $[t_{k}, ∞)$, é zero, se o maior tempo observado for uma falha, e não atingirá o zero se for uma censura.

Exemplo 3.1.1

Voltando ao Exemplo 2.1. Considerando o número de ciclos das válvulas até a falha e dividindo o tempo em 6 intervalos temos: $[0, 10), [10, 20), [20, 30), [30, 40), [40, 50)$ e $[50, ∞)$, com uma unidade correspondendo a 10.000 ciclos.

No intervalo $[0, 10)$ houve 1 falha e 0 censuras, sendo que 30 itens estavam em risco no início do intervalo. Portanto,

$$\widehat{q}_1=\dfrac{1}{30-\frac{0}{2}}=\dfrac{1}{30}=0,033.$$

Logo, pela expressão (3.1.7) temos que

$$\widehat{R}(t_1)=(1-\widehat{q}_1)=1-0,033=0,967.$$

No intervalo $[10, 20)$ houve 5 falhas e 0 censuras, sendo que 29 itens estavam em risco no início do intervalo. Portanto,

$$\widehat{q}_2=\dfrac{5}{29-\frac{0}{2}}=\dfrac{5}{29}=0,172.$$

Assim, pela expressão (3.1.7) obtemos

$$\widehat{R}(t_2)=(1-\widehat{q}_2)\widehat{R}(t_1)=(1-0,172)\times 0,967=0,800.$$

Procedendo da mesma maneira para os demais intervalos construímos a Tabela 3.1.1, a qual é chamada tabela de vida. O gráfico da estimativa para a função de confiabilidade obtida a partir da tabela de vida é apresentado na Figura 3.1.1.

Intervalo $I_j = [t_{j-1}, t_j)$ N° em risco N° de falhas $ \widehat{q_j} $ (%) Confiabilidade $\widehat{R}(t_{j})$ (%)
[0, 10) 30 1 3,3 96,7
[10, 20) 29 5 17,2 80,0
[20, 30) 24 5 20,8 63,3
[30, 40) 19 4 21,1 50,0
[40, 50) 15 3 20 40,0
[50, +∞) 12 12 100 0

Tabela 1.3.1: Estimativas de Confiabilidade para dados sobre o tempo de vida de válvulas.

Pela análise da Tabela 3.1.1 ou da Figura ?, podemos notar que a probabilidade de um mecanismo de acionamento manual falhar com mais de 40.000 ciclos de uso é de 50%, enquanto que a probabilidade do mecanismo falhar com mais de 50.000 ciclos é de 40%.

Figura 1.3.1

Figura 1.3.1: Estimativa da função de confiabilidade usando a tabela de vida.

Estimadores associados à tabelas de vida, apesar de bastante utilizados, têm algumas desvantagens. O número e a amplitude dos intervalos de tempo são escolhidos de forma arbitrária. O uso de poucos intervalos nos dá uma aproximação muito grosseira da verdadeira função de confiabilidade e da função da taxa de falha. Sendo assim, uma outra forma de estimarmos a função de confiabilidade minimizando esses problemas é usar o estimador de Kaplan-Meier, discutido no tópico a seguir.

3.2 - Estimador de Kaplan-Meier

O estimador limite-produto, ou Kaplan-Meier como é usualmente chamado, é um estimador não-paramétrico para a função de confiabilidade. Ele é uma adaptação da função de confiabilidade empírica, que na ausência de censuras é definida como

$$\widehat{R}(t) = \dfrac{\hbox{número de itens em operação até o tempo t}}{\hbox{número total de itens em teste}} \tag{3.2.1}$$

Essa estimativa de R(t) é uma função escada com degraus nos tempos observados de falha. O estimador de Kaplan-Meier, na sua construção, considera tantos intervalos de tempo quantos forem o número de tempos distintos de falha. Os limites dos intervalos de tempo são os tempos distintos de falha. Vamos definir a seguir a expressão geral deste estimador, assim como foi proposto por seus autores. A forma geral é importante na medida em que permite levar em conta a censura do tipo aleatório, ou seja, aquela que ocorre antes do término do teste. Por exemplo, um item pode ser retirado do estudo por ter falhado devido a uma causa diferente da estudada. Ressaltamos, no entanto, que para os mecanismos de censura do tipo I e II que ocorrem com frequência em estudos de confiabilidade, o estimador Kaplan-Meier mantém a mesma forma da função de confiabilidade empírica dada pela expressão (3.2.1).

Suponha que existem n itens em teste e houve k tempos de falha distintos t1 < t2 < … < tk , para 1 ≤ k ≤n. Pode ser que ocorra mais de uma falha para um mesmo tempo, o que é chamado de empate. Desta forma, vamos usar a seguinte notação:

$dj$ : número falhas no tempo ti;

$nj$ : número de itens em risco no tempo tj (não falhou e não foi censurado antes de tj), para j = 1, …, k.

O estimador de Kaplan-Meier de R(t) é definido como sendo 1, para 0 ≤ t < $t_{1}$ e para t > $t_{1}$ é definido pela expressão

$$\widehat{R}(t)=((\dfrac{n_1-d_1}{n_1}))((\dfrac{n_2-d_2}{n_2}))~\ldots~((\dfrac{n_j - d_j}{n_j})) \tag{3.2.2}$$

sendo $t_{j}$ o maior tempo de falha menor que t.

Em alguns casos, podemos ter um tempo de censura coincidindo com algum tempo de falha $t_{j}$, j =1, … ,k. Neste caso, adota-se a convenção de que o tempo de censura ocorre imediatamente após o tempo de falha e portanto o item com tempo censurado deve ser considerado em risco neste instante. Esta convenção faz sentido uma vez que, se observamos uma unidade com censura em um tempo L, muito provavelmente esta unidade estará em operação por um tempo maior que L. Pode ocorrer também que o maior tempo observado na amostra seja uma censura e não um tempo de falha. Nestes casos, a estimativa (3.2.2) é definida apenas até esse tempo e não atinge o valor 0 para nenhum tempo.

A estimativa $\widehat{R}(t)$ tem saltos somente nos tempos de falha e decresce por um fator $(n_{j}$ - $d_j)/n_{j}$ imediatamente após cada tempo de falha $t_{j}$, j = 1, … ,k. Com isso, temos que

$$\widehat{R}(t_j^+)=\begin{cases}\dfrac{n_j-d_j}{n_j}, \qquad \qquad \hbox{se}~j= 1,\cr \cr \dfrac{n_j - d_j}{n_j}~\widehat{R}(t_{j-1}^+), \qquad \hbox{se}~j = 2, \ldots, k, \end{cases} . \tag{3.2.3}$$

em que $\widehat{R}(t_j^+)$ representa a estimativa da função de confiabilidade imediatamente após o tempo $t_{j}$, j = 1,… ,k.

Exemplo 3.2.1

Considerando os dados do Exemplo 2.1, que diz respeito ao número de ciclos de válvulas, temos para o primeiro tempo de falha: $t_{1}$ = 5.625, número de itens em risco $n_{1}$ = 30 e número de falhas $d_{1}$ = 1.

Portanto, pela equação (3.2.3) temos

$$\widehat{R}(5.625^{+}) = \dfrac{30-1}{30} = \dfrac{29}{30} = 0,967$$

Para o segundo tempo de falha $t_{2}$ = 11223, temos $n_{2}$ = 29 e $d_{2}$ = 1. Logo,

$$\widehat{R}(11.223^{+}) = \dfrac{29-1}{29}\widehat{R}(5.625^{+}) = 0,965 \ast 0,967 = 0,933$$

Procedendo da mesma maneira para os demais tempos de falha, obtemos as estimativas de confiabilidade mostradas na Tabela 3.2.1.

$t_j$ $d_j$ $n_j$ $ \widehat{R}(t_j^{+}) $
5.625 1 30 0,967
11.223 1 29 0,933
12.128 1 28 0,9
13.566 1 27 0,867
14.921 1 26 0,833
16.513 1 25 0,8
22.138 1 24 0,767
26.791 1 23 0,733
27.144 1 22 0,7
27.847 1 21 0,667
28.613 1 20 0,633
31.224 1 19 0,6
36.229 1 18 0,567
38.590 1 17 0,533
39.580 1 16 0,5
40.278 1 15 0,467
41.324 1 14 0,433
44.540 1 13 0,4

Tabela 1.3.2: Estimativa de Kaplan-Meier para os dados das válvulas.

O gráfico da função de confiabilidade estimada $\widehat{R}(t)$ obtida a partir do estimador de Kaplan-Meier é apresentado na Figura 3.2.1. Note que este gráfico não atinge o valor 0, isto sempre ocorrerá quando o maior tempo observado for censurado.

Figura1.3.2

Figura 1.3.2: Estimador de Kaplan-Meier para a função de confiabilidade.

Assim como a tabela de vida, o estimador de Kaplan-Meier está sujeito a variação amostral, o que torna desejável ter uma idéia da precisão destes estimadores.

Uma estimativa para a variância do estimador de Kaplan-Meier é dada pela fórmula de Greenwood

$$\widehat{Var}(\widehat{R}(t)) = \widehat{R}(t)^ 2\left[ \dfrac{d_1}{n_1(n_1 - d_1)} + \dfrac{d_2}{n_2(n_2 - d_2)} + \ldots + \dfrac{d_j}{n_j(n_j - d_j)} \right] \qquad \tag{3.2.4}$$

sendo $t_{j}$ o maior tempo de falha menor ou igual que t.

A partir do cálculo deste valor, um intervalo de confiança aproximado para R(t) com 95% de confiança é dado por

$$\widehat{R}(t) \pm 1,96 \sqrt{\widehat{Var}(\widehat{R}(t))} \tag{3.2.5}$$

Por exemplo, a estimativa da variância de $\widehat{R}(13.000)$ é obtida a partir de (3.2.4) como

$$\widehat{Var}(\widehat{R}(13.000)) = (0,9)^2 \ast \left(\dfrac{1}{30(29-1)} + \dfrac{1}{29(29-1)} + \dfrac{1}{28(28-1)} \right)$$

$$= 0,81 \ast \left( \dfrac{1}{870} + \dfrac{1}{812} + \dfrac{1}{756} \right)$$

$$= 0,81 \ast 0,0037 = 0,003$$

Extraindo a raiz quadrada, temos que o desvio padrão de $\widehat{R}(13.000)$ é dado por

$$\widehat{\sigma}(\widehat{R}(13.000)) = \sqrt{\widehat{Var}(\widehat{R}(13.000))} = \sqrt{0,003}= 0,0548$$

Portanto, os limites do intervalo de confiança 95% para $\widehat{R}(13.000)$ são dados por

$$LI = \widehat{Var}(\widehat{R}(13.000)) - 1,96\sqrt{\widehat{Var}(\widehat{R}(t))} = 0,9 - 1,96 \ast 0,0548 = 0,7926$$

$$LS = \widehat{Var}(\widehat{R}(13.000)) + 1,96\sqrt{\widehat{Var}(\widehat{R}(t))} = 0,9 + 1,96 \ast 0,0548 = 1,0074$$

Como o valor obtido para o limite superior é maior que 1, adotamos neste caso o valor 1. Portanto, o intervalo de confiança obtido para $\widehat{R}(13.000)$ é dado por

$$IC_{95 \char37}(\widehat{R}(13.000)) = [0,7926;~1]$$

Procedendo da mesma maneira para todos os tempos de falha, obtemos os resultados da Tabela 1.3.3.

Tempo de falha Confiabilidade Desvio padrão Limite Inferior Limite Superior
5.625+ 0,967 0,033 0,902 1
11.223+ 0,933 0,045 0,844 1
12.128+ 0,9 0,055 0,793 1
13.566+ 0,867 0,062 0,745 0,988
14.921+ 0,833 0,068 0,7 0,967
16.513+ 0,8 0,073 0,657 0,943
22.138+ 0,767 0,077 0,615 0,918
26.791+ 0,733 0,081 0,575 0,892
27.144+ 0,7 0,084 0,536 0,864
27.847+ 0,667 0,086 0,498 0,835
28.613+ 0,633 0,088 0,461 0,806
31.224+ 0,6 0,089 0,425 0,775
36.229+ 0,567 0,09 0,389 0,744
38.590+ 0,533 0,091 0,355 0,712
39.580+ 0,5 0,091 0,321 0,679
40.278+ 0,467 0,091 0,288 0,645
41.324+ 0,433 0,09 0,256 0,611
44.540+ 0,4 0,089 0,225 0,575

Tabela 1.3.3: Tabela de confiabilidades.

Entretanto, para valores extremos de $\widehat{R}(t)$ (próximo de 0 ou 1), este intervalo de confiança pode apresentar um limite inferior negativo ou um limite superior maior do que 1. Este problema pode ser resolvido utilizando uma transformação para R(t) dada por

$$U(t) = \ln[-\ln(R(t))] \tag{3.2.6}$$

Portanto, uma estimativa para U(t) é dada por

$$\widehat{U}(t) = \ln[-\ln(\widehat{R}(t))] \tag{3.2.7}$$

cuja variância é dada por

$$\widehat{Var}((\widehat{U}(t)))=\dfrac{\dfrac{d_1}{n_1(n_1-d_1)}+\cdots+\dfrac{d_j}{n_j(n_j -d_j)}}{ \left[\ln(\dfrac{n_1-d_1}{n_1})+\cdots+\ln(\dfrac{n_j-d_j}{n_j}) \right]^2} \tag{3.2.8}$$

Portanto, um intervalo aproximado com 95% de confiança para U(t) é obtido como

$$\widehat{U}(t) \pm 1,96~\sqrt{\widehat{Var}(\widehat{U}(t))} \tag{3.2.9}$$

Consequentemente, o correspondente intervalo de confiança aproximado com 95% para R(t) é dado por

$$\widehat{R}(t)^{\exp \left( \pm 1,96~\sqrt{\widehat{Var}(\widehat{U}(t))} \right)} \tag{3.2.10}$$

cujos limites estão sempre no intervalo [0,1].

Para o cálculo do intervalo 95% para R(13.000) do nosso exemplo, temos que a variância de $\widehat{U}(13.000)$ é obtida a partir de (3.2.8) como

$$\widehat{Var}(\widehat{U}(13.000))=\dfrac{\dfrac{1}{30(30-1)}+\dfrac{1}{29(29-1)}+\dfrac{1}{28(28-1)}}{\left[ \ln(\dfrac{30-1}{30} )+\ln(\dfrac{29-1}{29})+\ln(\dfrac{28-1}{28})\right]^2}$$

$$= \dfrac{0,0037}{0,0111} = 0,3333$$

Logo, pela equação (3.2.10) temos que os limites do intervalo de confiança 95% para R(13.000) são dados por

$$LI = 0,9^{\exp(1,96 \times \sqrt{0,3333} )} = 0,9^{3,1004} = 0,7213$$

$$LS = 0,9^{\exp(-1,96 \times \sqrt{0,3333} )} = 0,9^{0,3225} = 0,9666$$

Resultando portanto no intervalo [0,7213; 0,9666] para R(13.000) com confiança de 95%, contrastando com o intervalo [0,7926; 1,0074] obtido pela fórmula (3.2.4).

Justificativa da Fórmula de Greenwood

A ideia principal consiste na aplicação do método delta. Para uma função suave $f$, temos que

$$ f(X) \approx f(c) + f^{\prime} (c) (X - c)$$

no qual $f^{\prime}$ é a derivada de $f$ e $c$ uma constante “próxima” ao valor esperado de $X$. Com isso, obtemos que

$$\mathbb{E} [ f(X) ] \approx f(c) + f^{\prime}(c) ( \mathbb{E}(X) - c )$$

e

$$ Var [f(X) ] \approx [ f^{\prime} (c) ]^2 Var(X). $$

Para derivarmos a fórmula tradicional de Grennwood utilizaremos $f(x) = \ln (x)$. Ao aplicarmos o logaritmo natural no estimador de Kaplan-Meier, obtemos

$$ \ln \widehat{R}(t) = \sum_{t_j \leq t} \ln (1- \frac{d_j}{n_j} ).$$

A distribuição condicional de $d_j$ dado que temos $n_j$ sobre risco em $t_j$ é binomial com parâmetros $p_j$ e $n_j$. Desta forma, temos que $\mathbb{E} (d_j \mid n_j) = n_j p_j$ e $Var (d_j \mid n_j) = n_j p_j (1-p_j)$. Através do método delta com $f(x) = \ln (x)$ e $c = p_j$, concluímos que

$$ \ln \widehat{R}(t) = \sum_{t_j \leq t } \left( \ln(1-p_j) - \frac{1}{1-p_j} \left(\frac{d_j}{n_j} -p_j \right) \right)$$

3.3 - Usando as estimativas da Função de Confiabilidade R(t)

A partir dos resultados apresentados na Tabela 1.3.3, obtidos a partir do método de Kaplan-Meier, é possível responder às questões 2 e 3 do Exemplo 2.1, estabelecido no início do tópico Análise do Tempo de Falha. Entretanto, antes de respondermos a estas perguntas vamos discutir uma dificuldade associada aos estimadores não-paramétricos. O estimador de Kaplan-Meier é constante em intervalos e decresce aos saltos em pontos específicos, conforme observamos nas Figuras 1.3.3 e 1.3.4. Essa característica traz dificuldades na determinação dos percentis e dos valores da função de confiabilidade por esses métodos.

Por exemplo, considere o problema de estimar o percentil 10% do tempo de vida de um certo produto, isto é, determinar o tempo $\hat{t}_{0,1}$ para o qual a confiabilidade estimada $\widehat{R}(\hat{t}_{0,1})$ é igual a 0,90. Para a função de confiabilidade (a) da Figura 1.3.3, existem inúmeros valores possíveis para $\hat{t}_{0,1}$ que satisfazem $\widehat{R}(\hat{t}_{0,1}) = 0,9$ (intervalo $(10, 20]$). Considerando agora a função de confiabilidade (b) da Figura 1.3.4, não existe nenhum valor de $\hat{t}_{0,1}$ para o qual $\widehat{R}(\hat{t}_{0,1}) = 0,9.$

Figura 1.3.3

Figura 1.3.3: Função de confiabilidade (a).

Figura 1.3.4

Figura 1.3.4: Função de confiabilidade (b).

Para o caso da função de confiabilidade (b), Figura 1.3.4, uma solução prática para encontrar o valor de $\hat{t}_{0,1}$ é fazer uma interpolação linear entre os dois pontos mais “próximos”, como mostra a Figura 1.3.5. Este método consiste em aproximar a função de confiabilidade pela função obtida pela reta pontilhada.

Figura 1.3.5

Figura 1.3.5: Interpolação linear.

No caso do problema dado anteriormente, devemos encontrar $\hat{t}_{0,1}$ para o qual a reta pontilhada tenha valor igual a 0,90. Considere o valor da reta pontilhada no ponto x como sendo y(x). Observe que o valor da reta pontilhada no ponto 0 vale 1 e no ponto 10 vale 0,80, isto é,

$$y(0) = 1 \qquad \qquad y(10) = 0,80$$

Portanto, como $\hat{t}_{0,1}$ deve ser tal que $y(\hat{t}_{0,1}) = 0,90$, temos que a inclinação da reta pontilhada é obtida a partir da equação

$$\dfrac{y(10) - y(0)}{10 - 0} = \dfrac{y(\hat{t}_{0,1}) - y(0)}{\hat{t}_{0,1} - 0}~\Longrightarrow~\dfrac{0,8 - 1}{10 - 0} = \dfrac{0,9 - 1}{\hat{t}_{0,1} - 0}$$

que nos dá como resultado $\hat{t}_{0,1} = 5.$

Exemplo 3.3.1

A questão 2 do Exemplo 2.1 indaga sobre a fração de defeituosos esperada antes que se atinja o tempo de garantia, que é de dois anos ou de 6.000 ciclos.

Podemos notar pela Figura 1.3.1, do Exemplo 3.1.1, que o valor da confiabilidade no tempo 6.000 é igual a 1. Essa estimativa não é realista, pois é esperado que exista uma chance de uma peça falhar antes de 6.000 ciclos. Neste caso, podemos aplicar novamente uma interpolação linear.

Ainda, pelos cálculos temos que $\widehat{R}(0) = 1$ e $\widehat{R}(10.000) = 0,967.$ Queremos encontrar o valor de $\widehat{R}(6).$ Para isso, basta resolver a equação

$$\dfrac{0,967-1}{10-0} = \dfrac{\widehat{R}(6)-1}{6-0}$$

o que nos leva a $\widehat{R}(6) = 0,9802.$ Portanto, concluímos que em um lote com 1.000 itens, espera-se que aproximadamente 20 itens (2%) apresentem defeitos nos dois primeiros anos de vida.

A questão 3 diz respeito ao quantil 10%, ou seja, o valor $t_{0,1}$ tal que a confiabilidade $R(t_{0,1}$) = 0,9. Considerando ainda os resultados obtidos no Exemplo 3.1.1, vamos usar uma interpolação linear para encontrar uma estimativa $\hat{t}_{0,1}$ de $t_{0,1}$. Sabendo que $\widehat{R}(10.000) = 0,967$ e $\widehat{R}(20.000) = 0,8,$ o valor $\hat{t}_{0,1}$ tal que $\widehat{R}(\hat{t}_{0,1}) = 0,9$ deve estar entre 10.000 e 20.000 ciclos. Usando uma interpolação linear, temos que o valor de $\hat{t}_{0,1}$ é obtido a partir da equação

$$\dfrac{\widehat{R}(20.000)-\widehat{R}(10.000)}{20.000-10.000}=\dfrac{\widehat{R}(\hat{t}_{0,1}) -\widehat{R}(10.000)}{t_{0,1}-10.000}$$

$$\dfrac{0,8-0,967}{20.000-10.000} = \dfrac{0,9-0,967}{t_{0,1}-10.000}$$

que leva a solução $\hat{t}_{0,1} = 14.036$ ou 15.000 ciclos, isto é, espera-se que 10% das válvulas falhem antes de atingir 14.036 ciclos.

Considerando agora o estimador de Kaplan-Meier, podemos ver pelos resultados da Tabela 3.2.1 (sem usar interpolação) que $\hat{t}_{0,1} = 12.128 .$ Para este estimador (Kaplan-Meier) desejamos construir um intervalo de confiança para o quantil $t_{0,1}$ e para isso devemos conhecer a variância de $\hat{t}_{0,1}.$

Dessa forma, consideremos o caso geral em que $t_{p}$ é o quantil (100×p)% e $\hat{t}_{p}$ o estimador para $t_{p}$, $0~<~p~<~1$, obtido a partir do método descrito acima. A variância para grandes amostras de $\hat{t}_{p}$ é dada por

$$Var(\hat{t_{p}})=\dfrac{Var(\widehat{R}(\hat{t_{p}}))}{f^{2}(\hat{t_{p}})}~~ \tag{3.3.1}$$

em que

$$f(\hat{t_{p}})=\dfrac{\widehat{R}(\hat{s}_{p})-\widehat{R}(\hat{i}_{p})}{\hat{i}_{p}-\hat{s}_{p}}$$

$$\hat{s_{p}}=\max(t_{j}~:~\widehat{R}(t_{j})~>~p,~ )$$

$$\hat{i_{p}}=\min(t_{j}~:~\widehat{R}(t_{j})~<~p,~ )$$

Portanto, um intervalo de confiança 95% para $t_{p}$ é dado por

$$\hat{t}_p \pm 1,96 \ast \sqrt{Var(\hat{t}_p)}$$

Voltando ao nosso exemplo, temos que $\hat{t}_{0,1}=12.128,~\hat{s}_{0,1}=11.223,~\hat{i}_{0,1}=13.566.$ Logo,

$$f(\hat{t}_{0,1})=\dfrac{0,933-0,867}{13.566-11.223}=0,0000282$$

Portanto, pela equação (3.3.1) temos que

$$Var(\hat{t}_{0,1})=\dfrac{(0,0547723)^2}{(0,0000282)^2}$$

O intervalo de 95% para $t_{0,1}$ tem como limites os valores

$$LI = 12.128-1,96\times\left(\dfrac{0,0547723}{0,0000282}\right) = 8.321,131$$

$$LS = 12.128+1,96\times\left(\dfrac{0,0547723}{0,0000282}\right) = 15.934,87$$

Portanto, o intervalo de confiança 95% para o quantil 10%, $t_{0,1}$, da distribuição do tempo de vida de válvulas é dado por [8.321; 15.935].

3.4 - Estimando o MTTF ou MTBF

Em estudos de durabilidade frequentemente estamos interessados em saber o tempo médio até a falha, denotado por MTTF ou MTBF (siglas do inglês, Mean Time to Failure e Mean Time Between Failure, respectivamente). Entretanto, estas quantidades nem sempre são bem estimadas na presença de censuras, usando estimadores não-paramétricos. Pode-se mostrar que o MTTF é igual a área (integral) sob a função de confiabilidade. Portanto, uma estimativa para o MTTF pode ser obtida calculando a área sob a curva de confiabilidade estimada pelo método de Kaplan-Meier. Como esta curva é uma função escada, esta área é simplesmente a soma da áreas de retângulos. Pode-se mostrar que o MTTF é igual a área (integral) sob a função de confiabilidade. Usando o estimador de Kaplan-Meier com os tempos ordenados de falha $t_1~<~t_2~<~\cdots~<~t_k,$ a estimativa do MTTF é dada por

$$\widehat{\hbox{MTTF}}= t_1\times 1 + (t_2 - t_1)\times \widehat{R}(t_1^+) + \cdots + (t_k - t_{k-1}) \times \widehat{R}(t_{k-1}^+).$$

Um problema surge se o maior tempo observado é uma censura. Isto acontece com frequência em testes de durabilidade. Neste caso, a função de confiabilidade estimada não atinge o valor zero e o valor do MTTF fica subestimado. Nestes casos, tal estimativa deve ser interpretada com bastante cuidado ou até mesmo evitada. Uma outra medida de posição, a mediana, pode ser usada no seu lugar. A mediana é o tempo para o qual a probabilidade de uma unidade falhar antes de atingir este tempo é de 50%, ou seja, a mediana é o quantil 50%. Ambas as medidas são de tendência central, representando um valor típico da distribuição do tempo de vida do produto. No entanto, a estimativa da mediana pode ser facilmente calculada a partir da função de confiabilidade estimada.

No caso do Exemplo 2.1, o número de ciclos mediano das válvulas é facilmente estimado usando o método Kaplan-Meier, cujo valor é de 39.580 ciclos. A mediana só não é estimada se o número de censuras for maior que o de falhas. Uma outra forma de estimar o MTTF será apresentada nas seções seguintes com o uso de modelos probabilísticos paramétricos para o tempo de vida.

3.5 - Comparação entre os Estimadores

Ambos os estimadores não-paramétricos estudados até aqui fornecem respostas às perguntas de interesse. Entretanto, os valores obtidos podem ser diferentes. Diante disso, introduzimos nesse tópico uma comparação entre esses estimadores, discutindo suas principais propriedades.

A principal diferença entre os estimadores Tabela de vida e Kaplan-Meier está no número de intervalos considerados. Os intervalos usados pelo estimador de Kaplan-Meier são determinados a partir dos tempos de falha distintos, enquanto que na Tabela de vida esses intervalos são escolhidos diretamente pelo pesquisador. O estimador de Kaplan-Meier utiliza, em geral, um número maior de intervalos do que o estimador Tabela de vida.

Uma característica importante da Tabela de vida é a influência da escolha dos intervalos nas estimativas obtidas. Para o Exemplo 2.1 estudado anteriormente, foram usados 5 intervalos pelo método da Tabela de vida e 19 intervalos pelo método Kaplan-Meier. É natural esperar que quanto maior o número de intervalos utilizados melhor será a descrição da distribuição do tempo de falha.

Então, por que não utilizar na Tabela de vida um número de intervalos igual ou maior do que o método de Kaplan-Meier? Na verdade, se isso ocorrer na presença de um esquema de censura do tipo I ou II, as estimativas obtidas pela Tabela de vida e pelo método de Kaplan-Meier serão idênticas. Por exemplo, considerando novamente o Exemplo 2.1, quando aplicamos o método da Tabela de vida escolhendo os mesmos 19 intervalos de tempo considerados pelo método de Kaplan-Meier, a estimativa da função de confiabilidade é exatamente a mesma. Entretanto, se o esquema de censura é aleatório, as estimativas não coincidem.

Historicamente, o método da Tabela de vida foi proposto por demógrafos e atuariais no início do século passado e usado em geral para grandes amostras, como por exemplo dados provenientes de censos demográficos. No caso de amostras grandes, a escolha dos intervalos tem pouca influência na estimativa da função de confiabilidade. Esse estimador também é adequado em situações nas quais os tempos de falha não são completamente conhecidos, sabe-se apenas em quais intervalos ocorrem. No entanto, em teste de durabilidade de produtos não é comum o uso de amostras grandes, principalmente devido aos custos envolvidos. Dessa forma, para o caso de amostras pequenas ou médias, existe uma evidência empírica a respeito da superioridade do estimador de Kaplan-Meier em relação ao estimador da Tabela de vida.

Também para o caso de grandes amostras, alguns autores mostraram que o estimador de Kaplan-Meier é superior ao estimador da Tabela de vida. Por exemplo, o estimador de Kaplan-Meier é não viciado para a função de confiabilidade, com um vício que tende a zero à medida que o tamanho amostral cresce, enquanto que o estimador da Tabela de vida é viciado. Portanto, o estimador de Kaplan-Meier é o mais indicado quando estamos tratando dados provenientes de testes de durabilidade, não importando o tamanho da amostra.

Exercício 3.5.1

Para avaliar a confiabilidade do freio de um avião foram selecionadas 45 unidades que foram colocadas em teste até que 15 freios falhassem, sendo registrado o número de ciclos até a falha. Esses testes (rápidos) são realizados quando estamos interessados em avaliar o tempo de falha dos primeiros anos de uso. Para testar o freio foi montado um dispositivo que simula sua utilização em condições reais. Os dados são apresentados na Tabela 1.3.4.

Número de falhas Censura Tempo da falha ou censura
1 F 19
2 F 43
1 F 148
1 F 169
1 F 171
1 F 205
1 F 232
1 F 248
1 F 250
1 F 263
1 F 271
1 F 282
1 F 290
1 F 347
1 F 349
1 F 398
1 F 477
1 F 514
1 F 595
1 F 603
1 F 662
2 F 700
1 F 706
2 F 709
1 F 763
1 F 777
1 F 869
15 C 869

Tabela 1.3.4: Número de ciclos até a falha de freios de avião.

O fabricante estima que o avião realiza 6 pousos diários, 6 dias por semana. Qual a probabilidade de um freio não falhar antes de 100 dias de uso? Qual é o número esperado de ciclos para o qual 25% dos freio falham?

Usando o estimador de Kaplan-Meier, complete a tabela:

$ t_{j} $ $ d_{j} $ $ n_{j} $ $ \widehat{R}(t_{j}^{+}) $
19 1 45 0,977778
43 2 44 0,933333
148 1 42 0,911111
169 1 41 0,888889
171 1
205 1
232 1
248 1
250 1
263 1
271 1
282 1
290 1
347 1
349 1
398 1
477 1
514 1
595 1
603 1
662 1
700 2
706 1
709 2
763 1
777 1
869 1

Tabela 1.3.5: Cálculo do estimador de Kaplan-Meier (a completar)