3.7 Efeito da normalidade dos dados no cálculo da capacidade
Quando a normalidade dos dados não é detectada, buscamos por um método que melhor se ajusta aos dados. Quando estes procedimentos não são realizados e os dados são assumidos com distribuição normal (mesmo não tendo) os resultados obtidos para os índices de capacidade/performance são diferentes, muitas vezes mascarados e também absurdos. A seguir ilustramos esse efeito da normalidade nos cálculos da capacidade/performance do processo através de um exemplo.
Exemplo 7.1
Neste exemplo apresentamos os dados referentes ao controle de torque aplicado por uma parafusadeira na montagem de chacis de ônibus. A cada uma hora foram inspecionadas cinco peças com um sensor de torque. Para este caso vamos considerar as seguintes especificações: $LIE = 480$ e $LSE = 720$.
| Coleta de Dados | Valores Determinados | ||||||||
|---|---|---|---|---|---|---|---|---|---|
| Subgrupo | X1 | X2 | X3 | X4 | X5 | $\overline{X}$ | Xmáx | Xmín | R |
| 1 | 623 | 589 | 618 | 620 | 613 | 612,6 | 623 | 589 | 34 |
| 2 | 618 | 604 | 594 | 618 | 606 | 608 | 618 | 594 | 24 |
| 3 | 637 | 584 | 608 | 608 | 608 | 609 | 637 | 584 | 53 |
| 4 | 618 | 635 | 618 | 630 | 608 | 621,8 | 635 | 608 | 27 |
| 5 | 587 | 606 | 604 | 616 | 608 | 604,2 | 616 | 587 | 29 |
| 6 | 608 | 601 | 601 | 606 | 580 | 599,2 | 608 | 580 | 28 |
| 7 | 599 | 589 | 664 | 618 | 728 | 639,6 | 728 | 589 | 139 |
| 8 | 584 | 637 | 599 | 628 | 606 | 610,8 | 637 | 584 | 53 |
| 9 | 584 | 606 | 587 | 584 | 620 | 596,2 | 620 | 584 | 36 |
| 10 | 623 | 632 | 604 | 580 | 601 | 608 | 632 | 580 | 52 |
| 11 | 589 | 611 | 599 | 592 | 589 | 596 | 611 | 589 | 22 |
| 12 | 592 | 726 | 580 | 589 | 618 | 621 | 726 | 580 | 146 |
| 13 | 604 | 613 | 599 | 611 | 599 | 605,2 | 613 | 599 | 14 |
| 14 | 611 | 596 | 611 | 580 | 613 | 602,2 | 613 | 580 | 33 |
| 15 | 589 | 709 | 592 | 625 | 687 | 640,4 | 709 | 589 | 120 |
| 16 | 628 | 592 | 608 | 637 | 656 | 624,2 | 656 | 592 | 64 |
| 17 | 606 | 584 | 604 | 592 | 620 | 601,2 | 620 | 584 | 36 |
| 18 | 613 | 604 | 618 | 592 | 584 | 602,2 | 618 | 584 | 34 |
| 19 | 596 | 587 | 613 | 618 | 592 | 601,2 | 618 | 587 | 31 |
| 20 | 581 | 604 | 580 | 611 | 613 | 597,8 | 613 | 580 | 33 |
| 21 | 608 | 623 | 604 | 584 | 606 | 605 | 623 | 584 | 39 |
| 22 | 616 | 599 | 616 | 714 | 611 | 631,2 | 714 | 599 | 115 |
| 23 | 632 | 618 | 611 | 584 | 592 | 607,4 | 632 | 584 | 48 |
| 24 | 620 | 587 | 580 | 613 | 608 | 601,6 | 620 | 580 | 40 |
| 25 | 608 | 582 | 599 | 604 | 604 | 599,4 | 608 | 582 | 26 |
| $\overline{\overline{X}}=609,816$ | $\overline{R}=51,04$ |
Tabela 3.7.1: Dados de torque aplicados a parafusos por uma parafuseira.
Vamos verificar a estabilidade do processo através do gráfico de controle abaixo
Figura 3.7.1: Gráficos $\overline{X}$ e $R.$
Podemos notar que o processo está fora de controle, pois existem pontos a mais de 3 desvios padrão da linha central em ambos os gráficos. Observemos também os pgráficos QQ-plot abaixo e verificamos que a distribuição normal não se ajusta aos dados, o que pode ser comprovado pelo p-valor associado ao teste de Anderson-Darling.
| Distribuições | Estatística | P-Valor |
|---|---|---|
| Normal(mu = 609.82, sigma = 27) | 6.7047 | 0 |
| Weibull(Forma = 16.1302, Escala = 624.299) | 15.2221 | 0.01 |
| Log-Normal(log(mu) = 6.41227, log(sigma) = 0.0414417) | 5.6595 | 0 |
Tabela 3.7.2: Teste de Anderson-Darling
Figura 3.7.2: Gráfico QQ-plot
No entanto, vamos fazer a análise da capacidade/performance do processo supondo normalidade.
Assim, para a variabilidade a curto prazo temos
$$\widehat{\sigma} = \dfrac{\overline{R}}{d_2} = \dfrac{51,04}{2,326} = 21,9433$$
sendo $d_{2}$ = 2,326 (para n = 5) tabelado no Apêndice.
$$C_p = \dfrac{LSE - LSI}{6\widehat{\sigma}} = \dfrac{720 - 480}{131,66} = 1,8229$$
$$C_{pk} = \min\left\lbrace\dfrac{LSE - \overline{\overline{X}}}{3\widehat{\sigma}}~;~\dfrac{\overline{\overline{X}} - LIE}{3\widehat{\sigma}}\right\rbrace$$
$$C_{pk} = \min\left\lbrace\dfrac{720 - 609,816}{65,8299}~;~\dfrac{609,816 - 480}{65,8299}\right\rbrace$$
$$C_{pk} = \min\lbrace1,6738~;~1,9720\rbrace = 1,6738$$
A pior situação, que é verificada quando o processo gera a maior porcentagem de defeitos, é avaliada pelo $P_{pk}$ com desvio padrão s = 26,6047.
$$PPI = \dfrac{\overline{\overline{X}} - LIE}{3 \ast s} = \dfrac{609,816 - 480}{3 \ast 26,6047} = \dfrac{129,816}{79,8141} = 1,6265$$
$$PPS = \dfrac{LSE - \overline{\overline{X}}}{3 \ast s} = \dfrac{720 - 609,816}{3 \ast 26,6047} = \dfrac{110,184}{79,8141} = 1,3805$$
Então,
$$P_p = \dfrac{PPI + PPS}{2} = \dfrac{1,3805 + 1,6265}{2} = 1,5035$$
$$P_{pk} = \min\lbrace PPI; PPS \rbrace = \min \lbrace 1,3805;~1,6265 \rbrace = 1,3805$$
A seguir temos os resultados obtidos pelo Software Action para esse exemplo.
| Valor | |
|---|---|
| Amostra: | 125 |
| Limite Inferior | 480 |
| Limite Superior | 720 |
Tabela 3.7.3: Especificações (dados normais)
| Estimativa | |
|---|---|
| Média | 609.816 |
| Desvio Padrão (Curto prazo) | 21.9439 |
| Desvio Padrão (Longo prazo) | 26.6047 |
Tabela 3.7.4: Estimativas (dados normais)
| Índices de Performance (Variabilidade Total) | |
|---|---|
| PP | 1.5035 |
| PPI | 1.6265 |
| PPS | 1.3805 |
| PPK | 1.3805 |
Tabela 3.7.5: Índices de Performance (Longo prazo) (dados normais)
| Índices de Capacidade (Variabilidade Inerente) | |
|---|---|
| CP | 1.8228 |
| CPI | 1.9719 |
| CPS | 1.6737 |
| CPK | 1.6737 |
Tabela 3.7.6: Índices de Capacidade(Curto prazo) (dados normais)
| Índices Observados | |
|---|---|
| PPM < LIE | 0 |
| PPM > LSE | 16000 |
| PPM Total | 16000 |
Tabela 3.7.7: Índices Observados (dados normais)
| Índices Esperados (Variabilidade Total) | |
|---|---|
| PPM < LIE | 0.532 |
| PPM > LSE | 17.2509 |
| PPM Total | 17.7828 |
Tabela 3.7.8: Índices Esperados (Longo prazo) (dados normais)
| Índices Esperados (Variabilidade Inerente) | |
|---|---|
| PPM < LIE | 0.0017 |
| PPM > LSE | 0.2568 |
| PPM Total | 0.2584 |
Tabela 3.7.9: Índices Esperados (Curto prazo) (dados normais)
Figura 3.7.3: Gráfico da análise de performance do processo supondo dados normais.
Agora, vamos fazer a análise de capacidade/performance do processo de maneira correta e comparar os resultados com os obtidos acima.
Os resultados de capacidade encontrados via a distribuição normal não fazem sentido, pois temos um $C_{pk}$ de 1,67 com peças refugadas no conjunto de dados. Por isso, precisamos de uma técnica apropriada para este caso. Ao observamos o gráfico QQ-plot da Figura 3.7.2, vemos que nenhuma distribuição testada (Normal, Weibull ou lognormal) se ajusta aos dados. Portanto, vamos fazer uma análise de performance do processo utilizando o método do núcleo (Kernel), que é um método não paramétrico adequado para o conjunto de dados em estudo.
A seguir temos os resultados obtidos pelo Software Action para esse caso.
| Valor | |
|---|---|
| Amostra: | 125 |
| Limite Inferior | 480 |
| Limite Superior | 720 |
Tabela 3.7.10: Especificações
| Parâmetros | Valor |
|---|---|
| Média: | 609.816 |
| Desvio Padrão: | 26.60475 |
Tabela 3.7.11: Estimativas
| Índices de Performance | |
|---|---|
| PP | 1.4125 |
| PPI | 3.1595 |
| PPS | 0.8751 |
| PPk | 0.8751 |
Tabela 3.7.12: Índices de Performance
| Índices Observados | |
|---|---|
| PPM > LSE | 16000 |
| PPM < LIE | 0 |
| PPM Total | 16000 |
Tabela 3.7.13: Índices Observados
| Índices Esperados | |
|---|---|
| PPM > LSE | 15462.9333940826 |
| PPM < LIE | 0 |
| PPM Total | 15462.9333940826 |
Tabela 3.7.14: Índices Esperados
Figura 3.7.4: Gráfico da análise de performance do processo - método do núcleo.
A Tabela 3.7.15 faz uma comparação ilustrativa dos índices de performance mostrando que, caso seja assumida distribuição normal para os dados quando eles, de fato, não seguem essa distribuição podemos obter resultados equivocados.
| Índices de Performance | Normal | Método do núcleo |
|---|---|---|
| Pp | 1,503 | 1,412 |
| PPI | 1,626 | 3,159 |
| PPS | 1,381 | 0,875 |
| Ppk | 1,381 | 0,875 |
Tabela 3.7.15: Comparação dos índices de performance.