2.7 Gráficos de Controle Multivariados
Um gráfico de controle multivariado mostra como as variáveis conjuntamente influenciam o processo. São utilizados quando há correlação nas variáveis em estudo.
Uma desvantagem deste tipo de gráfico refere-se a uma dificuldade maior quanto à sua interpretação, uma vez que os pontos fora de controle não revelam especificamente qual ou quais variáveis, ou a combinação delas, causam o problema.
Então, para analisar dados multivariados um procedimento que pode ser utilizado é verificar a correlação entre eles e então trabalhar apenas com aquelas variáveis que são correlacionadas. Com isso, podemos plotar em um gráfico de controle com os valores da estatística T² de Hotelling e da variância generalizada para essas variáveis. Esse procedimento é definido adiante.
A seguir vamos discutir a construção dos gráficos de controle multivariados.
Para a construção desses gráficos vamos considerar dois casos: um caso em que temos observações individuais (não se tem réplicas) e outro caso em que temos réplicas para cada observação.
a) 7.1 - Gráficos de controle multivariados para observações individuais
A seguir vamos apresentar a construção dos gráficos de controle multivariados para observações individuais, ou seja, para as observações que não possuem réplicas.
Para introduzir e ilustrar esse conceito vamos considerar dados dispostos de maneira geral como na Tabela 2.7.1.
| Variáveis | ||||
|---|---|---|---|---|
| Amostra | $ X_1 $ | $ X_2 $ | $ \cdots $ | $ X_p $ |
| 1 | 1 | 2 | 3 | 4 |
| 2 | 1 | 2 | 3 | 4 |
| 3 | 1 | 2 | 3 | 4 |
| $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ |
| m | $ X_{1m} $ | $ X_{2m} $ | $ \cdots $ | $ X_{pm} $ |
| Média | $ \overline{X}_1 $ | $ \overline{X}_2 $ | $ \cdots $ | $ \overline{X}_p $ |
| Desvio padrão amostral | $ s_1 $ | $ s_2 $ | $ \cdots $ | $ s_p $ |
Tabela 2.7.1: Entrada de dados
Gráfico de controle T² de Hotelling
Para o cálculo da estatística T² de Hotelling devemos seguir os passos abaixo.
- Calcular a média para cada variável
$$\overline{X}_1, \overline{X}_2, \ldots, \overline{X}_p$$
- Calcular as variâncias e covariâncias amostrais
$$S_1^2, \ldots, S_ik, \ldots, S_p^2$$
- Calcular a estatística T² para cada amostra
$$T^2 = (X_i - \overline{X})^{\prime} S^{-1}(X_i - \overline{X})$$
em que
- p é o número de variáveis
- m é o número de amostras
- S é a matriz de covariância amostral
- $ S ^ {-1} $ é a matriz inversa de covariância amostral
Assim, os limites de controle são dados por
$$LIC = \dfrac{(m-1)^2}{m}B_{\left(\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}$$
$$LSC = \dfrac{(m-1)^2}{m}B_{\left(1-\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}$$
em que
$$B_{\left(\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)} \qquad \hbox{e} \qquad B_{\left(1-\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}$$
indicam os quantis correspondentes à distribuição Beta.
A linha central do gráfico de controle é definido utilizando-se a mediana (isto é, o quantil de 50%) da distribuição Beta correspondente, indicado por
$$LC = B_{\left(0,50;~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}$$
Gráfico de controle para a variância generalizada
O procedimento utilizado para construir os gráficos de controle para a variância generalizada é padronizar os dados utilizando o vetor de médias e a matriz de covariâncias amostrais. A padronização é feita da seguinte forma $$Z_{ij} = \dfrac{ X_{ij} - \overline{X}_i}{S_i}$$
Desta forma, teremos uma matriz conforme apresentado no quadro a seguir
| Variáveis | |||||
|---|---|---|---|---|---|
| Amostra | $ Z_1 $ | $ Z_2 $ | $ \cdots $ | $ Z_p $ | Desvio padrão amostral |
| 1 | $ Z_{11} $ | $ Z_{21} $ | $ \cdots $ | $ Z_{p1} $ | $ s_1 $ |
| 2 | $ Z_{12} $ | $ Z_{22} $ | $ \cdots $ | $ Z_{p2} $ | $ s_2 $ |
| 3 | $ Z_{13} $ | $ Z_{23} $ | $ \cdots $ | $ Z_{p3} $ | $ s_3 $ |
| $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ |
| m | $ Z_{1m} $ | $ Z_{2m} $ | $ \cdots $ | $ Z_{pm} $ | $ s_m $ |
Tabela 2.7.2: Matriz para padronização
Com os dados normalizados podemos construir um gráfico de controle utilizando o mesmo procedimento usado na construção do gráfico de controle usual do desvio padrão $ S $.
Dessa froma, os limites de controle são dados por
- Limite superior de controle:
$$LSC = B_4 \ast \overline{S}$$
- Linha Central:
$$LC = \overline{S}$$
- Limite inferior de controle:
$$LIC = B_3 \ast \overline{S}$$
Exemplo 7.1.1:
Temos um molde de areia onde peças de ferro são moldadas. Neste caso, nossas variáveis de interesse são a compatibilidade, o coeficiente de RCV1 e a plasticidade. Os dados são apresentados na tabela a seguir.
| Corrida | Peça | Qtde Prod | Qtde Refugo | Compactabilidade | RCV1 | Plasticidade |
|---|---|---|---|---|---|---|
| E188 | M20700300 | 6288 | 182 | 36,5 | 22,026 | 28,87 |
| E189 | M20900200 | 655 | 128 | 36,571 | 21,12 | 29,924 |
| E190 | M20701400 | 1290 | 33 | 36,167 | 21,182 | 29,368 |
| E191 | M20600400 | 3176 | 316 | 36,5 | 22,134 | 29,822 |
| E192 | M20900900 | 8052 | 129 | 37,4 | 21,93 | 28,774 |
| E193 | M20900900 | 4436 | 49 | 37,333 | 21,507 | 28,812 |
| E194 | M20701201 | 6424 | 245 | 37,167 | 23,132 | 29 |
| E195 | M20700300 | 6000 | 79 | 38 | 19,653 | 30,885 |
| E196 | M20900900 | 7986 | 183 | 38 | 19,653 | 30,885 |
| E197 | M20701500 | 9024 | 108 | 36,5 | 20,993 | 30,568 |
| E198 | M20700600 | 1680 | 41 | 38,25 | 20,733 | 28,84 |
| E199 | M20701301 | 4248 | 48 | 37,643 | 19,513 | 28,818 |
| E200 | M20900200 | 1190 | 32 | 37,667 | 20,613 | 29,035 |
| E201 | M20404400 | 2400 | 8 | 36,833 | 22,423 | 26,685 |
| E202 | M20701500 | 4752 | 126 | 37,333 | 20,29 | 28,527 |
| E203 | M20900900 | 3072 | 43 | 37,167 | 21,083 | 26,24 |
| E204 | M20701500 | 564 | 19 | 38 | 20,363 | 29,843 |
| E205 | M20701201 | 1192 | 28 | 37,667 | 21,147 | 29,273 |
| E206 | M20900200 | 1275 | 25 | 37,667 | 21,147 | 29,273 |
| E207 | M20600400 | 2056 | 537 | 36 | 22,89 | 27,753 |
| E208 | M20700300 | 7816 | 85 | 39 | 20,24 | 29,57 |
| E209 | M20900200 | 1040 | 44 | 36,333 | 19,9 | 27,89 |
| E210 | M20900900 | 1968 | 16 | 38 | 19,547 | 27,84 |
| E211 | M20701201 | 5016 | 52 | 36,333 | 19,9 | 27,633 |
| E212 | M20600400 | 1656 | 524 | 37,667 | 20,937 | 27,84 |
Tabela 2.7.3: Variáveis de Areia sem réplicas.
Para construir os gráficos de controle multivariados precisamos primeiramente saber quais variáveis são correlacionadas, com isso podemos trabalhar apenas com aquelas variáveis que conjuntamente influenciam o processo. Para obter a correlação entre as variáveis podemos utilizar a ferramenta Matriz de Correlação disponibilizada pelo Software Action.
Neste exemplo vamos considerar que as 3 variáveis estão correlacionadas para mostrar os cálculos com detalhes.
Cuidado!
A correlação deve sempre ser analisada no caso multivariado para que os resultados não sejam mascarados.
A seguir apresentamos os passos para a construção dos gráficos de controle multivariados (T² e Variância generalizada).
As médias das variáveis Compactabilidade, RCV1 e Plasticidade são, respectivamente, 37,267 ; 20,962 e 28,878. A matriz de covariâncias (S) e a matriz inversa ($ S ^ {-1} $) são dadas por
$$S = \begin{bmatrix} 0,5810~~~~-0,3629~~~~0,2243 \cr -0,3629~~~~~~1,0728~~~~-0,2576 \cr 0,2243~~~~-0,2576~~~~1,3649 \cr \end{bmatrix} ~ \qquad \hbox{e} \qquad ~ S^{-1} = \begin{bmatrix} 2,2533~~~~0,7053~~~-0,2371 \cr 0,7053~~~~~~1,1971~~~~~0,1101 \cr -0,2371~~~~~0,1101~~~~~0,7924 \cr \end{bmatrix}$$
Cálculo dos limites de controle para T² de Hotelling
O cálculo de T² para a primeira corrida (E188) é dado por
$$T^2 = (X_i - \overline{X})S^{-1}(X_i - \overline{X})$$
$$ = [-0,767 \quad 1,063 \quad -0,0087] \ast \begin{bmatrix} 2,2533 \quad 0,7053 \quad -0,2371 \cr 0,7053 \quad 1,1971 \quad 0,1101 \cr -0,2371 \quad 0,1101 \quad 0,7924 \end{bmatrix} \ast \begin{bmatrix} -0,767 \cr 1,063 \cr -0,0087 \end{bmatrix} = 1,5259$$
Para as outras amostras (corridas E189 a E212) o procedimento é análogo.
Os valores de T² para todas as amostras estão dispostos no quadro abaixo.
| Corrida | T² |
|---|---|
| E188 | 152,595 |
| E189 | 221,678 |
| E190 | 291,648 |
| E191 | 299,512 |
| E192 | 133,373 |
| E193 | 0,4124 |
| E194 | 542,531 |
| E195 | 382,223 |
| E196 | 382,223 |
| E197 | 418,464 |
| E198 | 193,979 |
| E199 | 209,762 |
| E200 | 0,28603 |
| E201 | 473,986 |
| E202 | 0,64975 |
| E203 | 534,417 |
| E204 | 129,344 |
| E205 | 0,56833 |
| E206 | 0,56833 |
| E207 | 447,276 |
| E208 | 532,076 |
| E209 | 528,861 |
| E210 | 368,312 |
| E211 | 568,977 |
| E212 | 140,279 |
Tabela 2.7.4: Cálculo dos valores de T²
Os limites de controle com um nível de confiança de 3σ = 99,73% são dados por
$$LIC = \dfrac{(m-1)^2}{m}B_{\left(\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}~=~\dfrac{(25-1)^2}{25}B_{\left(0,00135;~\frac{3}{2};~\frac{(25-3-1)}{2}\right)}~=~0,03183$$
$$LC = \dfrac{(25-1)^2}{25}B_{\left(0,50;~\frac{3}{2};~\frac{(25-3-1)}{2}\right)}~=~2,402$$
$$LSC = \dfrac{(m-1)^2}{m}B_{\left(1-\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}~=~\dfrac{(25-1)^2}{25}B_{\left(0,99865;~\frac{3}{2};~\frac{(25-3-1)}{2}\right)}~=~11,918$$
sendo
- m = número de amostras = 25
- p = número de variáveis correlacionadas = 3
Cálculo dos limites de controle para a variância generalizada
Vamos agora construir os limites de controle para a variância generalizada. Primeiramente calculamos a média e variância, daí procedemos a padronização de cada variável. Assim temos
Para Compactabilidade (X1)
$$\overline{X}_1 = \dfrac{36,5 + 36,571 + \ldots + 36,333 + 37,667}{25} = 37,267$$
$$S_1^2 = \dfrac{(36,5 - 37,267)^2 + \ldots + (37,667 - 37,267)^2}{24} = 0,581$$
Padronização:
$$\dfrac{(36,5 - 37,267)}{\sqrt{0,581}} = -1,00746$$
Para RCV1 (X2)
$$\overline{X}_2 = \dfrac{22,026 + 21,12 + \ldots + 19,9 + 20,937}{25} = 20,962$$
$$S_2^2 = \dfrac{(22,026 - 20,962)^2 + \ldots + (20,937 - 20,962)^2}{24} = 1,072$$
Padronização:
$$\dfrac{(22,026 - 20,962)}{\sqrt{1,072}} = 1,027$$
Para Plasticidade (X3)
$$\overline{X}_3=\dfrac{28,87+29,924+\ldots+27,633+27,84}{25}=28,878$$
$$S_3^2=\dfrac{(28,87-28,878)^2+\ldots+(27,84-28,878)^2}{24}=1,364$$
Padronização:
$$\dfrac{(28,87-28,878)}{\sqrt{1,364}}=-0,00746$$
As variáveis padronizadas para todas as amostras são dadas na Tabela 2.7.5.
| Compactabilidade | RCV1 | Plasticidade | Desvios Padrão |
|---|---|---|---|
| -100,746 | 1,027 | -0,00746 | 101,728 |
| -0,91431 | 0,15231 | 0,89471 | 0,90934 |
| -144,433 | 0,21217 | 0,4188 | 102,127 |
| -100,746 | 113,127 | 0,8074 | 115,273 |
| 0,17328 | 0,93432 | -0,08964 | 0,53179 |
| 0,08538 | 0,52594 | -0,05711 | 0,30396 |
| -0,1324 | 209,478 | 0,10381 | 122,339 |
| 0,96044 | -1,264 | 171,728 | 154,967 |
| 0,96044 | -1,264 | 171,728 | 154,967 |
| -100,746 | 0,0297 | 144,594 | 123,157 |
| 128,842 | -0,22132 | -0,03314 | 0,82272 |
| 0,49208 | -139,916 | -0,05197 | 0,97363 |
| 0,52356 | -0,33717 | 0,13377 | 0,43101 |
| -0,57058 | 141,028 | -187,772 | 165,546 |
| 0,08538 | -0,64901 | -0,30106 | 0,36736 |
| -0,1324 | 0,11659 | -225,862 | 13,054 |
| 0,96044 | -0,57853 | 0,82538 | 0,85222 |
| 0,52356 | 0,17838 | 0,33748 | 0,17277 |
| 0,52356 | 0,17838 | 0,33748 | 0,17277 |
| -166,342 | 186,115 | -0,96356 | 186,598 |
| 227,236 | -0,69728 | 0,5917 | 148,912 |
| -122,655 | -102,553 | -0,8463 | 0,19023 |
| 0,96044 | -136,634 | -0,88909 | 122,898 |
| -122,655 | -102,553 | -106,628 | 0,10626 |
| 0,52356 | -0,02437 | -0,88909 | 0,71222 |
Tabela 2.7.5: Variáveis padronizadas.
A última coluna da Tabela 2.7.5 é o desvio-padrão das variáveis padronizadas em relação a X1, X2 e X3, ou seja,
$$S = \sqrt{\dfrac{\sum_{1}^{p}X_i^{2} - p \ast \overline{X}^2}{p-1}}$$
Para a primeira linha, o valor 1,01728 é obtido através do cálculo de S, dado por
$$S = \sqrt{\dfrac{(2,06976) - 3 \ast (0,00403)^2}{2}} = 1,01728$$
Precisamos ainda calcular $ \overline{S}, $ dado por
$$\overline{S} = \dfrac{\hbox{Soma dos desvios padrão amostrais}}{\hbox{número de amostras}} = \dfrac{\hbox{soma das }S_i}{m}$$
ou seja,
$$\overline{S} = \dfrac{1,01728 + \ldots + 0,71222}{25} = \dfrac{22,8368}{25} = 0,913472$$
Assim a linha central do gráfico de controle é dado pela média dos desvios padrão, ou seja, para este exemplo é a média da última coluna da Tabela 7.1.3, obtendo assim o valor 0,913472. Com isso, o gráfico da variância generalizada com observações individuais segue o mesmo raciocínio do gráfico $ S $ usual.
Aplicando as fórmulas e utilizando o Apêndice para obter os valores de B3 = 0 e B4 = 2,266 (para n = 4) encontramos os limites de controle, que são dados por
$$LSC = B_4 \ast \overline{S} = 2,266 \ast 0,913472 = 2,0699$$
$$LC = \overline{S} = 0,913472$$
$$LIC = B_3 \ast \overline{S} = 0 \ast 0,913472 = 0$$
A seguir temos os resultados obtidos pelo Software Action para esse exemplo.


Figura 7.1.1: Gráficos T² de Hotelling e Variância Generalizada.
Observando a Figura 7.1.1 percebemos que nenhum ponto está fora dos limites de controle e a variância permanece estável ao longo do período observado.
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.
Exemplo 7.1.2:
A Tabela 7.1.4 apresenta dados da área industrial referentes à espessura de engrenagens de câmbio automotivo. A Figura 7.1.2 ilustra o formato da engrenagem.

Figura 7.1.2: Detalhe da engrenagem do câmbio.
| Posição1 | Posição2 | Posição3 |
|---|---|---|
| 98,208 | 98,209 | 21,996 |
| 98,209 | 98,220 | 22,002 |
| 98,206 | 98,204 | 21,999 |
| 98,206 | 98,206 | 21,998 |
| 98,204 | 98,214 | 21,998 |
| 98,209 | 98,203 | 21,983 |
| 98,202 | 98,212 | 21,981 |
| 98,196 | 98,221 | 21,980 |
| 98,215 | 98,201 | 21,986 |
| 98,194 | 98,227 | 21,993 |
| 98,200 | 98,210 | 21,981 |
| 98,206 | 98,207 | 21,983 |
| 98,212 | 98,200 | 22,004 |
| 98,211 | 98,200 | 22,009 |
| 98,212 | 98,199 | 22,008 |
| 98,191 | 98,166 | 22,008 |
| 98,206 | 98,205 | 22,009 |
| 98,192 | 98,207 | 21,982 |
| 98,203 | 98,202 | 21,993 |
| 98,195 | 98,206 | 21,990 |
| 98,207 | 98,204 | 21,999 |
| 98,188 | 98,199 | 21,989 |
| 98,219 | 98,222 | 21,997 |
| 98,196 | 98,205 | 21,998 |
| 98,220 | 98,227 | 22,001 |
| 98,193 | 98,213 | 21,985 |
| 98,194 | 98,217 | 21,988 |
| 98,200 | 98,200 | 21,983 |
| 98,199 | 98,199 | 21,980 |
| 98,199 | 98,197 | 21,985 |
| 98,199 | 98,198 | 21,984 |
| 98,196 | 98,206 | 21,982 |
| 98,203 | 98,207 | 21,984 |
| 98,201 | 98,206 | 21,986 |
| 98,197 | 98,161 | 21,989 |
| 98,192 | 98,205 | 21,984 |
| 98,208 | 98,172 | 22,011 |
| 98,175 | 98,195 | 21,983 |
| 98,176 | 98,196 | 21,983 |
| 98,172 | 98,195 | 21,983 |
| 98,197 | 98,201 | 21,999 |
| 98,195 | 98,211 | 21,993 |
| 98,196 | 98,206 | 21,993 |
| 98,201 | 98,219 | 21,989 |
Tabela 7.1.4: Dados referentes à espessura de engrenagens.
Primeiramente vamos verificar se as variáveis Posição1, Posição2 e Posição3 são correlacionadas. Para obter a correlação entre elas vamos utilizar a ferramenta Matriz de Correlação do Software Action. Dessa forma, temos

Podemos ver que a correlação positiva (0,471) entre a Posição 1 e a Posição 3 é significativa, comprovada pelo p-valor de 0,001 que é menor do que o nível de significância adotado de 5%. Portanto, podemos concluir que apenas as variáveis Posição1 e Posição3 influenciam conjuntamente no processo, com isso vamos construir os gráficos de controle multivariados considerando apenas essas duas variáveis.
A seguir apresentamos os passos para a construção dos gráficos de controle multivariados (T² de Hotelling e Variância generalizada).
As médias das variáveis Posição1 e Posição3 são, respectivamente, 98,2 e 21,992.
A matriz de covariâncias (S) e a matriz inversa ($ S ^ {-1} $) são dadas por

Cálculo dos limites de controle para T² de Hotelling
O cálculo de T² para a primeira linha do conjunto de dados, considerando agora apenas as variáveis correlacionadas (Posição1 e Posição3), é da seguinte forma
$$T^2 = (X_i - \overline{X})S^{-1}(X_i - \overline{X})$$

Para as outras linhas o procedimento para o cáculo da estatística T² é análogo.
Portanto, os limites de controle com um nível de confiança de 3σ = 99,73% são dados por
$$LIC = \dfrac{(m-1)^2}{m}B_{\left(\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}~=~\dfrac{(44-1)^2}{44}B_{\left(0,00135;~\frac{2}{2};~\frac{(44-2-1)}{2}\right)}~=~0,0028$$
$$LC = \dfrac{(44-1)^2}{44}B_{\left(0,50;~\frac{2}{2};~\frac{(44-2-1)}{2}\right)}~=~1,3971$$
$$LSC = \dfrac{(m-1)^2}{m}B_{\left(1-\frac{\alpha}{2};~\frac{p}{2};~\frac{(m-p-1)}{2}\right)}~=~\dfrac{(44-1)^2}{44}B_{\left(0,99865;~\frac{2}{2};~\frac{(44-2-1)}{2}\right)}~=~11,578$$
sendo
- m = número de amostras = 44
- p = número de variáveis correlacionadas = 2
Cálculo dos limites de controle para a variância generalizada
Vamos agora construir os limites de controle para a variância generalizada. Primeiramente calculamos a média e variância, daí procedemos a padronização de cada variável. Assim temos
Para Posição1 (X1)
$$\overline{X}_1 = \dfrac{98,208 + 98,209 + \ldots + 98,196 + 98,201}{44} = 98,2$$
$$S_1^2 = \dfrac{(98,208 - 98,2)^2 + \ldots + (98,201 - 98,2)^2}{43} = 0,000105$$
Padronização para o primeiro valor da variável Posição1:
$$\dfrac{(98,208 - 98,2)}{\sqrt{0,000105}} = 0,7843$$
Para Posição3 (X2)
$$\overline{X}_2 = \dfrac{21,996 + 22,002 + \ldots + 21,993 + 21,989}{44} = 21,992$$
$$S_2^2 = \dfrac{(21,996 - 21,992)^2 + \ldots + (21,989 - 21,992)^2}{43} = 0,0000861$$
Padronização para o primeiro valor da variável Posição3:
$$\dfrac{(21,996 - 21,992)}{\sqrt{0,0000861}} = 0,431$$
O procedimento para a padronização dos outros valores das variáveis Posição1 e Posição3 é análogo.
O desvio-padrão das variáveis padronizadas em relação a X1 e X2 é dado por
$$S = \sqrt{\dfrac{\sum_{1}^{p}X_i^{2} - p \ast \overline{X}^2}{p-1}}$$
Logo, para a primeira linha o valor de S é obtido da seguinte forma
$$S = \sqrt{\dfrac{(0,8) - 2 \ast (0,608)^2}{1}} = 0,1564$$
Para as outras linhas do conjunto o cálculo é análogo.
Precisamos ainda calcular $ \overline{S}, $ dado por
$$\overline{S} = \dfrac{{Soma dos desvios padrão amostrais}}{{número de amostras}} = \dfrac{{soma das S_i}}{m}$$
ou seja,
$$\overline{S} = 0,5785$$
Assim a linha central do gráfico de controle é dado pela média dos desvios padrão. Com isso, o gráfico da variância generalizada com observações individuais segue o mesmo raciocínio do gráfico $ S $ usual.
Aplicando as fórmulas e utilizando o Apêndice para obter os valores de B3 = 0 e B4 = 2,568 (para n = 3) encontramos os limites de controle, que são dados por
$$LSC = B_4 \ast \overline{S} = 2,568 \ast 0,5785 = 1,4856$$
$$LC = \overline{S} = 0,5785$$
$$LIC = B_3 \ast \overline{S} = 0 \ast 0,5785 = 0$$
A seguir temos os resultados obtidos pelo Software Action para esse exemplo.


Podemos notar que o processo não manteve-se estável ao longo do período considerado.
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.
b) 7.2 - Gráficos de controle multivariados para observações com réplicas
A seguir apresentamos a construção dos gráficos de controle multivariados para observações com réplicas.
Para introduzir o conceito desses gráficos vamos considerar a entrada de dados, de forma geral, conforme a Tabela 7.2.1. Podemos observar agora que esses dados possuem réplicas.
| Variáveis | ||||
|---|---|---|---|---|
| Amostra | $ X_1 $ | $ X_2 $ | $ \cdots $ | $ X_p $ |
| 1 | $ X_{111} $ | $ X_{211} $ | $ \cdots $ | $ X_{p11} $ |
| 1 | $ X_{112} $ | $ X_{212} $ | $ \cdots $ | $ X_{p12} $ |
| $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ |
| 1 | $ X_{11n} $ | $ X_{21n} $ | $ \cdots $ | $ X_{p1n} $ |
| 2 | $ X_{121} $ | $ X_{221} $ | $ \cdots $ | $ X_{p21} $ |
| 2 | $ X_{122} $ | $ X_{222} $ | $ \cdots $ | $ X_{p22} $ |
| $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ |
| 2 | $ X_{12n} $ | $ X_{22n} $ | $ \cdots $ | $ X_{p2n} $ |
| 3 | $ X_{131} $ | $ X_{231} $ | $ \cdots $ | $ X_{p31} $ |
| 3 | $ X_{132} $ | $ X_{232} $ | $ \cdots $ | $ X_{p32} $ |
| $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ |
| 3 | $ X_{13n} $ | $ X_{23n} $ | $ \cdots $ | $ X_{p3n} $ |
| m | $ X_{1m1} $ | $ X_{2m1} $ | $ \cdots $ | $ X_{pm1} $ |
| m | $ X_{1m2} $ | $ X_{2m2} $ | $ \cdots $ | $ X_{pm2} $ |
| $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ | $ \vdots $ |
| m | $ X_{1mn} $ | $ X_{2mn} $ | $ \cdots $ | $ X_{pmn} $ |
Tabela 7.2.1: Entrada de dados.
$ refere-se a k-ésima observação na j-ésima amostra da i-ésima variável.
Aqui i = 1, …, p ; j = 1, …, m e k = 1, …, n.
Para o cálculo da estatística T² de Hotelling devemos seguir os passos abaixo:
- Calcular a média dentro de cada amostra para cada variável

- Calcular o vetor de médias gerais por

- Calcular o vetor de variâncias amostrais para cada amostra
$$S^2_{ij.} = \dfrac{1}{n - 1}\sum^{n}_{k=1}(X_{ijk} - \overline{X}_{ij.})^2~~~~{para}~i = 1, \ldots, p$$
- Calcular as p(p - 1)/2 covariâncias amostrais, denotadas por $ S^2_{ilj}, $ para cada amostra
$$S^2_{ilj} = \dfrac{1}{n - 1}\sum^{n}_{k=1}(X_{ijk} - \overline{X}_{ij.})(X_{ljk} - \overline{X}_{lj.})~~~~{para}~i \neq l = 1, \ldots, p$$
- Construir a matriz de covariância amostral S da seguinte forma
$$S = \left(\begin{array}{cccc} S^2_{11} ~~~~ S^2_{12} ~~~~ \cdots ~~~~ S^2_{1p} \cr S^2_{21} ~~~~ S^2_{22} ~~~~ \cdots ~~~~ S^2_{2p} \cr \vdots~~~~~~~ \vdots ~~~~~\cdots ~~~~~\vdots \cr S^2_{p1} ~~~~ S^2_{p2} ~~~~ \cdots ~~~~ S^2_{pp} \end{array} \right)$$
em que
$$S^2_{ii} = \dfrac{1}{m}\sum^{m}_{j=1}S^2_{iij},~~~~{para}~i = 1, \ldots, p$$
$$S^2_{il} = \dfrac{1}{m}\sum^{m}_{j=1}S^2_{ilj},~~~~{para}~i \neq l = 1, \ldots, p$$
- Calcular a estatística T² da seguinte forma

Limites de Controle para o gráfico de T²
Temos que a estatística $ T_j^2~\sim~\left(\dfrac{(mn - m)p}{mn - m - p + 1}\right)F_{(p,~mn - m - p + 1)}, $ para n > 1 (ver Johnson (2002)).
Limite inferior de controle (Montgomery (2001)):
$$LIC = \dfrac{p(m-1)(n-1)}{(mn - m - p + 1)}F_{\left(\alpha/2;~p;~mn-m-p+1\right)}$$
Linha Central (Montgomery (2001)):
$$LC = \dfrac{p(m-1)(n-1)}{(mn - m - p +1)}F_{\left(0,50;~p;~mn-m-p+1\right)}$$
Limite superior de controle (Montgomery (2001)):
$$LSC = \dfrac{p(m-1)(n-1)}{(mn - m - p + 1)}F_{\left(1-\alpha/2;~p;~mn-m-p+1\right)}$$
em que n = tamanho de cada amostra, m = número de amostras e p = quantidade de características.
Limites de Controle para a variância generalizada
$ determinante da matriz de covariância amostral, variância generalizada (Johnson (2002)).
Limite inferior de controle (Montgomery (2001)):
$$LIC = \dfrac{\mid S \mid}{b_1}(b_1 - 3\sqrt{b_2})$$
Linha Central (Montgomery (2001)):
$$LC = \mid S \mid$$
Limite superior de controle (Montgomery (2001)):
$$LSC = \dfrac{\mid S \mid}{b_1}(b_1 + 3\sqrt{b_2})$$
em que
$$b_1 = \dfrac{1}{(n-1)^p}\prod_{i=1}^p(n-i)$$
$$b_2 = \dfrac{1}{(n-1)^{2p}}\prod_{i=1}^p(n-i)\left[\prod_{j=1}^p(n-j+2) - \prod_{j=1}^p(n-j)\right]$$
sendo p = número de variáveis e n = número de observações em cada grupo.
Exemplo 7.2.1:
Um químico está interessado em verificar a relação entre a quantidade de horas que determinados corpos-de-prova ficam submetidos à uma estufa e a porcentagem (%) de umidade neles contida. A estufa foi mantida a temperatura constante e tomamos amostras de tamanho 5 para cada dia. Os dados estão dispostos na Tabela 7.2.2.
| Data da Medição | CP | Número de horas | Umidade(%) | Data da Medição | CP | Número de horas | Umidade(%) |
|---|---|---|---|---|---|---|---|
| 1/1/2001 | 1 | 1 | 7 | 1/6/2001 | 1 | 3 | 5,8 |
| 2 | 2 | 6,5 | 2 | 3 | 5,6 | ||
| 3 | 4 | 6 | 3 | 2 | 4 | ||
| 4 | 6 | 7 | 4 | 2 | 4 | ||
| 5 | 4 | 7 | 5 | 5 | 5,8 | ||
| 1/2/2001 | 1 | 2 | 7 | 1/7/2001 | 1 | 4 | 5,2 |
| 2 | 2 | 7 | 2 | 6 | 6,4 | ||
| 3 | 4 | 6,2 | 3 | 2 | 4,5 | ||
| 4 | 1 | 6 | 4 | 3 | 1,5 | ||
| 5 | 1 | 5,2 | 5 | 3 | 5,6 | ||
| 1/3/2001 | 1 | 5 | 7 | 1/8/2001 | 1 | 6 | 6 |
| 2 | 2 | 5,4 | 2 | 3 | 5,8 | ||
| 3 | 5 | 7 | 3 | 7 | 7 | ||
| 4 | 3 | 7 | 4 | 4 | 4,5 | ||
| 5 | 2 | 1,4 | 5 | 3 | 5,2 | ||
| 1/4/2001 | 1 | 4 | 6 | 1/9/2001 | 1 | 5 | 5,6 |
| 2 | 4 | 6,2 | 2 | 4 | 4,5 | ||
| 3 | 4 | 3,5 | 3 | 2 | 4,5 | ||
| 4 | 2 | 4,5 | 4 | 1 | 6 | ||
| 5 | 2 | 3 | 5 | 3 | 2 | ||
| 1/5/2001 | 1 | 3 | 4,2 | 1/10/2001 | 1 | 3 | 5,2 |
| 2 | 3 | 6,5 | 2 | 4 | 6 | ||
| 3 | 2 | 2,2 | 3 | 6 | 5,5 | ||
| 4 | 4 | 5,5 | 4 | 3 | 7 | ||
| 5 | 3 | 6 | 5 | 2 | 6,5 |
Tabela 7.2.2: Dados do experimento.
Primeiramente precisamos verificar se as variáveis a serem analisadas são correlacionadas. Para isso podemos utilizar a ferramenta Matriz de Correlação do Software Action.
Neste exemplo consideraremos que existe correlação entre as variáveis Número de horas e Umidade apenas para trabalhar com as mesmas conjuntamente e exemplificar os cálculos com detalhes.
Cuidado!
A correlação deve sempre ser analisada no caso multivariado para que os resultados não sejam mascarados.
Para a primeira amostra (1/1/2001), temos:
$$S_{11}^2 = \dfrac{1}{4}[(1 - 3,4)^2 + (2 - 3,4)^2 + (4 - 3,4)^2 + (6 - 3,4)^2 + (4 - 3,4)^2] = 3,8$$
$$S_{22}^2 = \dfrac{1}{4}[(7 - 6,7)^2 + (6,5 - 6,7)^2 + (6 - 6,7)^2 + (7 - 6,7)^2 + (7 - 6,7)^2] = 0,2$$
$$S_{12} = \dfrac{1}{4}[(1 - 3,4)(7 - 6,7) + (2 - 3,4)(6,5 - 6,7) + (4 - 3,4)(6 - 6,7) + (6 - 3,4)(7 - 6,7)~+$$
$$+~(4 - 3,4)(7 - 6,7)] = 0,025$$
Cálculo dos limites de controle para T² de Hotelling
O cálculo da estatística T² para a primeira amostra é dado por
$$T^2 = n(\overline{X} - \overline{\overline{X}})S^{-1}(\overline{X} - \overline{\overline{X}})$$
$$= 5 \ast [0,12~~~~1,3] \ast \left[\begin{array}{cc}~0,5427404~~~~~-0,2021607 \cr -0,2022607~~~~~0,5752761 \cr \end{array} \right] \ast \left[\begin{array}{c} 0,12 \cr 1,3 \cr \end{array} \right] = $$
$$= 4,58479$$
Na tabela a seguir temos as médias e variâncias para o gráfico T² calculadas para todas as amostras.
| Amostra | $ \overline{X}_1 $ | $ \overline{X}_2 $ | $ S_{1}^2 $ | $ S_{2}^2 $ | $ S_{12} $ | $ T^2 $ |
|---|---|---|---|---|---|---|
| 1 | 3,4 | 6,7 | 3,8 | 0,2 | 0,025 | 4,58479 |
| 2 | 2 | 6,28 | 1,5 | 0,572 | 0,3 | 8,95074 |
| 3 | 3,4 | 5,56 | 2,3 | 5,888 | 2,52 | 0,0739 |
| 4 | 3,2 | 4,64 | 1,2 | 2,073 | 0,89 | 1,55585 |
| 5 | 3 | 4,88 | 0,5 | 2,977 | 0,825 | 0,69618 |
| 6 | 3 | 5,04 | 1,5 | 0,908 | 0,9 | 0,38176 |
| 7 | 3,6 | 4,64 | 2,3 | 3,553 | 1,495 | 2,43094 |
| 8 | 4,6 | 5,7 | 3,3 | 0,87 | 1,225 | 4,18667 |
| 9 | 3 | 4,52 | 2,5 | 2,427 | -0,2 | 1,9421 |
| 10 | 3,6 | 6,04 | 2,3 | 0,533 | -0,53 | 1,04202 |
| soma | 32,8 | 54 | 21,2 | 20,001 | 7,45 | 25,84495 |
| média | 3,28 | 5,4 | 2,12 | 2,0001 | 0,745 | 2,584495 |
Tabela 7.2.3: Médias e Variâncias para o gráfico T².
Com isso, podemos construir os limites de controle do gráfico T², com um nível de confiança 3σ = 99,73%, dados a seguir.
Limite inferior de controle
$$LIC = \dfrac{p(m-1)(n-1)}{(mn - m - p + 1)}F_{\left(\alpha/2;~p;~mn-m-p+1\right)} = \dfrac{2(10 - 1)(5 - 1)}{(10 \ast 5 - 10 - 2 + 1)}F_{\left(0,00135;~2;~39\right)}$$
$$= 1,846154 \ast 0,0013509 = 0,0025$$
Limite central
$$LC = \dfrac{p(m-1)(n-1)}{(mn - m - p + 1)}F_{\left(0,50;~p;~mn-m-p+1\right)} = \dfrac{2(10 - 1)(5 - 1)}{(10 \ast 5 - 10 - 2 + 1)}F_{\left(0,50;~2;~39\right)}$$
$$= 1,846154 \ast 0,7056138 = 1,302672$$
Limite superior de controle
$$LSC = \dfrac{p(m-1)(n-1)}{(mn - m - p + 1)}F_{\left(1-\alpha/2;~p;~mn-m-p+1\right)} = \dfrac{2(10 - 1)(5 - 1)}{(10 \ast 5 - 10 - 2 + 1)}F_{\left(0,99865;~2;~39\right)}$$
$$= 1,846154 \ast 7,8650 = 14,520$$
Cálculo dos limites de controle para a variância generalizada
Vamos agora construir os limites de controle para a variância generalizada, os quais são dados por
$$LIC = \dfrac{\mid S \mid}{b_1}(b_1 - 3\sqrt{b_2}) = \dfrac{3,685}{0,75}(0,75 - 3\sqrt{0,84375}) = -9,85$$
Como o valor obtido para o LIC foi negativo, tomamos como valor mínimo o zero. Sendo assim, assumimos LIC = 0.
$$LC = ~\mid S \mid ~= det\left[\begin{array}{cc} 2,12 ~~~~ 0,745 \cr 0,745 ~~~~ 2,001 \cr \end{bmatrix} = 3,685$$
$$LSC = \dfrac{\mid S \mid}{b_1}(b_1 + 3\sqrt{b_2}) = \dfrac{3,685}{0,75}(0,75 + 3\sqrt{0,84375}) = 17,225$$
A seguir temos os resultados obtidos pelo Software Action para esse exemplo.


Figura 7.2.1: Gráficos T² e Variância generalizada.
Podemos notar pelos gráficos que o processo manteve-se estável ao longo do período.
Para entender como executar essa função do Software Action, você pode consultar o manual do usuário.