Estabilidade de Acompanhamento
Baseando-se no estudo de longa duração, após a análise dos dados relacionadas a esse tipo de estudo, pode ser que tenha-se interesse em analisar como futuras observações correspondentes a esse processo estão se comportando. Em outras palavras, tem-se o objetivo de monitorar e confirmar o Prazo de Validade para medicamento ou IFA e o Prazo de Reteste de IFA, conforme descrito no RDC nº 318. Para tal finalidade, descreve-se nessa seção as técnicas estatísticas para o estudo de estabilidade de acompanhamento.
Para a análise de acompanhamento toma-se novas observações do processo e avalia-se, mediante intervalos de predição, o comportamento do processo. Esses intervalos são construídos com base no estudo de longa duração e dependem do cenário no qual encontra-se o estudo de estabilidade:
- Cenário 1: Tem-se o ajuste de um único modelo para os dados de longa duração, isto é, não rejeita-se o teste de igualdade dos interceptos e não rejeita-se o teste de igualdade de coeficientes angulares.
- Cenário 2: Nessa situação tem-se que, no estudo de longa duração, o fator lote é significativo e a interação entre o lote e o tempo é não significativa. Assim, rejeita-se o teste de igualdade dos interceptos e não rejeita-se o teste de igualdade de coeficientes angulares. Quando isso ocorre tem-se que cada lote irá apresentar um intercepto diferente e todos os lotes terão um mesmo coeficiente angular.
- Cenário 3: Quando a interação entre o lote e tempo é significativa no estudo de longa duração, ou seja, quando rejeita-se o teste de paralelismo. Nesse caso, toma-se o lote que resultou no coeficiente angular de maior magnitude no modelo completo obtido no estudo de longa duração para calcular o termo correspondente de intervalo de previsão.
As expressões matemáticas para a determinação dos limites inferior (LIA) e superior (LSA) de acompanhamento, referentes a cada cenário, encontram-se compiladas na Tabela 2.1.
| Cenário | LIA | LSA |
|---|---|---|
| 1 | $Y_0 + t \cdot \widehat{\beta}_1 - t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+\frac{1}{n}+\frac{\left(t-\bar{x}\right)^{2}}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}}$ | $Y_0 + t \cdot \widehat{\beta}_1 + t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+\frac{1}{n}+\frac{\left(t-\bar{x}\right)^{2}}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}}$ |
| 2 | $Y_0 + t \cdot \widehat{\beta}_1 - t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+x_{t}^{T}\left(X^{T} X\right)^{-1} x_{t}}$ | $Y_0 + t \cdot \widehat{\beta}_1 + t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+x_{t}^{T}\left(X^{T} X\right)^{-1} x_{t}}$ |
| 3 | $Y_0 + t \cdot \widehat{\beta}_M - t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+x_{t}^{T}\left(X^{T} X\right)^{-1} x_{t}}$ | $Y_0 + t \cdot \widehat{\beta}_M + t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+x_{t}^{T}\left(X^{T} X\right)^{-1} x_{t}}$ |
- $Y_0$: Resposta observada no tempo 0 do lote de acompanhamento;
- $t$: Tempo para para o qual deseja-se construir o intervalo de acompanhamento.
- $\widehat{\beta}_1$: Coeficiente angular ajustado do estudo de longa duração, 0 se o tempo não for significativo (Cenários 1 e 2).
- $x_t$: Vetor de observação da matriz $X$ para o tempo $t$ no lote de acompanhamento (Cenários 2 e 3).
- $X$: Matriz de delineamento do modelo (Cenários 2 e 3).
- $\widehat{\beta}_M$: Coeficiente angular de maior magnitude entre os modelos para cada lote (Cenário 3).
- $t^*$: Quantil de $\left( 1-\frac{\alpha}{2} \right)$ da distribuição t-Student com $n-p-1$ graus de liberdade.
- $\widehat{\sigma}$: Desvio padrão estimada do modelo de regressão.
- nível de confiança de 99,73%.
Caso haja réplicas o valor $Y_0$ será substituído pela média da resposta, $\overline{Y}_0$. Quando não tiver tendência, isto é, quando rejeitar-se a significância do tempo, considerar-se-á o $\widehat{\beta}_1$ como 0.
Exemplo
Cenário 1 - Iguais interceptos e iguais coeficientes angulares
Para o acompanhamento tem-se os seguintes dados apresentados na Tabela 2.2
| Lote 1 | Lote 2 | Lote 3 | Lote 4 (Acompanhamento) | ||||
|---|---|---|---|---|---|---|---|
| Tempo | Medições | Tempo | Medições | Tempo | Medições | Tempo | Medições |
| 0 | 97,6827 | 0 | 102,0645 | 0 | 102,6337 | 0 | 102,3654 |
| 3 | 104,4361 | 3 | 95,6986 | 3 | 102,2354 | ||
| 6 | 101,4657 | 6 | 95,0475 | 6 | 107,4803 | ||
| 9 | 101,2829 | 9 | 100,6914 | 9 | 99,3431 | ||
| 12 | 101,4556 | 12 | 96,7143 | 12 | 101,1194 | 12 | 100,8769 |
| 18 | 96,7930 | 18 | 101,9347 | 18 | 100,1674 | ||
| 24 | 98,4863 | 24 | 101,3223 | 24 | 97,2033 | 24 | 100,5624 |
| 36 | 104,8448 | 36 | 102,3533 | ||||
De posse desses dados, no estudo de longa duração, tem-se:
Teste de paralelismo
| G.L. | Soma de Quadrados | Quadrado Médio | Estat. F | P-valor | |
|---|---|---|---|---|---|
| Tempo | 1 | 0,8461 | 0,8461 | 0,0870 | 0,7716 |
| Lote | 2 | 23,3998 | 11,6999 | 1,2026 | 0,3247 |
| Tempo:Lote | 2 | 17,6392 | 8,8196 | 0,9065 | 0,4226 |
| Resíduos | 17 | 165,3962 | 9,7292 |
Teste de igualdade de interceptos
| G.L. | Soma de Quadrados | Quadrado Médio | Estat. F | P-valor | |
|---|---|---|---|---|---|
| Tempo | 1 | 0,8461 | 0,8461 | 0,0878 | 0,7702 |
| Lote | 2 | 23,3998 | 11,6999 | 1,2145 | 0,3189 |
| Resíduos | 19 | 183,0354 | 9,6334 |
Teste de significância de tempo
| G.L. | Soma de Quadrados | Quadrado Médio | Estat. F | P-valor | |
|---|---|---|---|---|---|
| Tempo | 1 | 0,8461 | 0,8461 | 0,0861 | 0,7721 |
| Resíduos | 21 | 206,4652 | 9,8302 |
Desse modo, tem-se o cenário 1 descrito anteriormente. Logo, o seguinte modelo de longa duração é utilizado:
$$ \widehat{Y} = 100,31102 + 0,01841*Tempo $$
Como não tem-se tendência, toma-se $x_t=0$ e por consequência os limites de acompanhamento são os mesmos para todas as observações: $$ \begin{align*} LIA =& Y_0 + t \cdot \hat{\beta}_1 - t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+\frac{1}{n}+\frac{\left(x_{t}-\bar{x}\right)^{2}}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}} \cr =& 102,365 + 0 \cdot 0 - t_{\left(1-\frac{0,027}{2} ; 23-2\right)} \cdot 3,1353 \cdot \sqrt{1+\frac{1}{23}+\frac{\left(0- 12,52174\right)^{2}}{2495,739} } \cr =& 91,1540. \end{align*} $$
$$ \begin{align*} LSA =& Y_0 + t \cdot \hat{\beta}_1 + t^* \cdot \widehat{\sigma} \cdot \sqrt{1+\frac{1}{n}+\frac{\left(x_{t}-\bar{x}\right)^{2}}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}} \cr =& 102,365 + 0 \cdot 0 + t_{\left(1-\frac{0,0027}{2} ; 23-2\right)} \cdot 3,1353 \cdot \sqrt{1+\frac{1}{23}+\frac{\left(0- 12,52174\right)^{2}}{2495,739} } \cr =& 113,5768. \end{align*} $$
Para os limites superiores de acompanhamento que resultaram em um valor maior do que o limite superior de especificação, serão considerados $LSA = 110$. Na saída do sistema tem-se:
\begin{figure}[H] \centering\includegraphics[scale=0.8]{Figura/rdc318_acomp.png}\label{Fig:acompanhamento} \end{figure}
Cenário 2 - Diferentes interceptos e mesmo coeficiente angular
Para essa exemplificação considere os seguintes dados na Tabela 2.3
| Tempo (meses) | BV | AJ | AN66 | AV634 | BZ8331 | C30 |
|---|---|---|---|---|---|---|
| 0 | 104,7 | 101,04 | 99,32 | 103,52 | 102,16 | 104,90 |
| 3 | 106,42 | 101,92 | 106,34 | 98,66 | ||
| 6 | 105,04 | 99,78 | 104,26 | 102,62 | ||
| 9 | 105,2 | 98,88 | 104,08 | 100,16 | ||
| 12 | 104,54 | 104,74 | 99,6 | 102,44 | 98,54 | 107,02 |
| 18 | 102,02 | 99,66 | 102,38 | |||
| 24 | 105,54 | 101,56 | 98,26 | 104,18 | 106,56 | |
| 36 | 104,32 | 99,24 |
De posse desses dados, no estudo de longa duração, tem-se:
Teste de paralelismo
| G.L. | Soma de Quadrados | Quadrado Médio | Estat. F | P-valor | |
|---|---|---|---|---|---|
| Tempo | 1 | 3,17 | 3,18 | 1,19 | 0,29 |
| Lote | 3 | 111,38 | 37,13 | 13,91 | 0,00 |
| Tempo:Lote | 3 | 2,38 | 0,79 | 0,29 | 0,82 |
| Resíduos | 20 | 53,37 | 2,67 |
Teste de igualdade de interceptos
| G.L. | Soma de Quadrados | Quadrado Médio | Estat. F | P-valor | |
|---|---|---|---|---|---|
| Tempo | 1 | 3,18 | 3,18 | 1,31 | 0,26 |
| Lote | 3 | 111,38 | 37,13 | 15,32 | 0,00 |
| Resíduos | 23 | 55,75 | 2,42 |
Desse modo, como tem-se a não rejeição da hipótese de paralelismo ($p-$valor = $0,82 > 25%$) e a rejeição da hipótese de igualdade de igualdade de interceptos ($p-$valor$ \approx 0 < 25%$), para esses dados, o cenário 2 é utilizado.
O modelo completo fica como sendo:
$$\widehat{Y} = 104,3832 -0,0438\cdot \text{Tempo} -4,2100 \cdot \text{LoteAN66} -0,0474 \cdot \text{LoteAV634} -3,6926 \cdot \text{LoteBZ8331}$$
E os limites de acompanhamento são dados por:
$$ LIA = Y_0 + t \cdot \widehat{\beta}_1 - t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+x_{t}^{T}\left(X^{T} X\right)^{-1} x_{t}} $$
$$ LSA = Y_0 + t \cdot \widehat{\beta}_1 + t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+x_{t}^{T}\left(X^{T} X\right)^{-1} x_{t}} $$
No presente caso tem-se:
- $\widehat{\sigma}^{2} = 2,42$ (Quadrado médio dos resíduos presente na Tabela Teste de igualdade de interceptos;
- $\widehat{\beta}_1 = -0,0438$;
- $t_{\left(1 - \frac{\alpha}{2}, n-p-1\right)} = t_{\left(1 - \frac{0,0027}{2}, 28 - 4 - 1\right)} = t_{\left(0,99865; 23\right)} = 3,361289$.
Será considerado $\hat{\beta}_1$ como sendo zero devido ao fato dele ser não significativo (vide Teste de igualdade de interceptos, $p-$valor = $0,26 > 5%$).
Como não tem-se tendência os limites de acompanhamento são os mesmos para todas as observações de cada lote.
Para o lote de acompanhamento BV tem-se $x_t^{\top} = [1, 0, 0, 0, 0]$. Logo,
$$ LIA = 104,70 + t \cdot 0 - 3,361289 \sqrt{2,423888\left(1+x_{t}^{\top}\left(X^{\top} X\right)^{-1} x_{h}\right)} = 98,97484 $$
$$ LSA = 104,70 + t \cdot 0 + 3,361289 \sqrt{2,423888\left(1+x_{t}^{\top}\left(X^{\top} X\right)^{-1} x_{t}\right)} = 110,42516. $$
Para o lote de acompanhamento C30 tem-se $x_t^{\top} = [1, 0, 0, 0, 0]$. Logo,
$$ LIA = 104,90 + t \cdot 0 - 3,361289 \sqrt{2,423888\left(1+x_{t}^{\top}\left(X^{\top} X\right)^{-1} x_{h}\right)} = 99,17484 %101,3765 $$
$$ LSA = 104,90 + t \cdot 0 + 3,361289 \sqrt{2,423888\left(1+x_{t}^{\top}\left(X^{\top} X\right)^{-1} x_{t}\right)} = 110,62516 %108,4235. $$
Para os limites superiores de acompanhamento que resultaram em um valor maior do que o limite superior de especificação, serão considerados $LSA = 110$. No Action Stat tem-se:
\begin{figure}[H] \centering\includegraphics[scale=0.6]{Figura/result_acomp_ex2_1.png}\label{result_acomp_ex2_1} \end{figure}
\begin{figure}[H] \centering\includegraphics[scale=0.6]{Figura/result_acomp_ex2_2.png}\label{result_acomp_ex2_2} \end{figure}
Cenário 3 - Diferentes coeficientes angulares
Para essa exemplificação considere os seguintes dados na Tabela 2.4
| Longa duração | Acompanhamento | |||
|---|---|---|---|---|
| Tempo | Lotes A | Lotes B | Lotes C | Lote D |
| 0 | 101,6158 | 104,3506 | 104,6470 | 108,7988 |
| 3 | 99,2922 | 103,4975 | 106,3846 | |
| 6 | 99,0760 | 97,5835 | 100,0886 | |
| 9 | 100,0950 | 101,4073 | 101,1726 | |
| 12 | 100,4219 | 99,0102 | 101,7178 | 107,9785 |
| 18 | 99,1044 | 98,7440 | 103,8475 | |
| 24 | 101,0261 | 96,2554 | 106,0826 | 106,5485 |
| 36 | 100,0835 | 101,5334 | ||
Teste de paralelismo
| G.L. | Soma de Quadrados | Quadrado Médio | Estat. F | P-valor | |
|---|---|---|---|---|---|
| Tempo | 1 | 6,0817 | 6,0815 | 1,6010 | 0,2228 |
| Lote | 2 | 52,2446 | 26,1223 | 6,8768 | 0,0065 |
| Lote:Tempo | 2 | 27,7312 | 13,8656 | 3,6502 | 0,0480 |
| Resíduos | 17 | 64,5769 | 3,7986 |
Como $p-$valor = $0,0480 < 25%$ rejeita-se a hipótese de paralelismo e ajusta-se um modelo considerando o Tempo, o fator Lote e interação entre eles. Isto posto, nesse caso, será considerado o cenário 3.
O modelo completo fica como sendo:
$$Y = \beta_0 + \beta_1\cdot \text{Tempo}\cdot +\beta_2\cdot \text{LoteB}\cdot +\beta_3\cdot \text{LoteC}\cdot +\beta_4\cdot \text{Tempo} \cdot \text{Lote2} + \beta_5\cdot \text{Tempo} \cdot \text{Lote3}$$
Com o modelo acima é calculado o intercepto e o coeficiente angular para cada lote.
- Lote A: $Y = 100,0879 + 0,0001\cdot \text{Tempo}$
- Lote B: $Y = (100,0879+3,0136) + (0,0001 -0,2897)\cdot \text{Tempo} = 103,1014 -0,2897 \cdot \text{Tempo}$
- Lote C: $Y = (100,0879 - 3,0136) + (0,0001 -0,0225) \cdot \text{Tempo} = 103,4870 - 0,0225 \cdot \text{Tempo}$
Nota-se que, nesse caso, o maior coeficiente angular em valores absolutos (0,2897) é referente ao lote B. Assim, os limites de acompanhamento são dados por: $$ LIA = Y_0 + t \cdot \widehat{\beta}_M - t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+x_{t}^{T}\left(X^{T} X\right)^{-1} x_{t}} $$
$$ LSA = Y_0 + t \cdot \widehat{\beta}_M + t^* \cdot \widehat{\sigma} \cdot\sqrt{ 1+x_{t}^{T}\left(X^{T} X\right)^{-1} x_{t}} $$
No presente caso tem-se:
- $\widehat{\sigma}^{2} = 3,79$;
- $\widehat{\beta}_M = -0,2897$;
- $t_{\left(1 - \frac{\alpha}{2}, n-p-1\right)} = t_{\left(1 - \frac{0,0027}{2}, 23 - 5 - 1\right)} = t_{\left(0,99865; 17\right)} = 3,507463$.
Portanto, os limites de acompanhamento ficam:
-
Pra o tempo 0, tem-se o vetor de covariáveis dado por $x_0^{\top} = [1, 0, 1, 0, 0,0]$. Logo,
$$ LIA = 108,7988 + 0 \cdot (-0,2897) - 3,507463 \sqrt{3,79\left(1+x_{0}^{\top}\left(X^{\top} X\right)^{-1} x_{0}\right)} = 100,7414 $$
$$ LSA = 108,7988 + 0 \cdot (-0,2897) + 3,507463 \sqrt{3,79\left(1+x_{h}^{\top}\left(X^{\top} X\right)^{-1} x_{h}\right)} = 116,8562. $$
-
Pra o tempo 12, tem-se o vetor de covariáveis dado por $x_{12}^{\top} = [1, 12, 1, 0, 12,0]$. Logo,
$$ LIA = 108,7988 + 12 \cdot (-0,2897) - 3,507463 \sqrt{3,79\left(1+x_{12}^{\top}\left(X^{\top} X\right)^{-1} x_{12}\right)} = 97,9920 $$
$$ LSA = 108,7988 + 12 \cdot (-0,2897) + 3,507463 \sqrt{3,79\left(1+x_{12}^{\top}\left(X^{\top} X\right)^{-1} x_{12}\right)} = 112,6518. $$
- Pra o tempo 24, tem-se o vetor de covariáveis dado por $x_{24}^{\top} = [1, 24, 1, 0, 24,0]$. Logo,
$$ LIA = 108,7988 + 24 \cdot (-0,2897) - 3,507463 \sqrt{3,79\left(1+x_{24}^{\top}\left(X^{\top} X\right)^{-1} x_{24}\right)} = 93,2499 $$
$$ LSA = 108,7988 + 24 \cdot (-0,2897) + 3,507463 \sqrt{3,79\left(1+x_{24}^{\top}\left(X^{\top} X\right)^{-1} x_{24}\right)} = 110,4400. $$
Para os limites superiores de acompanhamento que resultaram em um valor maior do que o limite superior de especificação, serão considerados $LSA = 110$.
Como saída do Action Stat, tem-se:
\begin{figure}[H] \centering\includegraphics[scale=0.85]{Figura/ex_acomp_3.png}\label{action_web_318_9} \end{figure}