6.7 Teste de Equivalência
O teste de equivalência é feito para testar se as dados de populações diferentes podem ser considerados semelhantes. Pode ser utilizado também na avaliação da equivalência entre dois procedimentos, tanto para dados binários quanto para dados contínuos.
O descrever da metodologia está separado pelos tópicos:
-
Dados binários:
– Teste de não inferioridade;
– Teste de superioridade;
– Teste de equivalência.
-
Dados contínuos:
– Teste de equivalência: variâncias iguais;
– Teste de equivalência: variâncias diferentes.
7.1 Dados Binários
Nesta seção, descreve-se os testes de equivalência para dados binários. Para estes têm-se três possíveis testes, sendo eles o teste de não inferioridade, superioridade e equivalência. Eles visam comparar se um procedimento alternativo é quase tão “bom” (não muito pior), equivalente ou ainda superior a um procedimento referência (ou compendial).
No cenário do teste de equivalência, tem-se que este é construído por meio do procedimento TOST Two One-Sided Tests (DJ Schuirmann, 1987), o qual consiste em aplicar dois testes $t$ unilaterais, possibilitando assim concluir a favor ou não da equivalência entre dois procedimentos.
Teste de não inferioridade
Os testes de não inferioridade são testes de hipóteses nos quais as hipóteses nula e alternativa são organizadas para testar se um procedimento é quase tão bom (ou não muito pior) do que o procedimento referência (ou compendial). Neste caso, tem-se interesse em mostrar que uma nova metodologia é quase tão “boa” quanto a metodologia compendial.
Esta seção está baseada na norma United States Pharmacopeia , em que define a hipótese de não inferioridade como a proporção de resultados positivos para o procedimento alternativo $(P_A)$ menos a proporção de resultados positivos para o procedimento tradicional $(P_C)$, em relação a uma margem de tolerância de não inferioridade $\Delta \sim (>0)$. Vale ressaltar que o software Action utiliza como default os valores $P_A = 0,5$ e $P_C = 0,7$ para o teste de não inferioridade, conforme a norma United States Pharmacopeia .
A hipótese de não inferioridade é dada por: $$H_0: P_A - P_C \leq - \Delta \quad \hbox{e} \quad H_1: P_A - P_C > - \Delta$$
Assim, o teste de não inferioridade pode ser escrito na forma:
$$ \frac{P_A}{P_C} \leq R \quad \text{e} \quad \frac{P_A}{P_C} > R,$$ em que $R = \frac{P_C - \Delta}{P_C}$, $\Delta > 0$ e $R \leq 1$, observe que $R$ é uma razão de proporções. A partir do teste formulado por meio das razões de proporções, obtêm-se as seguintes hipóteses para o teste de não inferioridade
$$H_0: P_A - RP_C \leq 0 \quad \text{e} \quad H_1: P_A - RP_C > 0$$
Sob a hipótese nula, tem-se que a estatística de teste é dada por $$Z_{obs} = \frac{\hat{P}_A - R\hat{P}_C}{\sqrt{V}} $$
Se $Z_{obs} \geq z_{\alpha}$ rejeita-se a hipótese $H_0$, assim conclui-se a favor da não inferioridade. Tem-se que $z_{\alpha}$ é o quantil superior da distribuição normal padrão e $V$ corresponde ao estimador de máxima verossimilhança para a variância sob a hipótese nula, $H_0$.
O cálculo do $\hbox{p-valor}$ é dado por $$\hbox{p-valor} = P(Z \ > \ Z_{obs})$$
Se $\hbox{p-valor} \leq \alpha$ rejeita-se a hipótese nula, assim conclui-se a favor da não inferioridade. Em relação ao cálculo do intervalo de confiança, tem-se que este é dado por $$ IC( P_{a} - P_{c}; 1 - \alpha) = \left ( \max(-1; \hat{P_A} - \hat{P_C} - z_{\alpha} \times \sqrt{V}) ; 1 \right ) $$
Vale ressaltar que tem-se um intervalo de confiança para a razão de proporções, logo o $IC \in (-1, 1)$ e, também, tem-se apenas o limite inferior, $LI$, do intervalo de confiança, isto é, $$ LI = \max(-1; \hat{P_A} - \hat{P_C} - z_{\alpha} \times \sqrt{V}) $$
A United States Pharmacopeia sugere utilizar uma margem de não inferioridade, $\Delta$, de $0,2$. A USP também requer que o poder do teste seja de no mínimo 80%, assim o tamanho de amostra deve ser calculado com base neste. Conforme sugerido pela USP, para os testes microbiológicos qualitativos de não inferioridade, o tamanho amostral é de no mínimo 75 amostras para cada método e microrganismo.
Na Tabela 6.7.1, apresenta-se a descrição dos parâmetros utilizados no teste de não inferioridade.
| Descrição dos Parâmetros | |
|---|---|
| $N_A$ | Tamanho da amostra do método alternativo |
| $N_C$ | Tamanho da amostra do método tradicional |
| $X_A$ | Amostra alternativa |
| $X_C$ | Amostra tradicional |
| $P_A$ | Proporção para o método alternativo |
| $P_C$ | Proporção para o método tradicional |
| $\hat{P}_A$ | $\cfrac{X_A}{N_A}$ |
| $\hat{P}_C$ | $\cfrac{X_C}{N_C}$ |
| $\theta$ | $\cfrac{N_C}{N_A} = 1$ |
| $R$ | $\cfrac{P_C - \Delta}{P_C}$ |
| $a$ | $1 + \theta = 2$ |
| $b$ | $-\left[ R (1 + \theta \hat{P}_C) + \theta + \hat{P}_A\right]$ |
| $c$ | $R (\hat{P_A} + \theta \hat{P_C})$ |
| $\tilde{P}_A$ | $\cfrac{ \left[- b - \sqrt{b^2 - 4 a c} \right]}{2a}$ |
| $\tilde{P}_C$ | $\cfrac{\tilde{P}_A}{R}$ |
| $V$ | $\cfrac{\tilde{P}_A (1 - \tilde{P}_A)}{N_A} + R^2 ~ \cfrac{\tilde{P}_C (1 - \tilde{P}_C)}{N_C}$ |
| $Z$ | $\cfrac{(\hat{P}_A - R \hat{P}_C)}{\sqrt{V}}$ |
Tabela 6.7.1: Descrição dos parâmetros utilizados no teste de não inferioridade.
Teste de superioridade
Os testes de superioridade são testes de hipótese nos quais as hipóteses nula e alternativa são organizadas para testar se um procedimento alternativo é superior em relação a um procedimento referência (ou compendial). Nesse caso, tem-se interesse em mostrar que uma nova metodologia é tão “boa” quanto a metodologia compendial.
O teste de hipótese de superioridade é definido como a proporção de resultados positivos para o procedimento alternativo ($P_A$) menos a proporção de resultados positivos para o procedimento tradicional ($P_C$), em relação a uma margem de superioridade $\Delta ~(>0)$. Vale ressaltar que o software Action utiliza como default os valores $P_A = 0,7$ e $P_C = 0,5$ para o teste de superioridade. A hipótese de superioridade é dada por: $$H_0: P_A - P_C \leq \Delta \quad \text{e} \quad H_1: P_A - P_C > \Delta$$
Assim, o teste de superioridade pode ser escrito na forma: $$ \frac{P_A}{P_C} \leq R \quad \text{e} \quad \frac{P_A}{P_C} > R,$$ em que $R = \frac{P_C + \Delta}{P_C}$, $\Delta > 0$ e $R \geq 1$, observe que $R$ é uma razão de proporções. A partir do teste formulado por meio das razões de proporções, obtêm-se as seguintes hipóteses para o teste de superioridade
$$H_0: P_A - RP_C \leq 0 \quad \text{e} \quad H_1: P_A - RP_C > 0$$
Sob a hipótese nula, tem-se que a estatística de teste é dada por: $$Z_{obs} = \frac{\hat{P}_A - R\hat{P}_C}{\sqrt{V}} $$
Se $Z_{obs} > z_{\alpha}$ rejeita-se a hipótese $H_0$, assim, conclui-se a favor da superioridade. Tem-se que $z_{\alpha}$ é o quantil superior da distribuição normal padrão.
O cálculo do $\hbox{p-valor}$ é dado por $$\hbox{p-valor} = P(Z > Z_{obs})$$
Se $\hbox{p-valor} \ < \ \alpha$ rejeita-se a hipótese nula, assim conclui-se a favor da superioridade.
Em relação ao cálculo do intervalo de confiança, tem-se que este é dado por: $$ IC( P_{a} - P_{c}; 1 - \alpha) = \left (-1; \min(1; \hat{P_A} - \hat{P_C} + z_{\alpha} \times \sqrt{V}) \right ) $$
Vale ressaltar que tem-se um intervalo de confiança para a razão de proporções, logo o $IC \in (-1, 1)$ e, também, tem-se apenas o limite superior do intervalo de confiança, isto é, $$ LS = \min(1; \hat{P_A} - \hat{P_C} + z_{\alpha} \times \sqrt{V}) $$
Na Tabela 6.7.2, apresenta-se a descrição dos parâmetros.
| Descrição dos Parâmetros | |
|---|---|
| $N_A$ | Tamanho da amostra do método alternativo |
| $N_C$ | Tamanho da amostra do método tradicional |
| $X_A$ | Amostra alternativa |
| $X_C$ | Amostra tradicional |
| $P_A$ | Proporção para o método alternativo |
| $P_C$ | Proporção para o método tradicional |
| $\hat{P}_A$ | $\cfrac{X_A}{N_A}$ |
| $\hat{P}_C$ | $\cfrac{X_C}{N_C}$ |
| $\theta$ | $\cfrac{N_C}{N_A} = 1$ |
| $R$ | $\cfrac{P_C + \Delta}{P_C}$ |
| $a$ | $1 + \theta = 2$ |
| $b$ | $-\left[ R (1 + \theta \hat{P}_C) + \theta + \hat{P}_A\right]$ |
| $c$ | $R (\hat{P_A} + \theta \hat{P_C})$ |
| $\tilde{P}_A$ | $\cfrac{ \left[- b - \sqrt{b^2 - 4 a c} \right]}{2a}$ |
| $\tilde{P}_C$ | $\cfrac{\tilde{P}_A}{R}$ |
| $V$ | $\cfrac{\tilde{P}_A (1 - \tilde{P}_A)}{N_A} + R^2 ~ \cfrac{\tilde{P}_C (1 - \tilde{P}_C)}{N_C}$ |
| $Z$ | $\cfrac{(\hat{P}_A - R \hat{P}_C)}{\sqrt{V}}$ |
Tabela 6.7.2: Descrição dos parâmetros utilizados no teste de superioridade.
Teste de Equivalência
Os testes de equivalência são testes de hipótese nos quais as hipóteses nula e alternativa são organizadas para testar se um procedimento alternativo é equivalente em relação a um procedimento referência (ou compendial), neste cenário tem-se interesse em mostrar que uma nova metodologia é equivalente a metodologia compendial.
O teste de hipótese de equivalência é definido como a proporção de resultados positivos para o procedimento alternativo ($P_A$) menos a proporção de resultados positivos para o procedimento tradicional ($P_C$), em relação a uma margem de equivalência ($-\Delta, \Delta$). Vale ressaltar que para o teste de equivalência o software Action utiliza como default $P_A = 0,5$ e $P_C = 0,7$. A hipótese de equivalência é dada por: $$H_0: P_A - P_C \leq - \Delta \quad \text{ou} \quad P_A - P_C \geq \Delta \quad \text{e} \quad H_1: - \Delta < P_A - P_C < \Delta $$
O teste de hipótese acima pode ser decomposto em: $$H_{01} : P_A - P_C \leq - \Delta \quad \text{e} \quad H_{11}: P_A - P_C > - \Delta$$ e $$H_{02}: P_A - P_C \geq \Delta \quad \text{e} \quad H_{12}: P_A - P_C < \Delta$$
A decomposição do teste de equivalência se dá pelo procedimento TOST Two One-Sided Test, o qual consiste em decompor o teste de equivalência em dois testes unilaterais.
Sob as hipóteses nulas, tem-se que as estatísticas de teste são dadas por: $$Z_{0i} = \frac{\hat{P}_A - R_{i}\hat{P}_C}{\sqrt{V}}, $$ em que $i = 1,2$ se referem as hipóteses nulas $H_{01}$ e $H_{02}$. Tem-se que $R_{i}$ é dado de acordo com a hipótese a que se refere, sendo dado por $R_{1} = \frac{P_C - \Delta}{P_C}$, $R_{1} \leq 1$ quando testa-se $H_{01}$ e $R_{2} = \frac{P_A + \Delta}{P_A}$, $R_{2} \geq 1$ quando testa-se $H_{02}$.
Se $Z_{01} \geq z_{\alpha}$ rejeita-se a hipótese $H_{01}$ e se $Z_{02} \geq - z_{\alpha}$ rejeita-se a hipótese $H_{02}$. Em que $z_{\alpha}$ é o quantil superior da distribuição normal padrão e $- z_{\alpha}$ é o quantil inferior da distribuição normal padrão. Assim, conclui-se em favor da equivalência se as hipóteses $H_{01}$ e $H_{02}$ forem rejeitadas simultaneamente.
O cálculo do $\hbox{p-valor}$ é dado por $$\hbox{p-valor} = P(Z_{1} \ > \ Z_{01}) + P(Z_{2} \ < \ Z_{02}) $$
Se $\hbox{p-valor} \ < \ \alpha$ rejeita-se a hipótese nula, assim conclui-se a favor da equivalência. Em relação ao cálculo do intervalo de confiança, tem-se que este é dado por $$ IC( P_{a} - P_{c}; 1 - \alpha) = \left ( \max(-1; \hat{P_A} - \hat{P_C} - z_{\alpha} \times \sqrt{V}) ; \quad \min(1; \hat{P_A} - \hat{P_C} + z_{\alpha} \times \sqrt{V}) \right ) $$
A seguir, apresenta-se a Tabela 6.7.3, com a descrição dos parâmetros para a aplicação do teste de equivalência. Ressalta-se que a razão de proporção $R$ depende da hipótese a ser testada, isto é, quanto tem-se:
-
$H_{01} : P_A - P_C \leq - \Delta$, adota-se $R_{1} = \cfrac{P_C - \Delta}{P_C}$
-
$H_{02}: P_A - P_C \geq \Delta$, adota-se $R_{2} = \cfrac{P_A + \Delta}{P_A}$
Na Tabela 6.7.3, denota-se $R_{i}, i = 1, 2$, respectivamente para as hipóteses $H_{01}$ e $H_{02}$.
| Descrição dos Parâmetros | |
|---|---|
| $N_A$ | Tamanho da amostra do método alternativo |
| $N_C$ | Tamanho da amostra do método tradicional |
| $X_A$ | Amostra alternativa |
| $X_C$ | Amostra tradicional |
| $P_A$ | Proporção para o método alternativo |
| $P_C$ | Proporção para o método tradicional |
| $\hat{P}_A$ | $\cfrac{X_A}{N_A}$ |
| $\hat{P}_C$ | $\cfrac{X_C}{N_C}$ |
| $\theta$ | $\cfrac{N_C}{N_A} = 1$ |
| $R$ | $R_{i}$ |
| $a$ | $1 + \theta = 2$ |
| $b$ | $-\left[ R_{i} (1 + \theta \hat{P}_C) + \theta + \hat{P}_A\right]$ |
| $c$ | $R_{i} (\hat{P_A} + \theta \hat{P_C})$ |
| $\tilde{P}_A$ | $\cfrac{ \left[- b - \sqrt{b^2 - 4 a c} \right]}{2a}$ |
| $\tilde{P}_C$ | $\cfrac{\tilde{P}_A}{R_{i}}$ |
| $V$ | $\cfrac{\tilde{P}_A (1 - \tilde{P}_A)}{N_A} + R_{i}^2 ~ \cfrac{\tilde{P}_C (1 - \tilde{P}_C)}{N_C}$ |
| $Z$ | $\cfrac{(\hat{P}_A - R_{i} \hat{P}_C)}{\sqrt{V}}$ |
Tabela 6.7.3: Descrição dos parâmetros utilizados no teste de equivalência.
7.2 Dados Contínuos
Nesta seção, descreve-se o teste de equivalência para dados contínuos. Como apresentado na seção 7.1, os testes de equivalência são testes nos quais as hipóteses são organizadas para testar se dois conjuntos de dados independentes são equivalentes, isto é, no cenário farmacêutico, as hipóteses são organizadas para se testar se dois procedimentos são equivalentes farmacêuticos.
Denotando-se:
-
$X_{a}$: amostra do procedimento alternativo;
-
$X_{c}$: amostra do procedimento compendial.
A hipótese do teste de equivalência para dados contínuos é dada por:
$$H_{0}: | \mu_{a} - \mu_{c} | \geq \Delta \quad \text{vs} \quad H_{1}: | \mu_{a} - \mu_{c} | < \Delta $$
A qual também pode ser escrita na forma:
$$ H_{0}: \mu_{a} - \mu_{c} \leq - \Delta \quad \text{ou} \quad \mu_{a} - \mu_{c} \geq \Delta \quad \text{vs} \quad H_{1}: - \Delta < \mu_{a} - \mu_{c} < \Delta $$
As hipóteses dadas acima podem ser decompostas em dois testes de hipóteses para $H_{0}$ e $H_{1}$, por meio do procedimento *TOST* (DJ Schuirmann, 1987), isto é, pode-se decompô-las em dois testes de hipóteses unilaterais. Assim as hipóteses são dadas por: $$ H_{01}: \mu_{a} - \mu_{c} \leq - \Delta \quad \text{vs} \quad H_{11}: \mu_{a} - \mu_{c} > - \Delta $$ e $$ H_{02}: \mu_{a} - \mu_{c} \geq \Delta \quad \text{vs} \quad H_{12}: \mu_{a} - \mu_{c} < \Delta $$
Em que:
-
$\mu_{a}$ é a média populacional do procedimento alternativo;
-
$\mu_{c}$ é a média populacional do procedimento compendial (ou referência);
-
$\Delta$ é a margem de tolerância (ou equivalência), sendo $\Delta > 0$.
O procedimento de teste TOST consiste em rejeitar ambas as hipóteses $H_{01}$ e $H_{02}$. Sob a suposição de normalidade das populações, isto é, $X_{a} \sim (\mu_{a}, \sigma_{a}^2)$ e $X_{c} \sim (\mu_{c}, \sigma_{c}^2)$ e tamanho amostral pequeno, utiliza-se um teste $t$ para a comparação de médias.
Sob a hipótese nula, tem-se que a estatística de teste é dada por:
$$T = \frac{ \mid \bar{x}_{a} - \bar{x}_{c} \mid - \Delta}{ s_{d} } \tag{7.1}$$
Ou ainda
$$T_{1} = \frac{( \bar{x}_{a} - \bar{x}_{c} ) + \Delta}{s_{d} } \quad \text{e} \quad T_{2} = \frac{ \Delta - ( \bar{x}_{a} - \bar{x}_{c} ) }{ s_{d} } \tag{7.2}$$
Em que
-
$\bar{x}_a$ é a média amostral do procedimento alternativo;
-
$\bar{x}_c$ é a média amostral do procedimento compendial;
-
$s_{d}$ é o desvio-padrão amostral.
Tem-se que $T_{1}$ refere-se a hipótese $H_{01}$ e $T_{2}$ refere-se a hipótese $H_{02}$. Logo, por meio do *TOST* conclui-se a favor da equivalência se $T_{1} \geq t_{(\nu, 1 - \alpha)}$ e $T_{2} \geq t_{(\nu, 1 - \alpha)}$, em que $\alpha$ é o nível de significância e $\nu$ os graus de liberdade.
Vale ressaltar que o software Action Stat utiliza as estatísticas de teste dadas pela equação 7.2.
Em relação a variância populacional, tem-se que as variâncias podem ser iguais ($\sigma^2_{a} = \sigma^2_{c}$) ou diferentes ($\sigma^2_{a} \neq \sigma^2_{c}$), sendo ambas desconhecidas. Em que:
-
$\sigma^2_{a}$ é a variância populacional do procedimento alternativo;
-
$\sigma^2_{c}$ é a variância populacional do procedimento compendial.
Desta forma, tem-se que o teste de equivalência para dados contínuos depende das variâncias populacionais. A seguir, apresenta-se a estatística de teste para ambos os casos descritos.
Variâncias iguais
Se as variâncias forem iguais, tem-se que $s_{d}$ é dado por:
$$ s_{d} = s_{p} \sqrt{\frac{1}{n_{a}} + \frac{1}{n_{c}}} $$
No qual $s_{p}$ é:
$$s_{p} = \sqrt{\frac{(n_{a} - 1)s^{2}_{a} + (n_{c} - 1)s^{2}_{c}}{n_{a} + n_{c} - 2}}$$
Em que:
-
$n_{a}$ é o tamanho amostral do procedimento alternativo;
-
$n_{c}$ é o tamanho amostral do procedimento compendial;
-
$s_{p}$ é o desvio-padrão agrupado;
-
$s_{a}^2$ é a variância amostral do procedimento alternativo;
-
$s_{c}^2$ é a variância amostral do procedimento compendial.
Desta forma, sob as hipóteses nulas tem-se que a estatística de teste é dada por:
$$ T_{1} = \frac{( \bar{x}_{a} - \bar{x}_{c} ) + \Delta }{ s_{p} \sqrt{\frac{1}{n_{a}} + \frac{1}{n_{c}}} } \quad \text{e} \quad T_{2} = \frac{\Delta - ( \bar{x}_{a} - \bar{x}_{c} ) }{ s_{p} \sqrt{\frac{1}{n_{a}} + \frac{1}{n_{c}}} } \tag{7.3} $$
Se $T_{1} \geq t_{(\nu, 1 - \alpha)}$ e $T_{2} \geq t_{(\nu, 1 - \alpha)}$, rejeitam-se as hipótese nulas, isto é, rejeita-se que os procedimentos não são equivalentes. Em que $t_{(\nu, 1 - \alpha)}$ é o quantil superior da distribuição $t$ de Student, com $\nu = n_{a} + n_{c} - 2$ graus de liberdade. Assim, conclui-se a favor da equivalência entre os procedimentos.
Variâncias diferentes
Se as variâncias forem diferentes, tem-se que $s_{d}$ é dado por: $$ s_{d} = \sqrt{\frac{s^{2}_{a}}{n_{a}} + \frac{s^{2}_{c}}{n_{c}}} $$
Em que:
-
$n_{a}$ é o tamanho amostral do procedimento alternativo;
-
$n_{c}$ é o tamanho amostral do procedimento compendial;
-
$s_{a}^2$ é a variância amostral do procedimento alternativo;
-
$s_{c}^2$ é a variância amostral do procedimento compendial.
Desta forma, sob a hipótese nula tem-se que a estatística de teste é dada por: $$ T_{1} = \frac{( \bar{x}_{a} - \bar{x}_{c} ) + \Delta }{ \sqrt{\frac{s^{2}_{a}}{n_{a}} + \frac{s^{2}_{c}}{n_{c}}}} \quad \text{e} \quad T_{2} = \frac{\Delta - ( \bar{x}_{a} - \bar{x}_{c} ) }{ \sqrt{\frac{s^{2}_{a}}{n_{a}} + \frac{s^{2}_{c}}{n_{c}}}} \tag{7.4}$$
Se $T_{1} \geq t_{(\nu, 1 - \alpha)}$ e $T_{2} \geq t_{(\nu, 1 - \alpha)}$, rejeita-se as hipóteses nulas, isto é, rejeita-se que os procedimentos não são equivalentes. Assim, conclui-se a favor da equivalência entre os procedimentos. Em que $t_{(\nu, 1 - \alpha)}$ é o quantil superior da distribuição $t$ de Student, com $\nu$ graus de liberdade, sendo $\nu$ dado por:
$$ \nu = \frac{ (\frac{s_{a}^2}{n_{a}} + \frac{s_{c}^2}{n_{c}})^2 }{ \frac{(\frac{s_{a}^2}{n_{a}})^2}{(n_{a} - 1) } + \frac{(\frac{s_{c}^2}{n_{c}})^2}{(n_{c} - 1)} } $$
Posteriormente ao cálculo da estatística de teste, pode-se calcular o $p-valor$ deste. O qual é dados por: $$ \hbox{p-valor} = P(t_{(\nu; 1 - \alpha)} > T_{1}) + P(t_{(\nu; 1 - \alpha)} > T_{2}) \tag{7.5}$$
Se $\hbox{p-valor} \leq \alpha$, rejeita-se a hipótese nula, isto é, rejeita-se $H_{01}$ e $H_{02}$, logo conclui-se que os procedimentos são equivalentes ao nível de significância $\alpha$.
O intervalo de confiança para o teste é dado por: $$IC(\mu_{a} - \mu_{c}; 1 - 2 \times \alpha) = \left(( \mu_{a} - \mu_{c} ) - t_{(\nu, 1 - \alpha)} \times s_{d}; \quad (\mu_{a} - \mu_{c} ) + t_{(\nu, 1 - \alpha)} \times s_{d} \right) \tag{7.6} $$
Em que $s_{d}$ é dado conforme a igualdade ou desigualdade das variâncias populacionais. Desta forma, tem-se que o limite inferior $LI$ e o limite superior $LS$ do intervalo de confiança são:
-
$LI = ( \mu_{a} - \mu_{c} ) - t_{(\nu, 1 - \alpha)} \times s_{d} $
-
$LS = ( \mu_{a} - \mu_{c} ) + t_{(\nu, 1 - \alpha)} \times s_{d} $
Se $ LI \ > \ - \Delta $ e $LS \ < \ \Delta$, rejeita-se a hipótese nula, assim conclui-se que os procedimentos são equivalentes.
7.3 Aplicações
A seguir aplicam-se as metodologias referentes aos testes de equivalência para dados binários e dados contínuos, conforme descritas no protocolo. Deseja-se avaliar se um determinado procedimento alternativo é não inferior, equivalente e superior a um procedimento referência. Apresentam-se cinco exemplos, aplicando-se os testes de não inferioridade, superioridade e equivalência para dados binários, assim como teste de equivalência para dados contínuos, nos casos com variâncias iguais e diferentes.
Dados binários: teste de não inferioridade
A seguir, apresenta-se o teste de não inferioridade. Neste exemplo deseja-se testar se uma nova metodologia é não inferior a metodologia compendial. Para isso, avalia-se a proporção de resultados positivos para ambos os métodos. Os dados resumidos são dados na Tabela 6.7.4 a seguir.
| Resultados | Alternativo | Compedial |
|---|---|---|
| Positivo | 105 | 133 |
| Estéril | 45 | 17 |
| Total | 150 | 150 |
Tabela 6.7.4: Dados resumidos para o teste de não inferioridade.
As hipóteses do teste são dadas por $$H_0: P_A - P_C \leq - \Delta \quad \text{e} \quad H_1: P_A - P_C > - \Delta$$
Conforme sugerido pela USP, adota-se $\Delta = 0,2$. Calculando-se os parâmetros conforme a Tabela 6.7.1, obtêm-se as seguintes quantidades:
$$ \hat{P}_A = \cfrac{X_A}{N_A} = \cfrac{105}{150} = 0,7 \quad \text{e} \quad \hat{P}_C = \cfrac{X_C}{N_C} = \cfrac{133}{150} = 0,886 $$
Tem-se também que $$ R = \cfrac{P_C - \Delta}{P_C} = \cfrac{0,7 - 0,2}{0,7} = 0,7142857 $$
$b = -\left[ R (1 + \theta \hat{P}_C) + \theta + \hat{P}_A\right]$
$ \quad = -\left[ 0,7142857 (1 + 1 \times 0,886) + 1 + 0,7 \right] $
$ \quad = -3,047143$
$$ c = R (\hat{P_A} + \theta \hat{P_C}) = 0,7142857 (0,7 + 1 \times 0,886) = 1,1333 $$
Logo, $$ \tilde{P}_A = \cfrac{ \left[- b - \sqrt{b^2 - 4 a c} \right]}{2a} = \cfrac{ \left[3,047 - \sqrt{(-3,047)^2 - 4 \times 2 \times 1,1333} \right]}{4} = 0,64429 $$ e $$ \tilde{P}_C = \cfrac{\tilde{P}_A}{R} = \cfrac{0,64429}{0,71428} = 0,902012 $$
A estimativa da variância é dada por
$ V = \cfrac{\tilde{P}_A (1 - \tilde{P}_A)}{N_A} + R^2 ~ \cfrac{\tilde{P}_C (1 - \tilde{P}_C)}{N_C} = $
$ \quad = \cfrac{0,64429 (1 - 0,64429)}{150} + 0,5102041 ~ \cfrac{0,902012 (1 - 0,902012)}{150} = $
$ \quad = 0,001828494 $
Sob a hipótese nula, tem-se que a estatística de teste é dada por $$ Z = \cfrac{(\hat{P}_A - R \hat{P}_C)}{\sqrt{V}} = \cfrac{(0,7 - (0,71428 \times 0,886))}{0,04276} = 1,559 $$
Adotando-se um nível de significância de $5\char37$, obtém-se $z_{\alpha} = 1,644854$. Como $Z \leq z_{\alpha}$ não rejeita-se a hipótese nula, assim conclui-se que o método alternativo é inferior ao método compendial.
O cálculo do $\hbox{p-valor}$ é dado por $$\hbox{p-valor} = P(Z \ > \ Z_{obs}) = 0,059$$
Se $\hbox{p-valor} \ > \ \alpha$ não rejeita-se a hipótese nula, assim conclui-se contra a não inferioridade. Em relação ao cálculo do intervalo de confiança, tem-se que este é dado por $$ IC( P_{a} - P_{c}; 1 - \alpha) = \left ( \max(-1; \hat{P_A} - \hat{P_C} - z_{\alpha} \times \sqrt{V}) ; 1 \right ) $$
Vale ressaltar que tem-se um intervalo de confiança para a razão de proporções, logo o $IC \in (-1, 1)$ e, também, tem-se apenas o limite inferior, $LI$, do intervalo de confiança, isto é,
$LI = \max(-1; \hat{P_A} - \hat{P_C} - z_{\alpha} \times \sqrt{V})$
$ \qquad = \max(-1; -0,186 - 1,644854 \times \sqrt{0,001828494})$
$ \qquad = \max(-1; -0,26150165 ) = -0,26150165 $
A seguir, apresenta-se a Tabela 6.7.5, a qual consiste em um resumo dos valores obtidos para o teste de não inferioridade.
| Descrição dos Parâmetros | |
|---|---|
| $N_A = 150$ | Tamanho da amostra do método alternativo |
| $N_C=150$ | Tamanho da amostra do método tradicional |
| $X_A = 105$ | Amostra alternativa |
| $X_C = 133$ | Amostra tradicional |
| $P_A = 0,5$ | Proporção para o método alternativo |
| $P_C = 0,7$ | Proporção para o método tradicional |
| $\hat{P}_A $ | $ 0,7 $ |
| $\hat{P}_C$ | $ 0,886$ |
| $\theta$ | $\cfrac{N_C}{N_A} = 1$ |
| $R$ | $ 0,7142857$ |
| $a$ | $1 + \theta = 2$ |
| $b$ | $ -3,047143 $ |
| $c$ | $1,1333$ |
| $\tilde{P}_A$ | $0,64429$ |
| $\tilde{P}_C$ | $0,902012$ |
| $V$ | $0,001828494$ |
| $Z$ | $1,559$ |
Tabela 6.7.5: Resultados obtidos para o teste de não inferioridade.
A seguir, apresentam-se os resultados obtidos por meio da ferramenta teste de não inferioridade do Action Stat.
| Quantidade | Proporção Estimada | |
|---|---|---|
| Positivo | 133 | 0.8867 |
| Estéril | 17 | 0.1133 |
| Total | 150 | 1 |
Tabela 6.7.7: Resultados do Método Compendial
| Quantidade | Proporção Estimada | |
|---|---|---|
| Positivo | 105 | 0.7 |
| Estéril | 45 | 0.3 |
| Total | 150 | 1 |
Tabela 6.7.8: Resultados do Método Alternativo
| Valor | |
|---|---|
| $\theta$ | 1 |
| Razão de Proporções ($R$) | 0.7143 |
| a | 2 |
| b | -3.0476 |
| c | 1.1333 |
| $\tilde{p}_a$ | 0.6443 |
| $\tilde{p}_c$ | 0.902 |
| Variância ($V$) | 0.0018 |
| Raiz($V$) | 0.0428 |
| $\hat{p}_a - R \ast \hat{p}_c$ | 0.0667 |
Tabela 6.7.9: Parâmetros de Teste - $H_0: P_a - P_c <= - \Delta$
| Valor | |
|---|---|
| Nível de significância | 0.05 |
| Quantil da Normal Padrão - Não inferioridade | 1.6449 |
| P-Valor | 0.0595 |
Tabela 6.7.10: Critério de Rejeição
| Valor | |
|---|---|
| Nível de Confiança | 0.95 |
| Limite Inferior | -0.2615 |
Tabela 6.7.11: Intervalo de Confiança
Figura 6.7.1: Gráfico de barras dos Métodos Alternativo e Compedial
Dados binários: teste superioridade
A seguir, apresenta-se o teste de superioridade. Neste exemplo deseja-se testar se uma nova metodologia é superior a metodologia compendial. Para isso, avalia-se a proporção de resultados positivos para ambos os métodos. Os dados resumidos são dados na Tabela 6.7.12 a seguir.
| Resultados | Alternativo | Compedial |
|---|---|---|
| Positivo | 133 | 105 |
| Estéril | 17 | 45 |
| Total | 150 | 150 |
Tabela 6.7.12: Dados resumidos para o teste de não inferioridade.
As hipóteses do teste são dadas por $$H_0: P_A - P_C \leq \Delta \quad \text{e} \quad H_1: P_A - P_C > \Delta$$
Conforme sugerido pela USP, adota-se $\Delta = 0,2$. Calculando-se os parâmetros conforme a Tabela 6.7.2, obtêm-se as seguintes quantidades: $$ \hat{P}_A = \cfrac{X_A}{N_A} = \cfrac{133}{150} = 0,887 \quad \text{e} \quad \hat{P}_C = \cfrac{X_C}{N_C} = \cfrac{105}{150} = 0,7 $$
Tem-se também que $$R = \cfrac{P_C + \Delta}{P_C} = \cfrac{0,5 + 0,2}{0,5} = 1,4 $$
$b = -\left[ R (1 + \theta \hat{P}_C) + \theta + \hat{P}_A\right] $
$ \quad = -\left[ 1,4 (1 + 1 \times 0,7) + 1 + 0,886 \right] $
$ \quad = -4,266667 $
$$ c = R (\hat{P_A} + \theta \hat{P_C}) = 1,4 (0,886 + 1 \times 0,7) = 2,221333$$
Logo,
$ \tilde{P}_A = \cfrac{ \left[- b - \sqrt{b^2 - 4 a c} \right]}{2a} $
$ \qquad = \cfrac{ \left[4,266667 - \sqrt{(-4,266667)^2 - 4 \times 2 \times 2,221333} \right]}{4} = 0,9020121 $
e $$ \tilde{P}_C = \cfrac{\tilde{P}_A}{R} = \cfrac{0,825946}{1,4} = 0,644294 $$
A estimativa da variância é dada por
$V = \cfrac{\tilde{P}_A (1 - \tilde{P}_A)}{N_A} + R^2 ~ \cfrac{\tilde{P}_C (1 - \tilde{P}_C)}{N_C}$
$ \quad = \cfrac{0,9020121 (1 - 0,9020121)}{150} + 1,96 ~ \cfrac{0,644294 (1 - 0,644294)}{150}$
$ \quad = 0,003584$
Sob a hipótese nula, tem-se que a estatística de teste é dada por $$ Z = \cfrac{(\hat{P}_A - R \hat{P}_C)}{\sqrt{V}} = \cfrac{(0,886 - (1,4 \times 0,7))}{0,0035841} = -1,559057 $$
Adotando-se um nível de significância de $5\char37$, obtém-se $z_{\alpha} = 1,644854$. Como $Z \leq z_{\alpha}$ não rejeita-se a hipótese nula, assim conclui-se que o método alternativo é não superior ao método compendial.
O cálculo do $\hbox{p-valor}$ é dado por $$\hbox{p-valor} = P(Z \ > \ Z_{obs}) = 0,940508 $$
Como $\hbox{p-valor} \ > \ \alpha$ não rejeita-se a hipótese nula, assim conclui-se contra a superioridade. Em relação ao cálculo do intervalo de confiança, tem-se que este é dado por $$ IC( P_{a} - P_{c}; 1 - \alpha) = \left (-1; \min(1; \hat{P_A} - \hat{P_C} + z_{\alpha} \times \sqrt{V}) \right ) $$
Vale ressaltar que tem-se um intervalo de confiança para a razão de proporções, logo o $IC \in (-1, 1)$ e, também, tem-se apenas o limite superior, $LS$, do intervalo de confiança, isto é,
$LS = \min(1; \hat{P_A} - \hat{P_C} + z_{\alpha} \times \sqrt{V})$
$\qquad = \min(1; 0,1866667 + 1,644854 \times \sqrt{0,003584})$
$\qquad = \min(1; 0,2615016 ) = 0,2615016$
A seguir, apresenta-se a Tabela 6.7.13, a qual consiste em um resumo dos valores obtidos para o teste de superioridade.
| Descrição dos Parâmetros | |
|---|---|
| $N_A = 150$ | Tamanho da amostra do método alternativo |
| $N_C=150$ | Tamanho da amostra do método tradicional |
| $X_A = 133$ | Amostra alternativa |
| $X_C = 105$ | Amostra tradicional |
| $P_A = 0,7$ | Proporção para o método alternativo |
| $P_C = 0,5$ | Proporção para o método tradicional |
| $\hat{P}_A $ | $ 0,88 $ |
| $\hat{P}_C$ | $ 0,7$ |
| $\theta$ | $\cfrac{N_C}{N_A} = 1$ |
| $R$ | $ 1,4$ |
| $a$ | $1 + \theta = 2$ |
| $b$ | $ -4,266667 $ |
| $c$ | $ 2,221333 $ |
| $\tilde{P}_A$ | $ 0,9020121 $ |
| $\tilde{P}_C$ | $ 0,644294 $ |
| $V$ | $ 0,003584 $ |
| $Z$ | $ -1,559057 $ |
Tabela 6.7.13: Resultados obtidos para o teste de superioridade.
A seguir, apresentam-se os resultados obtidos por meio da ferramenta teste de superioridade do Action Stat.
| Quantidade | Proporção Estimada |
|---|---|
| Positivo | 105 |
| Estéril | 45 |
| Total | 150 |
Tabela 6.7.14: Resultados do Método Compendial
| Quantidade | Proporção Estimada |
|---|---|
| Positivo | 133 |
| Estéril | 17 |
| Total | 150 |
Tabela 6.7.15: Resultados do Método Alternativo
| Valor | |
|---|---|
| $\theta$ | 1 |
| Razão de Proporções ($R$) | 1.4 |
| a | 2 |
| b | -4.2667 |
| c | 2.2213 |
| $\tilde{p}_a$ | 0.902 |
| $\tilde{p}_c$ | 0.6443 |
| Variância ($V$) | 0.0036 |
| Raiz($V$) | 0.0599 |
| $\hat{p}_a - R \ast \hat{p}_c$ | -0.0933 |
Tabela 6.7.16: Parâmetros de Teste - $H_0: P_a - P_c <= \Delta$
| Valor | |
|---|---|
| Nível de significância | 0.05 |
| Quantil da Normal Padrão - Superioridade | 1.6449 |
| P-Valor | 0.9405 |
Tabela 6.7.17: Critério de Rejeição
| Valor | |
|---|---|
| Nível de Confiança | 0.95 |
| Limite Superior | 0.2615 |
Tabela 6.7.18: Intervalo de Confiança
Figura 6.7.2: Gráfico de barras dos Métodos Alternativo e Compedial
Dados binários: teste de equivalência
A seguir, apresenta-se o teste de equivalência. Neste exemplo deseja-se testar se uma nova metodologia é equivalente a metodologia compendial. Para isso, avalia-se a proporção de resultados positivos para ambos os métodos. Os dados resumidos são dados na Tabela 6.7.19 a seguir.
| Resultados | Alternativo | Compedial |
|---|---|---|
| Positivo | 105 | 133 |
| Estéril | 45 | 17 |
| Total | 150 | 150 |
Tabela 6.7.19: Dados resumidos para o teste de equivalência.
As hipóteses do teste são dadas por $$H_{01} : P_A - P_C \leq - \Delta \quad \text{e} \quad H_{11}: P_A - P_C > - \Delta$$ e $$H_{02}: P_A - P_C \geq \Delta \quad \text{e} \quad H_{12}: P_A - P_C < \Delta$$
Conforme sugerido pela USP, adota-se $\Delta = 0,2$. Calculando-se os parâmetros conforme a Tabela 6.7.19, obtêm-se as seguintes quantidades: $$ \hat{P}_A = \cfrac{X_A}{N_A} = \cfrac{105}{150} = 0,7 \quad \text{e} \quad \hat{P}_C = \cfrac{X_C}{N_C} = \cfrac{133}{150} = 0,886 $$
Ressalta-se que o Action Stat utiliza o procedimento TOST para o teste de equivalência. Calculando-se os parâmetros conforme as hipóteses, obtêm-se, para a hipótese $H_{01}$: $$R_{1} = \cfrac{P_C - \Delta}{P_C} = \cfrac{0,7 - 0,2}{0,7} = 0,7142857 $$
$ b = -\left[ R_{1} (1 + \theta \hat{P}_C) + \theta + \hat{P}_A\right]$
$\quad = -\left[ 0,7142857 (1 + 1 \times 0,886) + 1 + 0,7 \right] = -3,047143 $
$$ c = R_{1} (\hat{P_A} + \theta \hat{P_C}) = 0,7142857 (0,7 + 1 \times 0,886) = 1,1333$$
Logo, $$ \tilde{P}_A = \cfrac{ \left[- b - \sqrt{b^2 - 4 a c} \right]}{2a} = \cfrac{ \left[3,047 - \sqrt{(-3,047)^2 - 4 \times 2 \times 1,1333} \right]}{4} = 0,64429 $$ e $$ \tilde{P}_C = \cfrac{\tilde{P}_A}{R_{1}} = \cfrac{0,64429}{0,71428} = 0,902012 $$
$V = \cfrac{\tilde{P}_A (1 - \tilde{P}_A)}{N_A} + R_{1}^2 ~ \cfrac{\tilde{P}_C (1 - \tilde{P}_C)}{N_C} =$
$ \quad = \cfrac{0,64429 (1 - 0,64429)}{150} + 0,5102041 ~ \cfrac{0,902012 (1 - 0,902012)}{150} =$
$\quad = 0,001828494$
Sob a hipótese nula $H_{01}$, tem-se que a estatística de teste é dada por $$ Z_{01} = \cfrac{(\hat{P}_A - R_{1} \hat{P}_C)}{\sqrt{V}} = \cfrac{(0,7 - (0,71428 \times 0,886))}{0,04276} = 1,559 $$
Calculando-se os parâmetros para a hipótese $H_{02}$, obtêm-se: $$R_{2} = \cfrac{P_A + \Delta}{P_A} = \cfrac{0,5 + 0,2}{0,5} = 1,4 $$
$ b = -\left[ R_{2} (1 + \theta \hat{P}_C) + \theta + \hat{P}_A\right]$
$\quad = -\left[ 1,4 (1 + 1 \times 0,886) + 1 + 0,7 \right] $
$\quad = -4,341333 $
$$ c = R_{2} (\hat{P_A} + \theta \hat{P_C}) = 1,4 (0,7 + 1 \times 0,886) = 2,221333$$
Logo,
$\tilde{P}_A = \cfrac{ \left[- b - \sqrt{b^2 - 4 a c} \right]}{2a} $
$ \quad = \cfrac{ \left[4,341333 - \sqrt{(-4,341333)^2 - 4 \times 2 \times 2,221333} \right]}{4} = 0,825946$
e
$$ \tilde{P}_C = \cfrac{\tilde{P}_A}{R_{2}} = \cfrac{0,825946}{1,4} = 0,589961 $$
A estimativa da variância é dada por
$ V = \cfrac{\tilde{P}_A (1 - \tilde{P}_A)}{N_A} + R_{2}^2 ~ \cfrac{\tilde{P}_C (1 - \tilde{P}_C)}{N_C} = $
$ \quad = \cfrac{0,825946 (1 - 0,825946)}{150} + 1,96 ~ \cfrac{0,589961 (1 - 0,589961)}{150} = $
$ \quad = 0,0041193 $
Sob a hipótese nula, tem-se que a estatística de teste é dada por $$ Z_{02} = \cfrac{(\hat{P}_A - R_{2} \hat{P}_C)}{\sqrt{V}} = \cfrac{(0,7 - (1,4 \times 0,886))}{0,064181} = -8,4343657 $$
Como $Z_{01} < z_{\alpha}$ não rejeita-se a hipótese $H_{01}$ e como $Z_{02} < - z_{\alpha}$ não rejeita-se a hipótese $H_{02}$. Em que $z_{\alpha} = 1,644854 $ é o quantil superior da distribuição normal padrão e $- z_{\alpha} =- 1,644854$ é o quantil inferior da distribuição normal padrão. Assim, conclui-se contra a equivalência dos procedimentos, pois as hipóteses $H_{01}$ e $H_{02}$ não foram rejeitadas simultaneamente, isto é, conclui-se ao nível de significância de $5\char37$ que o método alternativo não é equivalente ao método tradicional.
O cálculo do $\hbox{p-valor}$ é dado por $$\hbox{p-valor} = P(Z_{1} \ > \ Z_{01}) + P(Z_{2} \ < \ Z_{02}) = 0,059 $$
Se $\hbox{p-valor} \ > \ \alpha$ não rejeita-se a hipótese nula, assim conclui-se a favor da não equivalência. Em relação ao cálculo do intervalo de confiança, tem-se que este é dado por
$IC( P_{a} - P_{c}; 1 - \alpha) = \left ( \max(-1; \hat{P_A} - \hat{P_C} - z_{\alpha} \times \sqrt{V}) ; \quad \min(1; \hat{P_A} - \hat{P_C} + z_{\alpha} \times \sqrt{V}) \right ) $
$= \left ( \max(-1; -0,186 - 1,644854 \times \sqrt{0,001828494}) ; \quad \min(1; 0,1866667 + 1,644854 \times \sqrt{0,0041193}) \right) $
$= \left ( \max(-1; -0,26150165 ); \quad \min(1; -0,11183168 ) \right ) $
$= (-0,26150165; -0,11183168)$
A seguir, apresentam-se as Tabelas 6.7.20 e 6.7.21, as quais consistem em um resumo dos valores obtidos para o teste de equivalência, em que a Tabela 6.7.20 refere-se a hipótese $H_{01}$ e a Tabela 6.7.21 refere-se a hipótese $H_{02}$.
| Descrição dos Parâmetros | |
|---|---|
| $N_A = 150$ | Tamanho da amostra do método alternativo |
| $N_C=150$ | Tamanho da amostra do método tradicional |
| $X_A = 105$ | Amostra alternativa |
| $X_C = 133$ | Amostra tradicional |
| $P_A = 0,5$ | Proporção para o método alternativo |
| $P_C = 0,7$ | Proporção para o método tradicional |
| $\hat{P}_A $ | $ 0,7 $ |
| $\hat{P}_C$ | $ 0,886$ |
| $\theta$ | $\cfrac{N_C}{N_A} = 1$ |
| $R$ | $ 0,7142857$ |
| $a$ | $1 + \theta = 2$ |
| $b$ | $ -3,047143 $ |
| $c$ | $1,1333$ |
| $\tilde{P}_A$ | $0,64429$ |
| $\tilde{P}_C$ | $0,902012$ |
| $V$ | $0,001828494$ |
| $Z$ | $1,559$ |
Tabela 6.7.20: Resultados obtidos para o teste de equivalência em relação a hipótese $H_{01}$.
| Descrição dos Parâmetros | |
|---|---|
| $N_A = 150$ | Tamanho da amostra do método alternativo |
| $N_C=150$ | Tamanho da amostra do método tradicional |
| $X_A = 105$ | Amostra alternativa |
| $X_C = 133$ | Amostra tradicional |
| $P_A = 0,5$ | Proporção para o método alternativo |
| $P_C = 0,7$ | Proporção para o método tradicional |
| $\hat{P}_A $ | $ 0,7 $ |
| $\hat{P}_C$ | $ 0,886$ |
| $\theta$ | $\cfrac{N_C}{N_A} = 1$ |
| $R$ | $ 1,4$ |
| $a$ | $1 + \theta = 2$ |
| $b$ | $ -4,341333 $ |
| $c$ | $2,221333$ |
| $\tilde{P}_A$ | $0,825946$ |
| $\tilde{P}_C$ | $0,589961 $ |
| $V$ | $0,0041193 $ |
| $Z$ | $-8,4343657$ |
Tabela 6.7.21: Resultados obtidos para o teste de equivalência em relação a hipótese $H_{02}$.
A seguir, apresentam-se os resultados obtidos no Action Stat.
| Quantidade | Proporção Estimada | |
|---|---|---|
| Positivo | 133 | 0.8867 |
| Estéril | 17 | 0.1133 |
| Total | 150 | 1 |
Tabela 6.7.22: Resultados do Método Compendial
| Quantidade | Proporção Estimada | |
|---|---|---|
| Positivo | 105 | 0.7 |
| Estéril | 45 | 0.3 |
| Total | 150 | 1 |
Tabela 6.7.23: Resultados do Método Alternativo
| Valor | |
|---|---|
| $\theta$ | 1 |
| Razão de Proporções ($R$) | 0.7143 |
| a | 2 |
| b | -3.0476 |
| c | 1.1333 |
| $\tilde{p}_a$ | 0.6443 |
| $\tilde{p}_a$ | 0.902 |
| Variância ($V$) | 0.0018 |
| Raiz($V$) | 0.0428 |
| $\hat{p}_a-R \ast \hat{p}_c$ | 0.0667 |
Tabela 6.7.24: Parâmetros de Teste - $H_0: P_a - P_c <= - \Delta$
| Valor | |
|---|---|
| $\theta$ | 1 |
| Razão de Proporções ($R$) | 1.4 |
| a | 2 |
| b | -4.3413 |
| c | 2.2213 |
| $\tilde{p}_a$ | 0.8259 |
| $\tilde{p}_a$ | 0.59 |
| Variância ($V$) | 0.0041 |
| Raiz($V$) | 0,0642 |
| $\hat{p}_a-R \ast \hat{p}_c$ | -0.5413 |
Tabela 6.7.25: Parâmetros de Teste - $H_0: P_a - P_c >= - \Delta$
| Valor | |
|---|---|
| Nível de significância | 0.05 |
| Quantil da Normal Padrão - Não inferioridade | 1.6449 |
| Quantil da Normal Padrão - Superioridade | -1.6449 |
| P-Valor | 0.0595 |
Tabela 6.7.26: Critério de Rejeição
| Valor | |
|---|---|
| Nível de Confiança | 0.95 |
| Limite Inferior | -0.2615 |
| Limite Superior | -0.1118 |
Tabela 6.7.27: Intervalo de Confiança
Figura 6.7.3: Gráfico de barras dos Métodos Alternativo e Compedial
Dados contínuos: variâncias iguais
A seguir, apresenta-se o teste de equivalência para dados contínuos, no caso em que se tem variâncias iguais. Deseja-se testar a equivalência de dois laboratórios na concentração de um determinado medicamento, para isto foram coletadas $10$ medicações de cada laboratório.
| Dados | Fator |
|---|---|
| 100,5449 | A |
| 99,67155 | A |
| 99,32921 | A |
| 100,0855 | A |
| 100,2163 | A |
| 100,0495 | A |
| 100,0238 | A |
| 99,28651 | A |
| 100,1467 | A |
| 99,72407 | A |
| 102,0206 | B |
| 101,0006 | B |
| 101,8330 | B |
| 101,7111 | B |
| 101,7244 | B |
| 98,65855 | B |
| 100,3181 | B |
| 100,9711 | B |
| 99,16993 | B |
| 100,7830 | B |
Tabela 6.7.28: Dados para o teste de equivalência para dados contínuos com variâncias iguais.
A partir da Tabela 6.7.28, tem-se que $A$ se refere ao laboratório $1$ e $C$ se refere ao laboratório $2$. Neste exemplo adota-se como margem de equivalência $\Delta = 1$. Deseja-se testar: $$ H_{0}: \mu_{a} - \mu_{c} \leq - \Delta \quad \text{ou} \quad \mu_{a} - \mu_{c} \geq \Delta \quad \text{vs} \quad H_{1}: - \Delta < \mu_{a} - \mu_{c} < \Delta $$
Logo, por meio da Tabela 6.7.28, obtém-se:
-
$n_{a} = 10$ é o tamanho amostral referente ao laboratório $1$;
-
$n_{c} = 10$ é o tamanho amostral referente ao laboratório $2$;
-
$\Delta = 1$ é a margem de equivalência.
Primeiramente, calcula-se o desvio padrão associado aos dados e ao teste, desta forma, como tem-se variâncias iguais, o desvio padrão é dado por:
$$s_{d} = s_{p} \sqrt{\frac{1}{n_{a}} + \frac{1}{n_{c}}}$$
Calculando-se o desvio padrão agrupado obtém-se
$ s_{p} = \sqrt{\dfrac{(n_{a} - 1)s^{2}_{a} + (n_{c} - 1)s^{2}_{c}}{n_{a} + n_{c} - 2}} $
$ \quad = \sqrt{\dfrac{(10 - 1)\times 0,1592881 + (10 - 1)\times 1,309213}{10 + 10 - 2}} = 0,8568842 $
Consequentemente tem-se
$$ s_{d} = s_{p} \sqrt{\frac{1}{n_{a}} + \frac{1}{n_{c}}} = 0,8568842 \times \sqrt{\frac{1}{10} + \frac{1}{10}} = 0,3832102 $$
Sob as hipóteses nulas, têm-se as estatísticas de teste:
$$T_{1} = \dfrac{( \bar{x}_{a} - \bar{x}_{c} ) + \Delta }{ s_{p} \sqrt{\dfrac{1}{n_{a}} + \frac{1}{n_{c}}} } = \dfrac{( 99,90779 - 100.819 ) + 1}{0,8568842 \sqrt{\frac{1}{10} + \frac{1}{10}} } = 0,2316379 \tag{7.7}$$
$$T_{2} = \dfrac{\Delta - ( \bar{x}_{a} - \bar{x}_{c} ) }{ s_{p} \sqrt{\frac{1}{n_{a}} + \frac{1}{n_{c}}} } = \dfrac{1 - ( 99,90779 - 100,819 ) }{0,8568842 \sqrt{\frac{1}{10} + \frac{1}{10}} } = 4,987429 \tag{7.8}$$
Adotando-se um nível de significância de $5\char37$, obtém-se $t_{(\nu, 1 - \alpha)} = t_{(18, 0,95)} = 1,734064$, em que $\nu = n_{a} + n_{c} - 2 = 18$. Tem-se que $T_{1} \leq t_{(18, 0,95)}$, logo não rejeita-se a hipótese $H_{01}$ e $T_{2} \geq t_{(18, 0,95)}$, logo rejeita-se a hipótese $H_{02}$. Desta forma, como não rejeita-se ambas as hipóteses $H_{01}$ e $H_{02}$ conjuntamente, não rejeita-se a hipótese de que os laboratórios não são equivalentes.
Calculando o intervalo de confiança obtém-se
-
$LI = ( \bar{x}_{a} - \bar{x}_{c} ) - t_{(v, 1 - \alpha)} \times s_{d} = (99,90779 - 100,819 ) - 1,734064 \times 0,3832102 = -1,5985 $
-
$LS = ( \bar{x}_{a} - \bar{x}_{c} ) + t_{(v, 1 - \alpha)} \times s_{d} = ( 99,90779 - 100,819 ) + 1,734064 \times 0,3832102 = -0,2239$
Logo $IC_{\mu_{a} - \mu_{c}, 1-(2\alpha)} = (-1,575721; -0,2466989)$. Ressalta-se que o procedimento para a obtenção do intervalo de confiança é ao nível de significância $\alpha$, logo tem-se um $IC (1 - (2 \alpha)) $ $\times 100\char37$.
Como $ LI \ > \ - 1 $ e $LS \ < \ 1$, não rejeita-se a hipótese nula, assim conclui-se que os laboratórios não são equivalentes.
Posteriormente ao cálculo do intervalo de confiança, pode-se calcular o $\hbox{p-valor}$ para o teste, o qual é dado por:
$$\hbox{p-valor} = P(T_{1} > t_{(\nu; 1 - \alpha)}) + P(T_{2} > t_{(\nu; 1 - \alpha)}) = 0,4097726$$
Como o $\hbox{p-valor} \ > \ \alpha$, não rejeita-se a hipótese nula. Assim conclui-se que os laboratórios não são equivalentes ao nível de significância $\alpha = 5\char37$.
A seguir, apresentam-se os resultados obtidos por meio da ferramenta teste de equivalência para dados contínuos do Action Stat.
| Valores | |
|---|---|
| Graus de Liberdade | 11.1581 |
| P-valor | 0.4107 |
| Média - A | 99.9078 |
| Média - B | 100.819 |
| Desvio Padrão - A | 0.3991 |
| Desvio Padrão - B | 1.1442 |
| Tamanho Amostral - A | 10 |
| Tamanho Amostral - B | 10 |
| Nível de Confiança | 0.95 |
| Limite Inferior | -1.5985 |
| Limite Superior | -0.2239 |
| Margem de equivalência | 1 |
| Estatística de Test 1 - $H_{01}: m_1-m_2 \leq -d$ | 0.2316 |
| Estatística de Test 2 - $H_{02}: m_1-m_2 \geq d$ | 4.9874 |
Tabela 6.7.29: Resultados obtidos pelo software Action Stat
Figura 6.7.4: Intervalo de Confiança para o teste de equivalência
Dados contínuos: variâncias diferentes
A seguir, apresenta-se o teste de equivalência para dados contínuos, no caso em que se tem variâncias diferentes. Dados para o teste de equivalência para dados contínuos com variâncias diferentes.
| Torque | Fator |
|---|---|
| 18,8546077741739 | A |
| 6,98941806467814 | A |
| 14,8409521529361 | A |
| 8,15373813742441 | A |
| 15,9085222929569 | A |
| 21,1846587737283 | A |
| 14,3510843546642 | A |
| 25,5527578380754 | A |
| 10,9673807642822 | A |
| 10,0796131534572 | A |
| 16,4586796193723 | C |
| 17,9584727209347 | C |
| 15,4057263261248 | C |
| 15,8071977805526 | C |
| 16,4735547815596 | C |
| 19,8252196602517 | C |
| 16,5474171787359 | C |
| 18,2033810016129 | C |
| 19,132896973666 | C |
| 17,2772796628425 | C |
| 19,8351269157496 | C |
| 21,0858116172996 | C |
| 16,2548203231691 | C |
Tabela 6.7.30: Dados para o teste de equivalência para dados contínuos com variâncias diferentes
A partir da Tabela 6.7.30, tem-se que $A$ se refere ao procedimento $A$ e $B$ se refere ao procedimento $B$. Neste exemplo adota-se como margem de equivalência $\Delta = 2$. Deseja-se testar:
$$ H_{0}: \mu_{a} - \mu_{c} \leq - \Delta \quad \text{ou} \quad \mu_{a} - \mu_{c} \geq \Delta \quad \text{vs} \quad H_{1}: - \Delta < \mu_{a} - \mu_{c} < \Delta $$
Logo, por meio da Tabela 6.7.30, obtém-se:
-
$n_{a} = 10$ é o tamanho amostral referente ao procedimento $A$;
-
$n_{c} = 13$ é o tamanho amostral referente ao procedimento $C$;
-
$\bar{x}_{a} = 14,6883$ é a média amostral referente ao procedimento $A$;
-
$\bar{x}_{c} = 17,7127$ é a média amostral referente ao procedimento $C$;
-
$s_{a}^2 = 35,1424$ é a variância amostral ao procedimento $A$;
-
$s_{c}^2 = 3,1998$ é a variância amostral ao procedimento $C$;
-
$\Delta = 2$ é a margem de equivalência.
Primeiramente, calcula-se o desvio padrão associado aos dados e ao teste, desta forma, como tem-se variâncias diferente, o desvio padrão é dado por:
$$s_{d} = \sqrt{\frac{s^{2}_{a}}{n_{a}} + \frac{s^{2}_{c}}{n_{c}}} = \sqrt{\frac{35,1424}{10} + \frac{3,1998}{13}} = 1,93917 $$
Sob as hipóteses nulas, têm-se as estatísticas de teste:
$$T_{1} = \frac{( \bar{x}_{a} - \bar{x}_{c} ) + \Delta }{ \sqrt{\frac{s^{2}_{a}}{n_{a}} + \frac{s^{2}_{c}}{n_{c}}} } = \frac{( 14,6883- 17,7127 ) + 2 }{ 1,93917} = -1,0440 \tag{7.9}$$
e
$$T_{2} = \frac{\Delta - ( \bar{x}_{a} - \bar{x}_{c} ) }{ \sqrt{\frac{s^{2}_{a}}{n_{a}} + \frac{s^{2}_{c}}{n_{c}}} } = \frac{ 2 - ( 14,6883- 17,7127 ) }{1,93917 } = 2,0754 \tag{7.10}$$
Adotando-se um nível de significância de $5%$, obtém-se $t_{(\nu, 1 - \alpha)} = t_{(10,2671, 0,95)} = 1,807688$, em que
$$ \nu = \dfrac{ (\frac{s_{a}^2}{n_{a}} + \frac{s_{c}^2}{n_{c}})^2 }{ \frac{(\frac{s_{a}^2}{n_{a}})^2}{(n_{a} - 1) } + \frac{(\frac{s_{c}^2}{n_{c}})^2}{(n_{c} - 1)} } = \dfrac{ (3,760379)^2 }{ \frac{12,34989}{(10 - 1) } + \frac{0,06058367}{(13 - 1)} } = 10,2671 $$
Logo, tem-se que $T_{1} < t_{(10,2671, 0,95)}$, não rejeitando-se a hipótese $H_{01}$ e $T_{2} > t_{(42,86455, 0,95)}$, rejeitando-se a hipótese $H_{02}$. Desta forma, como rejeita-se apenas a hipótese $H_{02}$, não rejeita-se a hipótese nula, isto é, tem-se que os procedimentos não são equivalentes.
Calculando o intervalo de confiança obtém-se
-
$ LI = ( \bar{x}_{a} - \bar{x}_{c} ) - t_{(v, 1 - \alpha)} \times s_{e} = ( 14,6883 - 17,7127) - 1,807688 \times 1,93917 = -6,529814 $
-
$ LS = ( \bar{x}_{a} - \bar{x}_{c} ) + t_{(v, 1 - \alpha)} \times s_{e} = ( 14,6883 - 17,7127) + 1,807688 \times 1,93917 = 0,4810143 $
Logo $IC_{\mu_{a} - \mu_{c}, 1-(2\alpha)} = (-6,529814; 0,4810143)$. Como $ LI \ < \ - 2 $ e $LS \ < \ 2$, não rejeita-se a hipótese nula, assim conclui-se que os procedimentos não são equivalentes.
Posteriormente ao cálculo do intervalo de confiança, pode-se calcular o $\hbox{p-valor}$ para o teste, o qual é dado por:
$$\hbox{p-valor} = P(T_{1} > t_{(\nu; 1 - \alpha)}) + P(T_{2} > t_{(\nu; 1 - \alpha)}) = 0,8718$$
Como o $\hbox{p-valor} \ > \ \alpha$, não rejeita-se a hipótese nula. Assim conclui-se que os procedimentos não são equivalentes ao nível de significância $\alpha = 5\char37$.
A seguir, apresentam-se os resultados obtidos por meio da ferramenta teste de equivalência para dados contínuos do Action Stat.
| Valores | |
|---|---|
| Graus de Liberdade | 10.2671 |
| P-valor | 0.8718 |
| Média - A | 14.6883 |
| Média - B | 17.7127 |
| Desvio Padrão - A | 5.9281 |
| Desvio Padrão - B | 1.7888 |
| Tamanho Amostral - A | 10 |
| Tamanho Amostral - B | 13 |
| Nível de Confiança | 0.95 |
| Limite Inferior | -6.5299 |
| Limite Superior | 0.481 |
| Margem de equivalência | 1 |
| Estatística de Test 1 - $H_{01}: m_1-m_2 \leq -d$ | -1.044 |
| Estatística de Test 2 - $H_{02}: m_1-m_2 \geq d$ | 2.0754 |
Tabela 6.7.31: Resultados obtidos pelo software Action Stat
Figura 6.7.5: Intervalo de Confiança para o teste de equivalência