5.3 Gráficos
3 - Gráficos
Gráficos estatísticos são formas de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil:
Simplicidade: O gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise com erros.
Clareza: O gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo.
Veracidade: O gráfico deve expressar a verdade sobre o fenômeno em estudo.
Alguns exemplos de gráficos já foram vistos anteriormente, como o histograma e o diagrama de Pareto. A seguir apresentamos o boxplot e o dotplot.
3.1 - Boxplot
O boxplot (gráfico de caixa) é um gráfico utilizado para avaliar a distribuição empírica do dados. O boxplot é formado pelo primeiro e terceiro quartil e pela mediana. As hastes inferiores e superiores se estendem, respectivamente, do quartil inferior até o menor valor não inferior ao limite inferior e do quartil superior até o maior valor não superior ao limite superior. Os limites são o máximo ou o mínimo dentro dos intervalos abaixo.
Limite inferior: $\max(\min(\text{dados});Q_1-1,5(Q_3-Q_1))$.
Limite superior: $\min(\max(\text{dados});Q_3+1,5(Q_3-Q_1))$.
Para este caso, os pontos fora destes limites são considerados valores discrepantes (outliers) e são denotados por asterisco (*). A Figura 3.1 a seguir apresenta um exemplo do formato de um boxplot.
Figura 3.1: Boxplot
O boxplot pode ainda ser utilizado para uma comparação visual entre dois ou mais grupos. Por exemplo, duas ou mais caixas são colocadas lado a lado e se compara a variabilidade entre elas, a mediana e assim por diante. Outro ponto importante é a diferença entre os quartis $(Q_3 - Q_1)$ que é uma medida da variabilidade dos dados.
Exemplo 3.1.1
Na Tabela 3.1 a seguir temos as medidas da altura de 20 hastes fabricadas em uma usinagem. Faça o boxplot correspondente.
| 903,88 | 1036,92 | 1098,04 | 1011,26 |
| 1020,70 | 915,38 | 1014,53 | 1097,79 |
| 934,52 | 1214,08 | 993,45 | 1120,19 |
| 860,41 | 1039,19 | 950,38 | 941,83 |
| 936,78 | 1086,98 | 1144,94 | 1066,12 |
Tabela 3.1: Dados da usinagem
Temos que:
| Mínimo | 860,41 |
| Máximo | 1214,08 |
| Primeiro Quartil | 938,0425 |
| Terceiro Quartil | 1095,0875 |
| Média | 1019,3685 |
| Mediana | 1017,615 |
Tabela 3.1.1: Estatísticas Descritivas dos dados
Primeiro, calculemos as medidas:
$Q_1-1,5(Q_3-Q_1) = 938,0425-1.5(1095,0875-938,0425)=702,475$
$Q_3+1,5(Q_3-Q_1) = 1095,0875+1,5(1095,0875-938,0425)=1330,655$
Limite inferior: $\max(\min(\text{dados});Q_1-1,5(Q_3-Q_1)) = \max(860.41;702,475) = 860.41$
Limite superior: $\min(\max(\text{dados});Q_3+1,5(Q_3-Q_1)) = \min(1214,08;1330,655) = 1214.08$
O boxplot obtido pelo software Action Stat é dado por:
Figura 3.2: Boxplot dos dados da usinagem
Exemplo 3.1.2
Utilizando os dados do Exemplo 2.3.4 (Altura de pacientes), temos
| Estatísticas Descritivas | |
|---|---|
| Mínimo | 1,58 |
| 1° Quartil | 1,6 |
| Mediana | 1,69 |
| 3° Quartil | 1,8 |
| Máximo | 1,87 |
| Limite inferior | 1,58 |
| Limite superior | 1,87 |
Tabela 3.2: Estatísticas descritivas dos dados de Altura de pacientes
Assim, obtemos o seguinte boxplot pela Action Stat:
Figura 3.3: Boxplot dos dados de Altura dos pacientes
Podemos utilizar o Boxplot para comparar dados estratificados e comparar diferenças nas distribuições empíricas dos estratos.
Exemplo 3.1.3
Uma indústria produz uma peça automotiva cujo valor de referência é 75cm. Após verificar lotes com peças fora de especificação, enviaram duas equipes de trabalhadores (A e B) para um treinamento. Para verificar a eficiência do treinamento, foram selecionadas 10 peças produzidas pelas equipes A e B e 10 peças produzidas pelas equipes C e D que não participaram do treinamento.
| A | A | B | B | C | C | D | D |
|---|---|---|---|---|---|---|---|
| 75,27 | 74,93 | 74,94 | 74,75 | 75,93 | 73,34 | 75,98 | 76,75 |
| 75,33 | 74,72 | 75,25 | 74,65 | 76,95 | 74,04 | 75,61 | 76,78 |
| 74,58 | 74,53 | 75,44 | 74,94 | 75,47 | 75 | 74,2 | 74,74 |
| 75,01 | 75,32 | 74,62 | 74,92 | 73,6 | 76,18 | 76,44 | 72,58 |
| 75,71 | 74,05 | 75,35 | 75,46 | 74,85 | 75,33 | 76,84 | 72,86 |
Tabela 3.3: Dados de 40 peças produzidas por 4 equipes
Figura 3.4: Boxplot por grupos
Análisando o gráfico podemos observar que:
- As equipes A e B produzem peças com menor variabilidade, indicando que o treinamento teve o efeito desejado;
- A equipe D é a que produz peças com maior variabilidade;
- A equipe B é a que produz peças com menor variabilidade.
Considerações: Como as peças das equipes A e B tem menor variabilidade e com valor médio próximo do valor de referência, vale a pena enviar as demais equipes para o treinamento.
3.2 - Dotplot
O gráfico Dotplot (gráfico de pontos) representa cada observação obtida em uma escala horizontal, permitindo visualizar a distribuição dos dados ao longo deste eixo. No eixo horizontal, dividimos a escala dos valores em pequenos intervalos, sendo marcado um ponto por observação.
O Dotplot, ou gráfico de pontos, é muito útil para visualizar estratificações. A estratificação é uma técnica que agrupa dados em subgrupos, de acordo com determinados critérios, aumentando o poder da análise.
Exemplo 3.2.1
Considerando novamente os dados do Exemplo 3.1.1, construímos o gráfico Dotplot utilizando o Action Stat:
Figura 3.5: Gráfico de pontos dos dados de uma usinagem (Tabela 3.1)
Eventualmente, é interessante analisar dados estratificados, ou seja, realizar um dotplot em grupos. Podemos analisar, graficamente, qual grupo (estrato) possui dispersão maior e ter uma ideia da localização da média de cada grupo.
Exemplo 3.2.2
Uma pequena pesquisa realizada em 4 bairros (A, B, C e D) de uma cidade perguntava sobre o salário líquido de 32 famílias (8 famílias de cada bairro). Os resultados obtidos (dados em reais) estão na Tabela 3.4 abaixo:
| A | B | C | D |
|---|---|---|---|
| 3620 | 1910 | 4900 | 2800 |
| 4010 | 2100 | 4100 | 2400 |
| 4560 | 2210 | 5520 | 2900 |
| 2760 | 2030 | 6200 | 2950 |
| 3480 | 2090 | 5800 | 3400 |
| 2930 | 2230 | 7200 | 3200 |
| 3070 | 2060 | 4700 | 3150 |
| 3200 | 2050 | 5600 | 2770 |
Tabela 3.4: Salário líquido de famílias de 4 bairros diferentes em reais
Usando o software Action Stat, geramos o seguinte gráfico:
Figura 3.6: Gráfico de pontos por bairro
Análisando o gráfico, podemos observar que:
- O bairro mais pobre, em média é o bairro B. Entretanto, é o que apresenta a menor variabilidade entre os salários.
- O segundo bairro mais pobre, em média é o bairro D, seguido do bairro A. A variação entre os salários desses dois bairros é parecida.
- O bairro mais rico é o bairro C, porém é o que apresenta maior variabilidade entre os salários das famílias.
3.3 - Gráfico de Linhas
Gráficos de linhas ou pontos são normalmente usados para controlar alterações ao longo do tempo e para facilitar a identificação de tendências ou de anomalias.
Exemplo 3.3.1
O número de manutenções por dia em equipamentos foi acompanhado durante um período de 5 semanas, em uma empresa automobilística. Na Tabela 3.6 a seguir temos o número de manutenções por dia.
| Nº de manutenções | Dia | Semana |
|---|---|---|
| 18 | 1 | Semana 1 |
| 22 | 2 | Semana 1 |
| 28 | 3 | Semana 1 |
| 23 | 4 | Semana 1 |
| 33 | 5 | Semana 1 |
| 23 | 6 | Semana 1 |
| 22 | 7 | Semana 1 |
| 32 | 1 | Semana 2 |
| 14 | 2 | Semana 2 |
| 24 | 3 | Semana 2 |
| 38 | 4 | Semana 2 |
| 14 | 5 | Semana 2 |
| 22 | 6 | Semana 2 |
| 35 | 7 | Semana 2 |
| 24 | 1 | Semana 3 |
| 24 | 2 | Semana 3 |
| 28 | 3 | Semana 3 |
| 25 | 4 | Semana 3 |
| 20 | 5 | Semana 3 |
| 23 | 6 | Semana 3 |
| 14 | 7 | Semana 3 |
| 20 | 1 | Semana 4 |
| 30 | 2 | Semana 4 |
| 27 | 3 | Semana 4 |
| 24 | 4 | Semana 4 |
| 38 | 5 | Semana 4 |
| 27 | 6 | Semana 4 |
| 23 | 7 | Semana 4 |
| 19 | 1 | Semana 5 |
| 18 | 2 | Semana 5 |
| 17 | 3 | Semana 5 |
| 24 | 4 | Semana 5 |
| 27 | 5 | Semana 5 |
| 23 | 6 | Semana 5 |
| 32 | 7 | Semana 5 |
Tabela 3.6: Número de manutenções por dia em 5 semanas
Podemos construir o gráfico de duas formas: com ou sem meta.
Sem meta
Neste caso, montamos um gráfico em duas dimensões onde, colocamos um ponto no par ordenado correspondente ao dia da semana e o valor observado, em seguida, unimos cada ponto ao seu sucessor por retas. O gráfico é dado na Figura 3.7.1 a seguir:
Figura 3.7.1: Gráfico de Linhas e Pontos sem meta
Com meta
Na análise com meta, basta determinarmos um valor (meta) para a comparação dos dados e, então inserimos uma reta horizontal na altura deste valor. Com isso, todos os pontos que estiverem acima do valor dado, atingiram a meta, enquanto os que estiverem abaixo não atingiram a meta.
Utilizaremos os mesmos dados acima, estipulando uma meta de 22. O gráfico é dado a seguir:
Figura 3.7.2: Gráfico de Linhas e Pontos com meta
Os gráficos acima foram obtidos utilizando o software Action.
Exemplo 3.3.2
Na Tabela 3.7 abaixo, temos os dados referentes a evolução do preço de um ativo financeiro ao longo de 20 dias.
| Dia 1 | 103,60 | Dia 11 | 109,21 |
| Dia 2 | 104,41 | Dia 12 | 108,13 |
| Dia 3 | 105,21 | Dia 13 | 108,76 |
| Dia 4 | 106,00 | Dia 14 | 109,45 |
| Dia 5 | 105,18 | Dia 15 | 110,12 |
| Dia 6 | 106,80 | Dia 16 | 109,56 |
| Dia 7 | 104,89 | Dia 17 | 111,67 |
| Dia 8 | 105,23 | Dia 18 | 112,32 |
| Dia 9 | 107,60 | Dia 19 | 110,97 |
| Dia 10 | 108,41 | Dia 20 | 111,34 |
Tabela 3.7: Evolução do preço de um ativo financeiro ao longo de 20 dias
A seguir, temos a construção do gráfico de linhas e pontos para estes dados.
Figura 3.8: Gráfico de Linhas e Pontos