5.3 Gráficos

3 - Gráficos

Gráficos estatísticos são formas de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo. A representação gráfica de um fenômeno deve obedecer a certos requisitos fundamentais para ser realmente útil:

Simplicidade: O gráfico deve ser destituído de detalhes de importância secundária, assim como de traços desnecessários que possam levar o observador a uma análise com erros.

Clareza: O gráfico deve possibilitar uma correta interpretação dos valores representativos do fenômeno em estudo.

Veracidade: O gráfico deve expressar a verdade sobre o fenômeno em estudo.

Alguns exemplos de gráficos já foram vistos anteriormente, como o histograma e o diagrama de Pareto. A seguir apresentamos o boxplot e o dotplot.

3.1 - Boxplot

O boxplot (gráfico de caixa) é um gráfico utilizado para avaliar a distribuição empírica do dados. O boxplot é formado pelo primeiro e terceiro quartil e pela mediana. As hastes inferiores e superiores se estendem, respectivamente, do quartil inferior até o menor valor não inferior ao limite inferior e do quartil superior até o maior valor não superior ao limite superior. Os limites são o máximo ou o mínimo dentro dos intervalos abaixo.

Limite inferior: $\max(\min(\text{dados});Q_1-1,5(Q_3-Q_1))$.

Limite superior: $\min(\max(\text{dados});Q_3+1,5(Q_3-Q_1))$.

Para este caso, os pontos fora destes limites são considerados valores discrepantes (outliers) e são denotados por asterisco (*). A Figura 3.1 a seguir apresenta um exemplo do formato de um boxplot.

Figura3.1.svg

Figura 3.1: Boxplot

O boxplot pode ainda ser utilizado para uma comparação visual entre dois ou mais grupos. Por exemplo, duas ou mais caixas são colocadas lado a lado e se compara a variabilidade entre elas, a mediana e assim por diante. Outro ponto importante é a diferença entre os quartis $(Q_3 - Q_1)$ que é uma medida da variabilidade dos dados.

Exemplo 3.1.1

Na Tabela 3.1 a seguir temos as medidas da altura de 20 hastes fabricadas em uma usinagem. Faça o boxplot correspondente.

903,88 1036,92 1098,04 1011,26
1020,70 915,38 1014,53 1097,79
934,52 1214,08 993,45 1120,19
860,41 1039,19 950,38 941,83
936,78 1086,98 1144,94 1066,12

Tabela 3.1: Dados da usinagem

Temos que:

Mínimo 860,41
Máximo 1214,08
Primeiro Quartil 938,0425
Terceiro Quartil 1095,0875
Média 1019,3685
Mediana 1017,615

Tabela 3.1.1: Estatísticas Descritivas dos dados

Primeiro, calculemos as medidas:

$Q_1-1,5(Q_3-Q_1) = 938,0425-1.5(1095,0875-938,0425)=702,475$

$Q_3+1,5(Q_3-Q_1) = 1095,0875+1,5(1095,0875-938,0425)=1330,655$

Limite inferior: $\max(\min(\text{dados});Q_1-1,5(Q_3-Q_1)) = \max(860.41;702,475) = 860.41$

Limite superior: $\min(\max(\text{dados});Q_3+1,5(Q_3-Q_1)) = \min(1214,08;1330,655) = 1214.08$

O boxplot obtido pelo software Action Stat é dado por:

Figura3.2.svg

Figura 3.2: Boxplot dos dados da usinagem

Exemplo 3.1.2

Utilizando os dados do Exemplo 2.3.4 (Altura de pacientes), temos

Estatísticas Descritivas
Mínimo 1,58
1° Quartil 1,6
Mediana 1,69
3° Quartil 1,8
Máximo 1,87
Limite inferior 1,58
Limite superior 1,87

Tabela 3.2: Estatísticas descritivas dos dados de Altura de pacientes

Assim, obtemos o seguinte boxplot pela Action Stat:

Figura3.3.svg

Figura 3.3: Boxplot dos dados de Altura dos pacientes

Podemos utilizar o Boxplot para comparar dados estratificados e comparar diferenças nas distribuições empíricas dos estratos.

Exemplo 3.1.3

Uma indústria produz uma peça automotiva cujo valor de referência é 75cm. Após verificar lotes com peças fora de especificação, enviaram duas equipes de trabalhadores (A e B) para um treinamento. Para verificar a eficiência do treinamento, foram selecionadas 10 peças produzidas pelas equipes A e B e 10 peças produzidas pelas equipes C e D que não participaram do treinamento.

A A B B C C D D
75,27 74,93 74,94 74,75 75,93 73,34 75,98 76,75
75,33 74,72 75,25 74,65 76,95 74,04 75,61 76,78
74,58 74,53 75,44 74,94 75,47 75 74,2 74,74
75,01 75,32 74,62 74,92 73,6 76,18 76,44 72,58
75,71 74,05 75,35 75,46 74,85 75,33 76,84 72,86

Tabela 3.3: Dados de 40 peças produzidas por 4 equipes

Figura3.4.svg

Figura 3.4: Boxplot por grupos

Análisando o gráfico podemos observar que:

  1. As equipes A e B produzem peças com menor variabilidade, indicando que o treinamento teve o efeito desejado;
  2. A equipe D é a que produz peças com maior variabilidade;
  3. A equipe B é a que produz peças com menor variabilidade.

Considerações: Como as peças das equipes A e B tem menor variabilidade e com valor médio próximo do valor de referência, vale a pena enviar as demais equipes para o treinamento.

3.2 - Dotplot

O gráfico Dotplot (gráfico de pontos) representa cada observação obtida em uma escala horizontal, permitindo visualizar a distribuição dos dados ao longo deste eixo. No eixo horizontal, dividimos a escala dos valores em pequenos intervalos, sendo marcado um ponto por observação.

O Dotplot, ou gráfico de pontos, é muito útil para visualizar estratificações. A estratificação é uma técnica que agrupa dados em subgrupos, de acordo com determinados critérios, aumentando o poder da análise.

Exemplo 3.2.1

Considerando novamente os dados do Exemplo 3.1.1, construímos o gráfico Dotplot utilizando o Action Stat:

Figura3.5.svg

Figura 3.5: Gráfico de pontos dos dados de uma usinagem (Tabela 3.1)

Eventualmente, é interessante analisar dados estratificados, ou seja, realizar um dotplot em grupos. Podemos analisar, graficamente, qual grupo (estrato) possui dispersão maior e ter uma ideia da localização da média de cada grupo.

Exemplo 3.2.2

Uma pequena pesquisa realizada em 4 bairros (A, B, C e D) de uma cidade perguntava sobre o salário líquido de 32 famílias (8 famílias de cada bairro). Os resultados obtidos (dados em reais) estão na Tabela 3.4 abaixo:

A B C D
3620 1910 4900 2800
4010 2100 4100 2400
4560 2210 5520 2900
2760 2030 6200 2950
3480 2090 5800 3400
2930 2230 7200 3200
3070 2060 4700 3150
3200 2050 5600 2770

Tabela 3.4: Salário líquido de famílias de 4 bairros diferentes em reais

Usando o software Action Stat, geramos o seguinte gráfico:

Figura3.6.svg

Figura 3.6: Gráfico de pontos por bairro

Análisando o gráfico, podemos observar que:

  • O bairro mais pobre, em média é o bairro B. Entretanto, é o que apresenta a menor variabilidade entre os salários.
  • O segundo bairro mais pobre, em média é o bairro D, seguido do bairro A. A variação entre os salários desses dois bairros é parecida.
  • O bairro mais rico é o bairro C, porém é o que apresenta maior variabilidade entre os salários das famílias.

3.3 - Gráfico de Linhas

Gráficos de linhas ou pontos são normalmente usados para controlar alterações ao longo do tempo e para facilitar a identificação de tendências ou de anomalias.

Exemplo 3.3.1

O número de manutenções por dia em equipamentos foi acompanhado durante um período de 5 semanas, em uma empresa automobilística. Na Tabela 3.6 a seguir temos o número de manutenções por dia.

Nº de manutenções Dia Semana
18 1 Semana 1
22 2 Semana 1
28 3 Semana 1
23 4 Semana 1
33 5 Semana 1
23 6 Semana 1
22 7 Semana 1
32 1 Semana 2
14 2 Semana 2
24 3 Semana 2
38 4 Semana 2
14 5 Semana 2
22 6 Semana 2
35 7 Semana 2
24 1 Semana 3
24 2 Semana 3
28 3 Semana 3
25 4 Semana 3
20 5 Semana 3
23 6 Semana 3
14 7 Semana 3
20 1 Semana 4
30 2 Semana 4
27 3 Semana 4
24 4 Semana 4
38 5 Semana 4
27 6 Semana 4
23 7 Semana 4
19 1 Semana 5
18 2 Semana 5
17 3 Semana 5
24 4 Semana 5
27 5 Semana 5
23 6 Semana 5
32 7 Semana 5

Tabela 3.6: Número de manutenções por dia em 5 semanas

Podemos construir o gráfico de duas formas: com ou sem meta.

Sem meta

Neste caso, montamos um gráfico em duas dimensões onde, colocamos um ponto no par ordenado correspondente ao dia da semana e o valor observado, em seguida, unimos cada ponto ao seu sucessor por retas. O gráfico é dado na Figura 3.7.1 a seguir:

Figura3.7.1.svg

Figura 3.7.1: Gráfico de Linhas e Pontos sem meta

Com meta

Na análise com meta, basta determinarmos um valor (meta) para a comparação dos dados e, então inserimos uma reta horizontal na altura deste valor. Com isso, todos os pontos que estiverem acima do valor dado, atingiram a meta, enquanto os que estiverem abaixo não atingiram a meta.

Utilizaremos os mesmos dados acima, estipulando uma meta de 22. O gráfico é dado a seguir:

Figura3.7.2.svg

Figura 3.7.2: Gráfico de Linhas e Pontos com meta

Os gráficos acima foram obtidos utilizando o software Action.

Exemplo 3.3.2

Na Tabela 3.7 abaixo, temos os dados referentes a evolução do preço de um ativo financeiro ao longo de 20 dias.

Dia 1 103,60 Dia 11 109,21
Dia 2 104,41 Dia 12 108,13
Dia 3 105,21 Dia 13 108,76
Dia 4 106,00 Dia 14 109,45
Dia 5 105,18 Dia 15 110,12
Dia 6 106,80 Dia 16 109,56
Dia 7 104,89 Dia 17 111,67
Dia 8 105,23 Dia 18 112,32
Dia 9 107,60 Dia 19 110,97
Dia 10 108,41 Dia 20 111,34

Tabela 3.7: Evolução do preço de um ativo financeiro ao longo de 20 dias

A seguir, temos a construção do gráfico de linhas e pontos para estes dados.

Figura3.8.svg

Figura 3.8: Gráfico de Linhas e Pontos