Forma alternativa de cálculo da variância

6 Sep

Recebi um e-mail do Antônio Carlos, aluno do Eu Vou Passar, pedindo ajuda com o cálculo alternativo de variância, quando optamos por usar a variável auxiliar.

Bom, relembrando, a variância é uma medida de dispersão. Ela me indica o quanto os dados estão afastados da média aritmética. Para calcular a variância, fazemos assim:

clip_image002[11]

Ou seja, calculamos a média dos quadrados dos desvios. Desvios estes calculados em relação à média aritmética.

Caso estejamos diante de uma amostra, usamos “n – 1” no denominador. Neste caso, usamos o símbolo s2 para a variância.

clip_image004[11]

Não entrarei em detalhes no porquê disso, mas fica registrado que o objetivo é obter um estimador não-viciado da média da população.

Ok, continuando.

O grande detalhe é que esta forma de cálculo é muito demorada, é trabalhosa. E, na hora da prova, é sempre bom poupar tempo.

Pois bem, outra maneira de calcular a variância, que demanda muito menos tempo, é a seguinte:

clip_image006[7]

Ou seja:

– calculamos a média dos quadrados

– calculamos o quadrado da média

– subtraímos um do outro, obtendo a variância populacional

Detalhe: essa forma alternativa pressupõe que utilizamos “n” no denominador. Se estivermos diante de uma amostra, temos que multiplicar por “n” (para anular a divisão feita pelo próprio “n”) e dividir por “n – 1”, para obter o denominador correto. Fica assim:

clip_image008[5]

E, é claro, podemos usar o cálculo alternativo da variância em qualquer situação, inclusive quando decidimos adotar a variável “auxiliar”. E aqui reside a dúvida do Antônio Carlos.

Para ver como fica, nada melhor que um exemplo. Utilizarei a recente prova da Esaf, feita agora em 2012:

(ESAF – Ministério da Integração Nacional 2012)

A distribuição de frequências em classes do salário mensal x, medido em número de salários mínimos, de uma amostra aleatória de 50 funcionários de uma empresa, é apresentado a seguir.
Classe clip_image004
Mais de 0 a 10 22
Mais de 10 a 20 13
Mais de 20 a 30 10
Mais de 30 a 40 3
Mais de 40 a 50 2
Usando os dados acima, obtenha o valor mais próximo da variância amostral do salário mensal.

a) 121,5

b) 124

c) 126,5

d) 129

e) 131,5

Resolução:

Seja “X” o ponto médio de cada classe.

Classe clip_image002[1] clip_image004[1]
Mais de 0 a 10 5 22
Mais de 10 a 20 15 13
Mais de 20 a 30 25 10
Mais de 30 a 40 35 3
Mais de 40 a 50 45 2

Observem que os valores de X são elevados. Para diminuir um pouco as contas, usamos a variável auxiliar, que eu costumo chamar de “d”.

Vamos criar a variável auxiliar “d”, dada por:

clip_image006

Fazemos assim: subtraímos da variável “X” a constante 25 (ponto médio da classe central) e dividimos por 10 (amplitude de classe). O resultado fica:

clip_image002[2] clip_image008 clip_image004[2] clip_image010
5 -2 22 -44
15 -1 13 -13
25 0 10 0
35 1 3 3
45 2 2 4
TOTAL 50 -50

Observação: não existe regra fixa para cálculo da variável “d”. O objetivo é usar qualquer transformação (envolvendo somas, subtrações, divisões e multiplicações de constantes) para chegarmos a números mais fáceis de se trabalhar.

Outra forma de cálculo muito comum em livros é subtrair X do ponto de maior frequência. Também dá certo. Aí vai do “gosto do freguês”.

Continuando.

Agora calculamos a média e a variância para “d”. Por quê? Porque para “d” os valores são menores, mais fáceis de se trabalhar.

A média de “d” fica:

clip_image012

Com o mesmo raciocínio, calculamos a média de clip_image014

clip_image002[2] clip_image016 clip_image018 clip_image004[2] clip_image020
5 -2 4 22 88
15 -1 1 13 13
25 0 0 10 0
35 1 1 3 3
45 2 4 2 8
TOTAL 50 112

O que resulta em:

clip_image022

Agora é só aplicar a forma alternativa de cálculo da variância. A variância populacional é igual à diferença entre a média dos quadrados e o quadrado da média:

clip_image024

clip_image026

Na variância populacional, o denominador é “n”(= número de dados na amostra).

Mas nós queremos a variância amostral, com denominador “n – 1”. Então multiplicamos o resultado acima por “n”, para cancelar a divisão feita, e dividimos por “n – 1”, para chegarmos ao denominador desejado.

clip_image028

Essa é a variância amostral para “d”.

clip_image030

Agora calculamos a variância amostral para X. Assim:

clip_image006[1]

clip_image032

Quando multiplicamos os dados por uma constante (10), a variância fica multiplicada pela constante ao quadrado (102). Quando somamos uma constante aos dados (25), a variância não se altera.

clip_image034

clip_image036

Gabarito: C

Pronto. Usamos o cálculo alternativo da variância em conjunto com o emprego da variável auxiliar. Como fizemos?

Calculamos tudo para a variável auxiliar (média e variância). Depois usamos propriedades da variância para achar a dispersão da variável original (X).

É isso.

Para mais questões comentadas, acesse www.tecconcursos.com.br.

Bons estudos!

Vítor

http://www.facebook.com/vitor.menezes01

vitor@tecconcursos.com.br

Leave a Reply