


Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Apostila sobre as Medidas de Dispersão utilizada na aula de Probabilidade e Estatística de uma faculdade particular.
Tipologia: Resumos
1 / 4
Esta página não é visível na pré-visualização
Não perca as partes importantes!
MEDIDAS DE DISPERSÃO ( Medidas de variabilidade)
As medidas de dispersão medem a variabilidade dos dados em estudo. As medidas de dispersão como amplitude, variância, desvio padrão e coeficiente de variação, permitem verificar se o conjunto de dados é homogêneo ou heterogêneo.
Amplitude total ou máxima é a diferença entre o maior e o menor valor de um conjunto de dados. Como no caso da nota média das notas do teste psicotécnico da Tabela 1, a amplitude máxima é dada pela diferença entre 75 e 60, ou seja, 05. Logo, as notas do teste variam 05 unidades.
Para estudar a dispersão dos dados, a amplitude não é um dos melhores meios, pois, este cálculo é efetuado apenas com os valores extremos do conjunto. Por exemplo, as idades em anos de um grupo de pessoas, são: 2, 5, 8, 10, 14, 18 e 22.
Um segundo grupo, possui as idades: 2, 14, 15, 15, 16,16 e 22.
Nos dois grupos de pessoas, a amplitude máxima é de 20 anos, porém, a dispersão no primeiro é bem maior que no segundo. Para medir a dispersão de um grupo de dados, o pesquisador poderá fazer uso do desvio padrão, de procedimento matemático igualmente fácil, mas muito mais elaborado e que contempla todos os valores do conjunto de dados em estudo.
Variância
A variância da amostra é aproximadamente a média das diferenças ao quadrado entre cada uma das observações de um conjunto de dados. Assim sendo, para uma amostra contendo n observações x1, x2, ..., xn, a variância da amostra pode ser escrita como ou como sendo Em que: é a média aritmética da amostra; da iésima observação da variável aleatória; e do número de elementos da amostra.
𝟐
𝒏
Desvio Padrão
O desvio padrão de uma amostra (representado pela letra S) é definido como sendo a raiz quadrada da variância da amostra.
Ao iniciar as análises de um agrupamento de dados, a média permite que se estabeleça um juízo sobre tal conjunto. Porém, não permite avaliar a dispersão, principalmente para conjunto
de dados mais numerosos.
Um dos modos mais simples de se medir a dispersão, é calcular a amplitude total, entretanto, tal amplitude pode se deixar influenciar pelos valores extremos. O desvio padrão foge a essa falha por levar em conta todos os valores em questão. Portanto, o desvio padrão é muito mais conveniente no cálculo da dispersão.
O desvio padrão é definido como a raiz quadrada da média dos quadrados dos desvios (variância):
S S^2
O desvio padrão populacional ou amostral mede a variabilidade dos dados, com respeito à média. Conjunto de dados com maior dispersão implica em desvios padrões elevados.
A diferença entre o desvio padrão populacional e o desvio padrão amostral, está no significado do conjunto e no denominador da expressão matemática que o determina. Enquanto o desvio padrão amostral é calculado com a média de uma amostra da população, portanto, expresso a partir de um valor estimado da verdadeira média, o desvio padrão populacional é obtido com a média verdadeira, ou seja, a média da população. Então, o denominador n do desvio estimado, é subtraído de uma unidade como forma de correção, uma vez que essa subtração implica em um aumento de seu valor e, portanto, o uso do desvio padrão amostral tem diminuído a possibilidade de erro quando for usado para verificar a variabilidade dos dados.
Para exemplificar a análise de variabilidade de dados, analisar-se-á 4 amostras de massas de alunos iniciantes em um curso de graduação. Os dados com as estaturas destes alunos constam abaixo.
Amostras com massas de alunos de graduação
AMOSTRAS MASSAS (kg)
Amostra 1 62 58 70 65 60
Amostra 2 63 63 63 63 63
Amostra 3 42 55 65 78 75
Amostra 4 38 46 85 90 56
Em ambas as amostras da tabela acima, a média das massas dos alunos é 63 kg. Entretanto, a dispersão observada não é a mesma. Para a amostra 1, o desvio padrão amostral é de 4,69 kg, a segunda amostra não possui variabilidade, na terceira o desvio padrão é de 14,82 e, para a quarta, este valor sobe para 23,32. Comparando os resultados dos desvios padrões calculados, se observa que, quanto maior for a dispersão dos dados, maior será o valor numérico do desvio padrão. Ressalta-se que o desvio padrão somente tem sentido enquanto informação se for comparado com a média.
A curtose e calculada através da seguinte fórmula:
𝐶 = (𝑄 3 − 𝑄 1 ) 2(𝑃 90 − 𝑃 10 ) Onde Se C<0,263 A distribuição é LEPTOCÚRTICA;
Se C=0,263 A distribuição é MESOCÚRTICA;
Se C>0,263 A distribuição é PLATICÚRTICA.
Assimetria
A assimetria é o grau de deformação de uma curva de frequências. Uma distribuição de frequência é simétrica, ou seja, que apresenta um gráfico cuja as duas caudas possuem a mesma configuração (figura a), quando a média, a mediana e a moda da série forem iguais. A distribuição de frequência também pode ser assimétrica positiva (figura b) e assimétrica negativa (figura c), a primeira possui uma cauda mais alongada à direita e ocorre quando a média da série for maior que a moda e a segunda apresenta uma cauda mais alongada à esquerda e ocorre quando média da série for menor que a moda.
medida adimensional, observe:
𝛥𝑠 =
onde Mo é a moda da série. A distribuição será simétrica quando 𝛥𝑠 = 0, se 𝛥𝑠 for maior que zero a assimetria é positiva e se 𝛥𝑠 for menor que zero a assimetria é negativa.
a)
b) c)
Figura c. Representação esquemática da assimetria.