Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

resumo -estatistica, Resumos de Matemática

resumo de estatistica

Tipologia: Resumos

2010

Compartilhado em 12/08/2010

vanusa-assis-9
vanusa-assis-9 🇧🇷

1 documento

1 / 39

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Resumão: Estatística Básica – por Alexandre José Granzotto
PAGE 2
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27

Pré-visualização parcial do texto

Baixe resumo -estatistica e outras Resumos em PDF para Matemática, somente na Docsity!

RESUMO

ESTATÍSTICA

BÁSICA

Conteúdo

1. Introdução pag. 02

2. Organização de Dados Estatísticos pag. 03

3. Medidas de Posição pag. 14

4. Medidas de Dispersão pag. 27

5. Medidas de Assimetria e Curtose pag. 32

Atenção: Configurar página: Ofício II, largura 21,59cm, altura 33,02cm

Alexandre José Granzotto Julho a Outubro / 2002

RESUMÃO - ESTATÍSTICA BÁSICA

1. INTRODUÇÃO

ESTATÍSTICA: ramo da matemática aplicada.

ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos. Faziam "estatísticas".

IDADE MÉDIA: as informações eram tabuladas com finalidades tributárias e bélicas.

SEC. XVI : surgem as primeiras análises sistemáticas, as primeiras tabelas e os números relativos.

2º - PLANEJAMENTO : Como levantar informações? Que dados deverão ser obtidos? Qual levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma de atividades? Os custos envolvidos? etc.

3º - COLETA DE DADOS: Fase operacional. É o registro sistemático de dados, com um objetivo determinado.

Dados primários: quando são publicados pela própria pessoa ou organização que os haja recolhido. Ex: tabelas do censo demográfico do IBGE.

Dados secundários: quando são publicados por outra organização. Ex: quando determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE.

OBS: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz o grande risco de erros de transcrição.

Coleta Direta: quando é obtida diretamente da fonte. Ex: Empresa que realiza uma pesquisa para saber a preferência dos consumidores pela sua marca.

coleta contínua: registros de nascimento, óbitos, casamentos; coleta periódica : recenseamento demográfico, censo industrial; coleta ocasional : registro de casos de dengue. Coleta Indireta: É feita por deduções a partir dos elementos conseguidos pela coleta direta, por analogia, por avaliação,indícios ou proporcionalização.

4º - APURAÇÃO DOS DADOS: Resumo dos dados através de sua contagem e agrupamento. É a condensação e tabulação de dados.

5º - APRESENTAÇÃO DOS DADOS: Há duas formas de apresentação, que não se excluem mutuamente. A apresentação tabular , ou seja é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Estatística. A apresentação gráfica dos dados numéricos constitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno.

6º - ANÁLISE E INTERPRETAÇÃO DOS DADOS: A última fase do trabalho estatístico é a mais importante e delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes , cuja finalidade principal é descrever o fenômeno (estatística descritiva).

DEFINIÇÕES BÁSICAS DA ESTATÍSTICA

FENÔMENO ESTATÍSTICO : é qualquer evento que se pretenda analisar, cujo estudo seja possível a aplicação do método estatístico. São divididos em três grupos:

Fenômenos de massa ou coletivo: são aqueles que não podem ser definidos por uma simples observação. A estatística dedica- se ao estudo desses fenômenos. Ex: A natalidade na Grande Vitória, O preço médio da cerveja no Espírito Santo, etc.

Fenômenos individuais: são aqueles que irão compor os fenômenos de massa. Ex: cada nascimento na Grande Vitória, cada preço de cerveja no Espírito Santo, etc.

Fenômenos de multidão: quando as características observadas para a massa não se verificam para o particular.

DADO ESTATÍSTICO: é um dado numérico e é considerado a matéria-prima sobre a qual iremos aplicar os métodos estatísticos.

POPULAÇÃO : é o conjunto total de elementos portadores de, pelo menos, uma característica comum.

AMOSTRA: é uma parcela representativa da população que é examinada com o propósito de tirarmos conclusões sobre a essa população.

PARÂMETROS: São valores singulares que existem na população e que servem para caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população. Ex: Os alunos do 2º ano da FACEV têm em média 1, metros de estatura.

ESTIMATIVA: é um valor aproximado do parâmetro e é calculado com o uso da amostra.

ATRIBUTO: quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo.

VARIÁVEL: É o conjunto de resultados possíveis de um fenômeno.

VARIÁVEL QUALITATIVA: Quando seu valores são expressos por atributos : sexo, cor da pele,etc.

VARIÁVEL QUANTITATIVA: Quando os dados são de caráter nitidamente quantitativo , e o conjunto dos resultados possui uma estrutura numérica , trata-se portanto da estatística de variável e se dividem em :

1º - numeramos os alunos de 1 a 90. 2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e após mistura retiramos, um a um, nove números que formarão a amostra. OBS: quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de números aleatórios, construída de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas. .

.AMOSTRAGEM PROPORCIONAL ESTRATIFICADA:

F 0 E 8 Quando a população se divide em estratos (sub-populações), convém que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos. Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São portanto dois estratos (sexo masculino e sexo feminino). Logo, temos:

SEXO POPULACÃ

O

AMOSTRA

MASC. 54 5,4 5

FEMIN. 36 3,6 4

Total 90 9,0 9

Numeramos então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de números aleatórios. .

AMOSTRAGEM SISTEMÁTICA:

F 0 E 8 Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.

Ex: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc.

AMOSTRAGEM POR CONGLOMERADOS (ou AGRUPAMENTOS)

F 0 E 8 Algumas^ populações^ não^ permitem,^ ou^ tornam^ extremamente^ difícil^ que^ se identifiquem seus elementos. Não obstante isso, pode ser relativamente fácil identificar alguns subgrupos da população. Em tais casos, uma amostra aleatória simples desses subgrupos (conglomerados) pode se colhida, e uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos típicos são quarteirões, famílias, organizações, agências, edifícios etc.

Ex: Num levantamento da população de determinada cidade, podemos dispor do mapa indicando cada quarteirão e não dispor de uma relação atualizada dos seus moradores. Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os que residem naqueles quarteirões sorteados.

MÉTODOS NÃO PROBABILÍSITCOS

F 0 E 8 São amostragens em que há uma^ escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população.

AMOSTRAGEM ACIDENTAL

F 0 E 8 Trata-se de uma^ amostra formada por aqueles elementos que vão aparecendo , que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião , em que os entrevistados são acidentalmente escolhidos.

Ex: Pesquisas de opinião em praças públicas, ruas de grandes cidades ;

AMOSTRAGEM INTENCIONAL

F 0 E 8 De acordo com determinado critério,^ é escolhido intencionalmente um grupo de elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião.

Ex: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram.

AMOSTRAGEM POR QUOTAS

F 0 E 8 Um dos métodos de^ amostragem mais comumente usados em levantamentos de mercado e em prévias eleitorais. Ele abrange três fases:

1ª - classificação da população em termos de propriedades que se sabe, ou presume, serem relevantes para a característica a ser estudada;

Vendas no 1º bimestre de 1996

PERÍODO UNIDADES VENDIDAS

JAN/96 20000

FEV/96 10000

TOTAL 30000

b) Série Geográfica : Apresenta como elemento variável o fator geográfico. A época e o fato (espécie) são elementos fixos. Também é chamada de espacial, territorial ou de localização.

ABC VEÍCULOS LTDA.

Vendas no 1º bimestre de 1996

FILIAIS UNIDADES VENDIDAS

São Paulo 13000 Rio de Janeiro 17000 TOTAL 30000

c) Série Específica : O caráter variável é apenas o fato ou espécie. Também é chamada de série categórica.

ABC VEÍCULOS LTDA.

Vendas no 1º bimestre de 1996

MARCA UNIDADES VENDIDAS *

FIAT 18000

GM 12000

TOTAL 30000

SÉRIES CONJUGADAS: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográfica-temporal.

ABC VEÍCULOS LTDA.

Vendas no 1º bimestre de 1996

FILIAIS Janeiro/96 Fevereiro/ São Paulo 10000 3000 Rio de Janeiro 12000 5000

TOTAL 22000 8000

GRÁFICOS ESTATÍSTICOSG

F 0 E 8 São representações visuais dos dados estatísticos que devem corresponder, mas nunca substituir as tabelas estatísticas.

Características: Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade.

Gráficos de informação: São gráficos destinados principalmente ao público em geral, objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos, dispensando comentários explicativos adicionais. As legendas podem ser omitidas, desde que as informações desejadas estejam presentes.

Gráficos de análise: São gráficos que prestam-se melhor ao trabalho estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os gráficos de análise freqüentemente vêm acompanhados de uma tabela estatística. Inclui-se, muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais revelados pelo gráfico.

  • Uso indevido de Gráficos: Podem trazer uma idéia falsa dos dados que estão sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construção de escalas.

Classificação dos gráficos : Diagramas, Estereogramas, Pictogramas e Cartogramas. . 1 - Diagramas: F 0 E 8 São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas. Eles podem ser :

1.- (^) Gráficos em barras horizontais.

1.2- Gráficos em barras verticais ( colunas ).

  • Quando as legendas não são breves usa-se de preferência os gráficos em barras horizontais. Nesses gráficos os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. - A ordem a ser observada é a cronológica, se a série for histórica, e a - decrescente , se for geográfica ou categórica.

2.- Gráficos em barras compostas.

F 0 E 8 É^ um^ tipo^ de^ tabela^ que^ condensa^ uma^ coleção^ de^ dados^ conforme^ as freqüências (repetições de seus valores).

Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados.

Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

ROL: É a tabela obtida após a ordenação dos dados (crescente ou decrescente).

Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

Distribuição de freqüência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seu valores. Para um ROL de tamanho razoável esta distribuição de freqüência é inconveniente, já que exige muito espaço. Veja exemplo abaixo:

Dados Freqüência 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20

Distribuição de freqüência com intervalos de classe: Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores em vários intervalos de classe.

Classes Freqüências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20

ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA (com intervalos de classe) F 0E 8

CLASSE: são os intervalos de variação da variável e é simbolizada por i e o número total de classes simbolizada por k. Ex: na tabela anterior k = 5 e 49 |------- 53 é a 3ª classe , onde i = 3.

LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior de classe ( li ) e o maior número, limite superior de classe ( Li ). Ex: em 49 |------- 53,... l3 = 49 e L3 = 53. O símbolo |------- representa um intervalo fechado à esquerda e aberto à direita. O dado 53 do ROL não pertence a classe 3 e sim a classe 4 representada por 53 |------- 57.

AMPLITUDE DO INTERVALO DE CLASSE: é obtida através da diferença entre o limite superior e inferior da classe e é simbolizada por hi = Li - li. Ex: na tabela anterior hi = 53

- 49 = 4. Obs : Na distribuição de freqüência c/ classe o hi será igual em todas as classes.

AMPLITUDE TOTAL DA DISTRIBUIÇÃO: é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela anterior AT = 61 - 41= 20.

AMPLITUDE TOTAL DA AMOSTRA (ROL): é a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde AA = Xmax - Xmin. Em nosso exemplo AA = 60 - 41 = 19. Obs : AT sempre será maior que AA.

PONTO MÉDIO DE CLASSE : é o ponto que divide o intervalo de classe em duas partes iguais. .......Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/ 2 = 51, ou seja x3=( l3 + L3 )/2.

Método prático para construção de uma Distribuição de Freqüências c/ Classe F 0E 8

1º - Organize os dados brutos em um ROL.

2º - Calcule a amplitude amostral AA.

  • (^) No nosso exmplo: AA = 60 - 41 = 19

Freqüências simples ou absoluta: são os valores que realmente representam o número de dados de cada classe. A soma das freqüências simples é igual ao número total dos dados da distribuição.

Freqüências relativas: são os valores das razões entre as freqüência absolutas de cada classe e a freqüência total da distribuição. A soma das freqüências relativas é igual a 1 (100 %).

.

Polígono de freqüência: é um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição.

.

Polígono de freqüência acumulada: é traçado marcando-se as freqüências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe.

Freqüência simples acumulada de uma classe: é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.

Freqüência relativa acumulada de um classe: é a freqüência acumulada da classe, dividida pela freqüência total da distribuição.

...CLASSE.. ......fi..... .....xi..... .....fri..... .....Fi..... ......Fri..... 50 |-------- 54 4 52 0,100 4 0, 54 |-------- 58 9 56 0,225 13 0, 58 |-------- 62 11 60 0,275 24 0, 62 |-------- 66 8 64 0,200 32 0, 66 |-------- 70 5 68 0,125 37 0, 70 |-------- 74 3 72 0,075 40 1, Total 40 1,

fi = freqüência simples; xi = ponto médio de classe; fri = freqüência simples acumulada;

Fi = freqüência relativa e Fri = freqüência relativa acumulada.

  • Obs: uma distribuição de freqüência sem intervalos de classe é representada graficamente por um diagrama onde cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à respectiva freqüência.

No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 , d3 = 13 - 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e. .. d7 = 12 - 14 = - 2. .

Propriedades da média aritmética F 0E 8

1ª propriedade: A soma algébrica dos desvios em relação à média é nula.

  • No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0

2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada ( ou diminuída) dessa constante.

  • Se no exemplo original somarmos a constante 2 a cada um dos valores da variável temos:

Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou Y = .+ 2 = 14 +2 = 16 kilos

3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada ( ou dividida) por essa constante.

  • Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável temos:

Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou Y = x 3 = 14 x 3 = 42 kilos

Dados agrupados:

Sem intervalos de classe F 0E 8 Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por família:

Nº de meninos freqüência = fi

total 34

  • Como as freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média aritmética ponderada , dada pela fórmula:

..xi. ..fi. ..xi.fi. 0 2 0 1 6 6 2 10 20 3 12 36 4 4 16 total 34 78

onde 78 / 34 = 2,3 meninos por família Com intervalos de classe F 0E 8 Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula:

onde Xi é o ponto médio da classe.

Ex: Calcular a estatura média de bebês conforme a tabela abaixo.

Estaturas (cm) freqüência = fi ponto médio = xi ..xi.fi. 50 |------------ 54 4 52 208 54 |------------ 58 9 56 504 58 |------------ 62 11 60 660 62 |------------ 66 8 64 512 66 |------------ 70 5 68 340 70 |------------ 74 3 72 216 Total 40 2.

Aplicando a fórmula acima temos: 2.440 / 40.= 61. logo ... = 61 cm

Média Geométrica = g

F 0 E 8 É a raiz n-ésima do produto de todos eles.