Baixe Fundamentos de Estatistica e outras Provas em PDF para Fundamentos do Design, somente na Docsity!
FUNDAMENTOS DE ESTATÍSTICA
Jerônimo Flores
ISBN: 978-85-67027-16-
Esta é uma obra coletiva organizada por iniciativa e direção do CENTRO SU- PERIOR DE TECNOLOGIA TECBRASIL LTDA – Faculdades Ftec que, na for- ma do art. 5º, VIII, h, da Lei nº 9.610/98, a publica sob sua marca e detém os direitos de exploração comercial e todos os demais previstos em contrato. É proibida a reprodução parcial ou integral sem autorização expressa e escrita.
CENTRO UNIVERSITÁRIO UNIFTEC Rua Gustavo Ramos Sehbe n.º 107. Caxias do Sul/ RS
REITOR Claudino José Meneguzzi Júnior PRÓ-REITORA ACADÊMICA Débora Frizzo PRÓ-REITOR ADMINISTRATIVO Altair Ruzzarin DIRETOR DE ENSINO A DISTÂNCIA (EAD) Rafael Giovanella
Desenvolvido pela equipe de Criações para o Ensino a Distância (CREAD) Coordenadora e Designer Instrucional Sabrina Maciel Diagramação, Ilustração e Alteração de Imagem Thais Magnus Munhoz Revisora Luana dos Reis
INTRODUÇÃO À ESTATÍSTICA 4
NOÇÕES FUNDAMENTAIS 5
ESTATÍSTICA DESCRITIVA 6
DISTRIBUIÇÃO DE FREQUÊNCIA 14
ESTATÍSTICA BÁSICA 21
REGRESSÃO LINEAR SIMPLES 33
INTERVALO DE CONFIANÇA 37
TABELAS 42
4
INTRODUÇÃO À
ESTATÍSTICA
A estatística é um ramo da Matemática que se propõe a coletar, organizar, sistematizar, descrever, analisar e interpretar dados para o auxílio no processo de tomada de decisão.
A estatística vem sendo utilizada há séculos. Na Bíblia Sagrada existem re-
latos de história de contagem de pessoas com finalidades militares e de cobrança
de impostos.
Podemos dividir a estatística em três grandes áreas: a estatística descritiva, a es-
tatística inferencial e a estatística probabilística. Na estatística descritiva, os procedi-
mentos resumem-se a descrever os dados, o que exige organização, síntese e apresenta-
ção. Na estatística inferencial, procuramos generalizar um fenômeno a partir do estudo
com uma fração ou pedaço dele. Já, a estatística probabilística, mede as tendências de
um fenômeno acontecer, partindo de observações preliminares (CORREA, 2003).
NOÇÕES FUNDAMENTAIS
Neste item estudaremos alguns conceitos e ideias que serão de suma importân-
cia para o nosso sucesso na disciplina. Como:
- Variável: uma característica que pode assumir distintos valores, de acordo com
os sujeitos e o contexto (CORREA, 2003). Por exemplo: o crescimento de uma
planta, a distância que o vendedor percorre com o carro da empresa, o desgaste
de uma peça, etc.
- População: é o conjunto formado por elementos que tenham pelo menos uma
variável comum (MORETTIN, 2010).
- Amostra: após a população ser definida, um subconjunto ou “recorte” dessa será a amostra.
Utiliza-se n para indicar o número que foi amostrado (MORETTIN, 2010).
- Amostragem: é o processo utilizado para a composição da amostra (MORETTIN, 2010). - Dados brutos: são os dados na forma com que foram coletados, sem qualquer tratamento mate-
mático (CORREA, 2003).
- Frequência: é o número de vezes que um fenômeno se repete (CORREA, 2003). - Rol: é a organização dos dados brutos na forma crescente ou decrescente (CORREA, 2003). - Parâmetro: é uma medida utilizada para descrever as características de uma população de forma
numérica. A média e a variância são exemplos de parâmetros (MORETTIN, 2010).
- Censo: é uma pesquisa em que a
população é igual à amostra (COR-
REA, 2003). O IBGE se propõe a fa-
zer um censo da população brasi-
leira, ou seja, entrevistar todos os
habitantes do país.
Vamos exemplificar:
Considerando, unicamente, os números 80, 75, 120, 100, 84 e 67 podemos dizer
que temos os dados brutos da distância percorrida. No momento em que eles forem
organizados seguindo um padrão matemático: 67, 75, 80, 84, 100 e 120 temos um rol.
Outro conceito importante é o de amplitude total (h).
Assim, podemos dizer que a amplitude total da distância percorrida pelo vende-
dor é dada por h= 120 -67 h= 53 km.
Quando o nosso processo de contagem exigir a consideração de mais de uma
variável significativa, podemos montar uma tabela de entrada dupla. Por exemplo,
você foi responsabilizado para verificar se os funcionários da empresa desejam re-
alizar horas extras. A sua experiência anterior, indica que homens e mulheres têm
opiniões diferentes a respeito desse assunto. Então, a tabela é organizada com as va-
riáveis “homens” e “mulheres”.
Amplitude, refere-se ao tamanho, ou seja, o maior valor menos o menor.
GRÁFICOS
Gráficos, além de fornecerem a organização dos dados, são excelentes para apresentações
e palestras, pois produzem um efeito visual interessante e revelam o comportamento do fenôme-
no. Entretanto, são necessários alguns cuidados na sua elaboração, dentre os quais destacamos:
veracidade, clareza e simplicidade. Lembre-se que os gráficos podem ser apresentados para pes-
soas que não conhecem a sua pesquisa, logo, eles precisam fornecer uma ideia do que aconteceu.
Entrada dupla Interesse em realizar horas extras Homens^ Mulheres^ Total Não 16 35 51 Sim 45 5 50 Total 61 40 101
GRÁFICO EM COLUNAS
Observe que o gráfico a seguir, apesar de representar o fenômeno, pode conter proble-
mas para uma apresentação. Veja que alguns vendedores não têm a sua venda indicada, le-
vando o leitor a precisar supor o valor exato da venda. Além disso, seria necessário especificar
o período para termos uma noção de como as vendas aconteceram.
GRÁFICO EM BARRAS
Assemelha-se ao gráfico em colunas, porém, os retângulos são dispostos horizontal-
mente (CORREA, 2003, p.25). A escolha do modelo depende exclusivamente do interesse e da
preferência de quem fez o gráfico, pois são representações muito similares.
Entenda mais sobre os tipos de gráficos:
O gráfico indica as vendas dos representantes comerciais da empresa “Sul Metais” Ltda.
O gráfico indica as vendas dos representantes comerciais da empresa “Sul Metais” Ltda.
Vendas Vendas
Perceba que com esse tipo de gráfico é possível observar com clareza os
períodos de queda e de crescimento nas vendas do representante.
AMOSTRAGEM
Podemos entender a população como a totalidade dos sujeitos envolvi-
dos na pesquisa. A amostra é um “recorte” dessa população. A amostragem é
a forma como efetuamos esse “recorte”.
Existem outros tipos de gráficos que devem ser usados, de acordo com a necessidade do pesquisador, mas, sobretudo, com o uso do bom senso.
Amostragem é a forma ou técnica utilizada para compormos a amostra.
Veja as classificações de amostragem!
AMOSTRAGENS PROBABILÍSTICAS
São técnicas que envolvem elementos estatísticos durante a composição da amostra.
Aqui, procuramos eliminar o viés da aleatoriedade.
AMOSTRAGEM ALEATÓRIA SIMPLES
Nesse processo, precisamos identificar todos os elementos da população, selecionando a
amostra a partir de um sorteio. É imprescindível que todos os elementos da população tenham
a mesma chance de pertencerem à amostra (BARBETTA, 2002). Para isso, é muito importante a
realização de um sorteio honesto. Uma boa ideia é a utilização de geração de números aleatórios.
Na planilha eletrônica, você pode utilizar o comando ALEATÓRIOENTRE. Por exemplo, você de-
seja sortear um número aleatório entre 1 e 120. Basta digitar “=ALEATÓRIOENTRE(1;120)”.
AMOSTRAGEM SISTEMÁTICA
É similar à amostragem aleatória simples, sendo utilizada quando almejamos compor
a amostra a partir de ciclos. É necessário ordenar os elementos, fornecendo uma cobertura
mais ampla do fenômeno (BARBETTA, 2002).
1. Numerar aleatoriamente os funcionários.
Exemplo: a construtora “JBF construções” tem 30 funcionários e deseja entrevistar 5 deles em relação às condições de segurança no trabalho. A amostragem será a sistemática. Vamos aos passos:
- Beto 7) Cristiane 13) Alexandre 19) Andrei 25) Marcelo
- Marilene 8) Daniel 14) Bruna 20) Débora 26) Tiago
- Carlos 9) Márcio 15) Gláucia 21) Janice 27) Ana Paula
- Ângela 10) Simone 16) Ivo 22) Marluce 28) Max
- Alfredo 11) Monique 17) Dener 23) Jaqueline 29) Sinara
- Vicente 12) Maicon 18) João 24) Patrícia 30) Marília
1. Indústrias
2. Comércio
3. Instituições de Ensino Superior
4. Empresas de Consultoria
Realizamos um sorteio aleatório entre os números 1 e 4. Suponha que o número 2 foi
sorteado. Assim, precisamos entrevistar todos os administradores que trabalham no comér-
cio na cidade de Caxias do Sul.
AMOSTRAGENS NÃO PROBABILÍSTICAS
Em muitas situações não é possível conhecer a priori, a probabilidade de um elemen-
to da população pertencer à amostra. Em outras, é muito difícil numerar-se toda a população
(BARBETTA, 2002).
Exemplo: Em uma pesquisa sobre a saúde dos peixes em um rio, não é possível determinarmos nem fazermos a numeração da população. Nesses casos, utilizamos as amostragens não probabilísticas.
AMOSTRAGEM A ESMO
Como o nome sugere, consiste em escolher a esmo, sem um critério matemático previs-
to anteriormente. Nesse caso, contamos com o acaso para escolhermos os representantes da
população.
AMOSTRAGEM INTENCIONAL
Pode ser utilizada quando o pesquisador visa uma determinada característica dentro da
população. É um tipo de pesquisa bastante utilizada no mercado consumir, pois visa um de-
terminado tipo ou perfil de cliente.
Exemplo: Queremos testar a resistência de parafusos ao calor. Temos 5. parafusos e queremos analisar 250. Seria inviável numerar os parafusos e utilizar a amostragem aleatória simples, por exemplo. Assim, sorteamos os 250 parafusos ao acaso ou a esmo, que justifica o nome da técnica.
Exemplo: Você trabalha no setor de qualidade de uma empresa que manufatura tabaco, e almeja conferir a satisfação sobre uma nova marca de cigarro disponível no mercado. Assim, devem ser entrevistados, intencionalmente, fumantes. Uma amostragem composta de outra forma, além de poder formar uma amostra pequena, pode causar uma série de constrangimentos para o pesquisador.
DISTRIBUIÇÃO DE FREQUÊNCIA
Podemos entender a frequência como o número de vezes que um fenômeno se repete.
Uma distribuição de frequência é uma tabela na qual os possíveis valores de uma variável se
encontram agrupados em classes, registrando-se o número de valores observados em cada classe
(KAZMIER, 1982, p.8).
DISTRIBUIÇÃO DE FREQUÊNCIA SEM AGRUPAR DADOS
A distribuição de frequência sem agrupar dados é feita, a partir da observação do número de
acontecimentos em determinados intervalos de uma amostra.
Podemos organizar estes dados considerando o número de funcionários que faltou e o número
de vezes que isto ocorreu (frequência absoluta).
AMOSTRAGEM POR COTAS
Assemelha-se à amostragem estratificada, também trabalhando com subcon-
juntos, em que a população é dividida. Seleciona-se para participar da amostra uma
cota de cada subgrupo, sendo proporcional ao seu tamanho. Entretanto, a seleção não
tem a necessidade de ser aleatória (BARBETTA, 2002).
Perceba que um dos estratos (masculino com mais de 40 anos) foi de certa forma pri-
vilegiado, com um percentual maior de entrevistas, o que pode “contaminar” a pesquisa.
Exemplo: uma empresa deseja promover um estudo sobre o “peso” dos seus funcionários. Levou-se em conta o sexo e a idade. Como não era possível obrigar todos os funcionários a realizar o exame, a instituição chegou aos seguintes números de entrevistados:
Exemplo: o departamento pessoal da empresa “PL Calçados” efetuou um levantamento dos funcionários que estiveram ausentes no decorrer de dois anos.
Sexo Mais de 40 anos Menos de 40 anos Masculino 48 % 14 % Feminino 26 % 12 %
Em pesquisas eleitorais são utilizadas amostragens por cotas. Consideram-se sexo, escolaridade e renda, por exemplo.
Jan. Fev. Mar. Abr. Mai. Jun. Jul. Ago. Set. Out. Nov. Dez. Ano 1 6 7 1 6 9 2 7 9 1 8 10 9 Ano 2 8 8 5 1 7 4 10 9 4 10 6 10
Funcionários ausentes
Distância (Km) percorrida pelo vendedor
1. Estimar o número de classe.
Utilizamos a fórmula de Sturges:
Importante: explore a sua calculadora! Em algumas basta digitar a fórmula, em
outras você precisa calcular o log primeiro, multiplicar por 3,3 e, por último, somar um.
Vamos considerar que a nossa amostra tem 30 elementos, então n=30.
Logo:
k=1+3,3logn
k=1+3,3log
k=1+3,3.1,
k=5,87 aproximadamente 6 classes
2. Estimar a amplitude de cada classe.
h= (3000-550)/
h=408,
Importante: a amplitude de classe é o único caso que devemos
arredondar “para cima”, sempre, pois caso contrário, o último valor
da tabela pode não se encaixar na distribuição de frequência. Assim,
h = 409.
3. Montar a tabela com a frequência absoluta.
Para isso, partimos do primeiro valor do rol (ver tabela 5), ou
seja 550. Este será o limite inferior da primeira classe. Para encon-
trarmos o limite superior, somamos 550 com 409, que é a amplitude
do intervalo, resultando em 959. A segunda classe começará com 959,
que será somado com 409. O processo segue até alcançarmos 6 clas-
ses, conforme a tabela a seguir. Para encontrar a frequência absoluta,
voltamos para a tabela 5 e contamos quantos elementos pertencem à
cada classe. Perceba que existem 16 eventos entre 550 e 959:
k=1+3,3logn
h= [maior valor]-[menor valor] número de classes desejadas
4. Frequência relativa.
Basta dividir cada um dos valores da frequência
absoluta pelo total, ou seja 30.
5. Frequência percentual.
Basta multiplicar a frequência relativa por 100.
6. Frequência acumulada e frequência acumulada percentual.
Distância Frequência absoluta (fi) 550 |–959 16 959 |– 1368 8 1368 |– 1777 1 1777 |– 2186 1 2186 |– 2595 1 2595 |–3004 3 TOTAL 30
Distribuição de frequência
Distância fi fr 550 |–959 16 16/30 : 0, 959 |– 1368 8 8/30: 0, 1368 |– 1777 1 1/30: 0, 1777 |– 2186 1 1/30: 0, 2186 |– 2595 1 1/30: 0, 2595 |–3004 3 3/30: 0, TOTAL 30 Aprox.
Distribuição de frequência
Distância fi fr fp 550 |–959 16 16/30 : 0,53 53 % 959 |– 1368 8 8/30: 0,27 27 % 1368 |– 1777 1 1/30: 0,033 3,3% 1777 |– 2186 1 1/30: 0,033 3,3% 2186 |– 2595 1 1/30: 0,033 3,3% 2595 |–3004 3 3/30: 0,1 10 % TOTAL 30 Aprox.1 Aprox. 100%
Distribuição de frequência
Distância fi fr fp fa fap 550 |–959 16 16/30 : 0,53 53 % 16 53 % 959 |– 1368 8 8/30: 0,27 27 % 16+8: 24 80 % 1368 |– 1777 1 1/30: 0,033 3,3% 24+1: 25 83,3% 1777 |– 2186 1 1/30: 0,033 3,3% 25+1: 26^ 86,6% 2186 |– 2595 1 1/30: 0,033 3,3% 26+1: 27 89,9% 2595 |–3004 3 3/30: 0,1 10 % 27+3: 30 99,9% TOTAL 30 Aprox.1 Aprox. 100%
Distribuição de frequência
EXERCÍCIOS SUMÁRIO
1. Uma franquia de lojas instalou algumas representações em diversas regiões do Rio Gran-
de do Sul. Com o fim de conferir a satisfação dos clientes, resolveu entrevistar 7% des-
ses de cada região. Então, vamos completar a tabela, indicando a amostra e o número da
amostra. Obs. o número da amostra é a amostra, porém, arredondada.
2. O número de produtos que os clientes trocam em uma loja, foram registrados na tabela
que segue:
Vamos construir uma distribuição de frequência, sem agrupar dados:
3. Os funcionários da empresa “123 Testes Informática” estavam reclamando do tempo de
reuniões. Para verificar se a reclamação procedia, foi realizado um estudo, no qual se
controlou o tempo das reuniões em minutos, que foram organizados na tabela que segue:
Construa uma tabela de distribuição de frequência com dados agrupados por classes.
Considere a frequência absoluta, frequência relativa, frequência percentual, frequência acu-
mulada e frequência acumulada percentual.
Região Clientes Amostra Número de amostra Metropolitana 690 Serra 380 Campanha 160 Litoral 280
Casacos Camisetas Camisas Meias Sapatos Cintos 8 5 0 5 7 4 7 4 1 4 8 3 6 3 4 2 6 2
Segunda Terça Quarta Quinta 45 52 70 58 50 51 46 63 42 44 59 54 41 40 64 60
EXERCÍCIOS SUMÁRIO
4. Observe um estrato de uma tabela extraída do site do IBGE:
Construa um gráfico de setores, preferencialmente, utilizando planilhas eletrônicas.
5. João Oliveira, o gerente da empresa onde você trabalha, recebeu um e-mail com o se-
guinte conteúdo:
Seu João. O Ricardo rodou 344 km e vendeu R$ 456,00, enquanto o Bruno rodou apenas 124
km e vendeu R$540,00. Só não entendi o Gilmar, que rodou 1389 km e vendeu apenas R$123,00.
Por outro lado, a Marisa, que preferiu ficar na empresa e trabalhar por telefone, conseguiu vender
R$560,00. Acho que está na hora de tomarmos algumas decisões.
Att
Vinicius Araújo
Construa uma tabela de entrada dupla com os dados envolvidos no e-mail recebido pelo
gerente da situação anterior.
Segmento Número de empresas Fabricação de produtos alimentícios 6. Fabricação de bebidas 551 Fabricação de produtos do fumo 42 Fabricação de produtos têxteis 2. Confecção de artigos do vestuário e acessórios 8 939
Empresas que não apresentaram ações de inovações organizacionais e marketing no Brasil entre 2006 e 2008.