




























































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Apostila de Estatística Básica - Maria Teresa (UFRRJ)
Tipologia: Exercícios
Oferta por tempo limitado
Compartilhado em 03/09/2019
4.9
(8)3 documentos
1 / 126
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Em oferta
Apresenta¸c˜ao
Esta apostila cont´em um resumo do material a ser apresentado na disciplina IC-280, Estat´ıstica B´asica, na UFRRJ. O texto ´e baseado no livro texto da disciplina, Estat´ıstica B´asica, de Wilton Bussab e Pedro Morettin e cont´em tamb´em v´arios exerc´ıcios de outros livros. Os exerc´ıcios retirados do livro texto, est˜ao marcados com o s´ımbolo ♠. Este resumo n˜ao substitui o livro texto e deve servir apenas de guia para o aluno acompanhar a seq¨uˆencia da mat´eria lecionada. Nos apˆendices, s˜ao apresentadas tabelas e respostas de alguns exerc´ıcios propostos. Agradecemos a monitora da disciplina Estat´ıstica B´asica, Manoela Machado do Vale, por fornecer v´arias destas respostas.
Antonieta D’Alcˆantara de Queiroz Peres
Maria Teresa Carneiro da Cunha
A Estat´ıstica ´e a parte da ciˆencia que tem por objetivo
Os dados podem ser obtidos por observa¸c˜ao: quando o pesquisador n˜ao pode controlar as caracter´ısticas de interesse; experimentos: quando o pesquisador controla parcialmente as caracter´ısticas de interesse.
Exemplo 1.1 Suponha que se deseja estudar a rela¸c˜ao entre os gastos de consumo e a renda de um determinado grupo de indiv´ıduos. Uma pesquisa pode constar da escolha, por sorteio, de alguns indiv´ıduos do grupo e da coleta das informa¸c˜oes sobre as caracter´ısticas de interesse nestes indiv´ıduos.
Exemplo 1.2 Deseja-se comparar duas variedades de cana de a¸c´ucar, com respeito a um tipo de aduba¸c˜ao. S˜ao escolhidos dois n´ıveis de adubo (“ausente”, “presente”, por exemplo) e algumas mudas de cada uma das variedades s˜ao plantadas sob cada um destes n´ıveis.
No primeiro exemplo, o pesquisador apenas observa as caracter´ısticas de interesse nos indiv´ıduos sorteados, e no segundo exemplo, ele controla uma das caracter´ısticas: o n´ıvel de adubo utilizado no experimento. Em ambos os casos, os dados est˜ao sujeitos a varia¸c˜oes do “acaso”, ou seja, podem ser afetados por condi¸c˜oes qua n˜ao podem ser controladas ou observadas. Por meio de uma an´alise de dados, busca-se uma forma de regularidade ou padr˜ao, ou modelo, presente nas observa¸c˜oes. Dados = modelo + res´ıduos (D=M+R) Os res´ıduos (ou erros) s˜ao a diferen¸ca entre as observa¸c˜oes e o modelo proposto. A An´alise Explorat´oria de Dados ( EDA ) ´e um conjunto de t´ecnicas que busca estabele- cer a melhor rela¸c˜ao D=M+R para um particular conjunto de dados.
Algumas defini¸c˜oes importantes:
As vari´aveis qualitativas podem ainda ser divididas em: vari´aveis qualitativas nominais, se n˜ao existe nenhuma ordem em suas poss´ıveis realiza¸c˜oes ou vari´aveis qualitativas ordinais, se existir uma ordem em suas poss´ıveis realiza¸c˜oes. As vari´aveis quantitativas podem ainda ser divididas em: vari´aveis quantitativas dis- cretas, se seus poss´ıveis valores formam um conjunto finito ou enumer´avel ou vari´aveis quantitativas cont´ınuas, se seus poss´ıveis valores formam um intervalo ou uni˜ao de intervalos de n´umeros reais.
Esquematicamente, podemos representar a divis˜ao das vari´aveis por
NOMINAL QUALITATIVA ↗ ORDINAL VARI AVEL´ ↘ DISCRETA QUANTITATIVA CONT´INUA
Exemplo 1.3 Na Tabela 1.1, apresentamos os resultados fornecidos por 50 alunos da disci- plina Estat´ıstica B´asica, turmas T01 e T02, do segundo semestre de 1999. As vari´aveis TV e Ex.Fis correspondem ao n´umero m´edio de horas gastas por semana assistindo TV e pra- ticando exerc´ıcios f´ısicos, respectivamente. A vari´avel OpTV ´e a opini˜ao sobre a qualidade da programa¸c˜ao da TV (B: Boa, M: M´edia, R: Ruim e N: N˜ao sabe). A vari´avel Ativ. ´e o n´ıvel de atividade f´ısica, constru´ıda da seguinte maneira: sedent´ario: se o estudante pratica no m´aximo 2 horas de exerc´ıcios f´ısicos semanais; m´edio: se pratica mais de 2 e menos de 6 horas semanais e ativo: se pratica 6 ou mais horas semanais. Classifique cada uma destas vari´aveis.
Distribui¸c˜ao de Freq¨uˆencias: Ao estudar uma vari´avel, o principal interesse do pesquisador ´e, em geral, conhecer a distribui¸c˜ao desta vari´avel atrav´es dos seus valores. Podemos repre- sentar a distribui¸c˜ao dos valores de uma vari´avel utilizando uma tabela de freq¨uˆencias da forma:
Tabela 1.2 Tabela de freq¨uˆencias Vari´avel Freq¨uˆencia (ni) Propor¸c˜ao (fi) Porcentagem (%) n´ıvel 1 n 1 f 1 100 × f 1 n´ıvel 2 n 2 f 2 100 × f 2 .. .
n´ıvel k nk fk 100 × fk Total n = n 1 + n 2 +... + nk 1 = f 1 +... + fk 100
em que
Exemplo 1.4 Representar as vari´aveis “Religi˜ao” e “N´ıvel de atividade f´ısica” em tabelas de freq¨uˆencia.
Tabela 1.3 Distribui¸c˜ao de freq¨uˆencias: “Religi˜ao ”.
Religi˜ao freq¨uˆencia (ni) propor¸c˜ao(fi ) % Cat´olica 23 0,51 51% Evang´elica 7 0,16 16% Nenhuma 10 0,22 22% Outras 5 0,11 11% Total 45 1.00 100%
Tabela 1.4 Distribui¸c˜ao de freq¨uˆencias:“N´ıvel de atividade f´ısica”.
Atividade freq¨uˆencia (ni) propor¸c˜ao (fi) % Ativo 4 0.09 9% M´edio 11 0.24 24% Sedent´ario 30 0.67 67% Total 45 1.00 100%
Exemplo 1.5 Representar as vari´aveis “N´ıvel de atividade f´ısica” e “Sexo” em uma mesma tabela de freq¨uˆencias (Distribui¸c˜ao Conjunta).
Tabela 1.5 Distribui¸c˜ao conjunta: N´ıvel de atividade f´ısica por Sexo
Sexo Atividade Feminino Masculino Total Ativo 0 4 4 M´edio 5 6 11 Sedent´ario 12 18 30 Total 17 28 45
Exemplo 1.6 Representar a vari´avel “Peso” utilizando uma tabela de freq¨uˆencias. Neste caso, vamos criar um artif´ıcio para representar esta vari´avel em uma tabela de freq¨uˆencias. Os n´ıveis das vari´aveis ser˜ao representados por intervalos de classe. Vejamos:
Tabela 1.6 Distribui¸c˜ao de freq¨uˆencias: “Peso (kg)”
Classe xi ni fi % 45 55 50 10 0.23 23% 55
60 57,5 7 0.16 16% 60 70 65 11 0.25 25% 70
80 75 9 0.20 20% 80 ` 90 85 7 0.16 16% Total – 44 1 100%
em que
Note que um dos alunos n˜ao informou o peso e utilizamos o total de 44 alunos para obter a freq¨uˆencia relativa.
Uma outra forma de se apresentar os dados ´e por meio da utiliza¸c˜ao de Gr´aficos.
1.3.1 Representa¸c˜ao gr´afica das vari´aveis qualitativas
Existem v´arios tipos de gr´aficos que podem ser utilizados para representar as vari´aveis qual- itativas. Para construir estes gr´aficos, consideraremos as freq¨uˆencias com que os n´ıveis das vari´aveis aparecem em um conjunto de dados.
Gr´afico de Setores
´E tamb´em um gr´afico bastante utilizado para representar vari´aveis qualitativas. E muitas´
vezes chamado de Gr´afico de Torta ou Gr´afico de pizza. Neste gr´afico, um c´ırculo representa 100% das observa¸c˜oes e cada n´ıvel da vari´avel ´e representado por um setor de ´area propor- cional `a freq¨uˆencia observada. Algumas observa¸c˜oes podem ser feitas a respeito da constru¸c˜ao do gr´afico.
Exemplo 1.9 Em recente pesquisa em uma pequena comunidade do interior de Minas Gerais, foram ouvidos 600 homens e 400 mulheres sobre o consumo de ´alcool. Entre os entrevistados, cerca de 400 homens consumiam bebidas alc´oolicas sendo que 80% destes be- biam regularmente e o restante apenas eventualmente. Entre as mulheres, embora a maioria (70%) consumissem bebidas alc´oolicas apenas 120 o faziam regularmente. Representar estas informa¸c˜oes em uma tabela de freq¨uˆencias e depois coloc´a-las em um gr´afico de colunas (Figura 1) e em um gr´afico de setores (Figura 2).
Tabela 1.7 “Consumo de bebidas: Exemplo 1.9” Sexo N˜ao bebe Bebe eventualmente Bebe regularmente Total Masculino 200 80 320 600 Feminino 120 160 120 400 Total 320 240 440 1000
1.3.2 Representa¸c˜ao gr´afica das vari´aveis quantitativas
Gr´afico de linhas
´E o mais comum dos gr´aficos e um dos mais simples, representando os n´ıveis das vari´aveis
em coordenadas retangulares. Observa¸c˜ao sobre a constru¸c˜ao do gr´afico:
Exemplo 1.10 Fa¸ca um gr´afico de linhas representando as s´eries abaixo.
Mes Jan Fev Mar Abr Mai Jun Jul INPC 28.8 24.8 27.5 28.3 26.8 30.3 31. IRSM 27.9 25.8 26.8 28.2 28.4 30.5 29.
1.3.3 Gr´aficos especiais
O histograma
O histograma ´e um gr´afico que representa n´umeros pela ´area e n˜ao pela altura. E´ utilizado, em geral, para representar distribui¸c˜oes de vari´aveis cont´ınuas quando os dados est˜ao agrupados em classes de freq¨uˆencia. Embora tenha a aparˆencia de um gr´afico de colunas, n˜ao deve ser confundido com ele. Podemos construir histogramas de freq¨uˆencias, de propor¸c˜ao ou de porcentagem. A distribui¸c˜ao nas diversas classes ´e representada por blocos constru´ıdos da seguinte forma,
A densidade na classe i ´e definida por
di = ni (^4) i , no caso de freq¨uˆencias,
di = fi (^4) i , no caso de propor¸c˜ao,
di = 100 × fi (^4) i , no caso de porcentagem,
em que (^4) i representa o comprimento do intervalo da i-´esima classe. Observa¸c˜oes:
K = 1 + log 2 n ( F´ormula de Sturges).
Uma vez determinado o valor de K, divide-se a amplitude total pelo n´umero K, para obter o comprimento dos intervalos das classes. Observe que neste caso, obtemos todas as classes com a mesma amplitude, o que nem sempre ´e conveniente.
Pol´ıgono de Freq¨uˆencias O pol´ıgono de freq¨uˆencias ´e constru´ıdo de forma semelhante a do histograma. Une-se o ponto m´edio das classes na altura determinada pela densidade. Para fechar o pol´ıgono unimos os extremos da figura com o eixo das abcissas, nos quais estariam os pontos m´edios de uma classe imediatamente anterior e outra imediatamente posterior. Embora a ´area total abaixo do pol´ıgono de freq¨uˆencias tamb´em seja igual a 100% das observa¸c˜oes, n˜ao podemos aproximar a freq¨uˆencia entre dois pontos pela ´area delimitada por eles.
Histograma Alisado
Se houvesse um n´umero suficientemente grande de observa¸c˜oes poder-se-ia ir diminuindo os intervalos de classe e o histograma iria ficando cada vez menos irregular ate atingir um caso limite, com uma curva bem mais suave. Esta curva ´e chamada de histograma alisado.
Ogiva
´E o gr´afico representativo de uma distribui¸c˜ao acumulada de freq¨uˆencias e consta de uma
poligonal ascendente. No eixo horizontal colocam-se as extremidades de classe e no eixo vertical, as freq¨uˆencias acumuladas (ou propor¸c˜ao acumulada, ou porcentagem acumulada).
Ramo e folhas
A forma de uma distribui¸c˜ao ´e uma caracter´ıstica importante de um conjunto de dados. Um procedimento alternativo para resumir um conjunto de dados, com o objetivo de se ter uma id´eia da forma da distribui¸c˜ao ´e o ramo-e-folhas. Uma vantagem do ramo-e-folhas sobre o histograma ´e que n˜ao perdemos informa¸c˜oes sobre os dados. Observa¸c˜oes sobre a constru¸c˜ao de um ramo-e-folhas
a esquerda de uma linha vertical; a 2a, a folha, ´e colocada
a direita desta linha.1.1 As ´areas dos v´arios continentes do mundo, em milh˜oes de quilˆometros quadrados, est˜ao apresentadas na tabela abaixo:
a) a porcentagem de estudantes com menos de 18 anos; b) a porcentagem de estudantes com no m´ınimo 19 anos; c) a altura abaixo da qual se encontra 90% dos estudantes; d) a altura m´ınima dos 20% dos alunos mais altos. 1.6 Com base nos Ramo-e-folhas, responda as mesmas perguntas da quest˜ao 2 e compare as respostas.
1.7 E poss´´ ıvel afirmar, com base nos gr´aficos, que existe diferen¸ca entre as distribui¸c˜oes de alturas dos estudantes com rela¸c˜ao ao sexo? E entre as distribui¸c˜oes de idades de ingresso na Universidade X?
1.8 Os dados do conjunto 5 (Se¸c˜ao 1.5) referem-se `a popula¸c˜oes de alguns munic´ıpios do estado Y.
a) Construa um ramo-e-folhas e um histograma para este conjunto. b) Comente sobre as principais caracter´ısticas da distribui¸c˜ao. 1.9 Os dados dos conjuntos 6 e 7 (Se¸c˜ao 1.5) referem-se aos tempos de vida de lotes de lˆampadas de duas companhias concorrentes A e B.
a) Construa um ramo-e-folhas para cada um dos conjuntos. b) Comente sobre as principais diferen¸cas entre as distribui¸c˜oes. c) Vocˆe seria capaz de se decidir por uma das companhias, caso tivesse que adquirir um lote de lˆampadas? Por quˆe?
1.10 Os dados dos conjuntos 8 e 9 (Se¸c˜ao 1.5) referem-se ao ganho de peso de alguns animais que foram alimentados com as ra¸c˜oes A e B, por um determinado tempo.
a) Construa um ramo-e-folhas para cada um dos conjuntos. b) Comente sobre as principais diferen¸cas entre as distribui¸c˜oes. c) Vocˆe seria capaz de se decidir por uma das ra¸c˜oes, caso fosse chamado a opinar sobre o assunto?
1.11 O histograma abaixo representa a distribui¸c˜ao dos frangos de uma determinada granja em rela¸c˜ao ao peso:
Queremos dividir os frangos em quatro categorias com rela¸c˜ao ao peso, de modo que: Os 20% mais leves sejam da categoria D; Os 25% seguintes sejam da categoria C; Os 25% seguintes sejam da categoria B; Os 30% seguintes sejam da categoria A. Quais os limites de peso entre as categorias A, B, C e D?
1.12 Em uma pesquisa em uma pequena comunidade dos Estados Unidos, foram observadas as seguintes distribui¸c˜oes:
a) altura dos adultos casados; b) altura de todos os membros de fam´ılias cujos pais tem idade inferior a 30 anos; c) altura de todos os membros da comunidade; d) altura de todos os autom´oveis da cidade. Cada um dos histogramas abaixo refere-se a uma das distribui¸c˜oes acima. Associe cada um deles `a distribui¸c˜ao que ele melhor representa.
CONJUNTO 6: Dura¸c˜ao das lˆampadas - Companhia A
783 1361 2385 159 1614 497 1334 3694 672 2254 1415 1035 1372 109 1895 1526 2569 1005 937 2873 646 1358 1806 785 1810 1091 1563 3178 1341 173 927 881 1471 191 1066 1976 1237 2082 4096 4171 1274 4240 11922 2266 2686 912 3025 1228 832 1617
CONJUNTO 7: Dura¸c˜ao das lˆampadas - Companhia B.
3832 743 1616 4002 5606 722 4203 2069 3790 1819 613 310 4449 2711 2398 2445 3767 5290 1963 2085 586 972 1503 4046 2426 3705 204 1308 11848 1315 2518 626 3036 1811 4060 1392 3684 5810 2323 2221 622 3595 1745 1825 1215 2556 3653 1567 3006 1964
CONJUNTO 8: Ganho de Peso (kg) - Ra¸c˜ao A.
26 30 65 43 27 28 31 28 30 33 60 34 26 32 34 35 29 27 29 34 27 31 66 44 28 29 32 29 31 34 61 35 27 33 35 36 30 28 30 35
CONJUNTO 8: Ganho de Peso (kg) - Ra¸c˜ao B.
26 4 35 38 43 43 41 36 9 40 37 42 34 42 39 39 35 35 41 40 25 3 34 37 42 42 40 35 8 39 36 41 33 41 38 38 34 34 40 39
A redu¸c˜ao dos dados provenientes da observa¸c˜ao de uma vari´avel quantitativa por meio do ramo- e-folhas ou tabelas de frequˆencias pode fornecer mais informa¸c˜oes sobre o comportamento desta vari´avel do que a pr´opria s´erie original de dados. Nesta se¸c˜ao, apresentaremos alguns valores, as medidas de tendˆencia central, ou medidas de posi¸c˜ao, que s˜ao representativos da s´erie toda. As medidas de posi¸c˜ao s˜ao quantidades que d˜ao uma id´eia da localiza¸c˜ao do conjunto de valores.
Moda Representada por M o, a moda ´e definida como a realiza¸c˜ao mais freq¨uente de um conjunto de dados. Por exemplo,
Quando um conjunto apresenta mais de 2 modas, dizemos que ele ´e multimodal.
Mediana
Representada por M d, a mediana ´e definida como sendo a realiza¸c˜ao que ocupa a posi¸c˜ao central de uma s´erie de observa¸c˜oes quando estas est˜ao ordenadas segundo suas grandezas (ordem crescente ou decrescente). A mediana deixa 50% da distribui¸c˜ao abaixo dela e 50% acima. Por exemplo,
De um modo geral, se o n´umero n de observa¸c˜oes no conjunto ´e ´ımpar, ent˜ao a mediana ´e o valor que ocupa a posi¸c˜ao (n + 1)/2; se n ´e par, ent˜ao a mediana ´e o ponto m´edio entre os valores que ocupam as posi¸c˜oes n/2 e (n/2) + 1. Lembre-se que ´e necess´ario ordenar o conjunto para identificar a posi¸c˜ao da mediana.
M´edia Aritm´etica
Representada por M e ou por ¯x, a m´edia aritm´etica ´e definida como sendo a soma de todas as observa¸c˜oes dividida pelo n´umero delas. Por exemplo, a m´edia aritm´etica do conjunto A acima ´e:
M e = 1 + 2 + 2 + 2 + 3 + 4 + 5 7 = 19/7 = 2, 714