









Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Resumo P2 de probabilidade e estatística completo
Tipologia: Esquemas
1 / 16
Esta página não é visível na pré-visualização
Não perca as partes importantes!
A Estatística é apresentada como um conjunto de técnicas para organizar, descrever, analisar e interpretar dados de forma sistemática, aplicável a qualquer área do conhecimento. Ela é dividida em três grandes áreas:
● Estatística Descritiva: Etapa inicial de qualquer análise, focada na organização, resumo e descrição dos dados para que se possa conhecer suas principais características.
● Probabilidade: Ferramenta que auxilia na modelagem de fenômenos aleatórios, ou seja, aqueles em que o resultado há incerteza.
● Inferência Estatística: Método que permite tirar conclusões sobre uma população inteira com base nas informações obtidas a partir de uma amostra.
● População: O conjunto completo de todos os elementos ou indivíduos que se deseja estudar.
● Amostra: Um subconjunto da população que é selecionado para análise.
O processo de amostragem é necessário por questões de viabilidade, custo e tempo, permitindo que, através da análise descritiva da amostra e da
inferência estatística, se tirem conclusões sobre a população.
Amostragem é o processo de selecionar uma amostra representativa de uma população.
As técnicas são divididas em probabilísticas (onde cada elemento tem uma chance conhecida de ser selecionado) e não-probabilísticas.
Das probabilísticas:
● Amostragem Aleatória Simples ● Amostragem Aleatória Estratificada (Proporcional ou Igualitária) ● Amostragem Aleatória por Conglomerados ● Amostragem Aleatória Sistemática
Das não-probabilísticas:
● Amostragem por Conveniência
Amostragem Aleatória Simples
Cada elemento da população tem a mesma probabilidade de ser escolhido.
Passo a passo:
reposição) que corresponderão à amostra.
usada para este fim. Mas ela gera uma amostra sem reposição. Para gerar
uma amostra com reposição tem que
Amostragem Aleatória Estratificada
Usada quando a população é heterogênea. A população é dividida em subgrupos homogêneos chamados estratos.
● Proporcional: A quantidade de indivíduos de cada estrato na amostra é proporcional ao tamanho do estrato na população.
● Igualitária: O mesmo número de indivíduos é selecionado de cada estrato, independentemente do seu tamanho.
Passo a passo:
Amostragem Aleatória Estratificada ( etapas)
Passo a passo:
Amostragem Aleatória por Conglomerados
A população é dividida em múltiplos grupos (conglomerados), como bairros ou escolas.
Passo a passo:
Amostragem Aleatória por Conglomerados (2 etapas)
Passo a passo:
Conglomerados x Estratificada
Conglomerados: homogêneos entre si e heterogêneos internamente (Um conglomerado é uma espécie de mini-população).
● Quantitativas: Assumem valores numéricos.
○ Discreta: Assume valores inteiros e contáveis (ex: Número de filhos).
○ Contínua: Pode assumir qualquer valor dentro de um intervalo real (ex: Salário, Idade).
*Ao analisar uma variável tem que se atentar à informação trazida e não ao valor propriamente dito.
Tabelas de Frequência
Organizam os dados exibindo a frequência absoluta e relativa em cada em cada categoria ou classe.
vezes que um valor aparece.
de vezes que um valor aparece,
acumulada das frequências relativas.
Tabelas de Frequência com divisão de classes
Os dados são agrupados em intervalos numéricos, sendo útil para estudar variáveis quantitativas contínuas (pois os valores não se repetem, assim evita que fique um monte de valor com frequência absoluta 1 na tabela de frequência normal).
cria um sequência que começa da menor idade até a maior idade, com
Aqui, o segundo argumento da função
desejados, de modo que a amplitude é calculada automaticamente.
Gráfico de Dispersão
Usado para visualizar a relação entre duas variáveis quantitativas, plotando os pontos em um plano cartesiano.
A interpretação foca no comportamento de uma variável em relação à outra.
Gráfico de Setores (Pizza)
Divide um círculo em fatias para mostrar a proporção de cada categoria.
É desaconselhado, pois pode ser difícil comparar as proporções visualmente, sendo o gráfico de barras uma alternativa recomendada.
Gráfico de Barras
Representa as frequências ou porcentagens de categorias de uma variável no eixo y, e os valores do eixo x.
O interesse é na altura da barra referente a cada categoria.
Histograma
Similar ao gráfico de barras, é usado para representar a distribuição de uma tabela de frequência agrupada em classes (ou seja, bom para uma variável quantitativa contínua).
O interesse é na concentração dos valores para a variável analisada.
A média ponderada é dada por:
𝑛 ∑ 𝑤𝑖·𝑥𝑖
𝑖=
𝑛 ∑ 𝑤𝑖
𝑤 1 ·𝑥 1 +𝑤 2 ·𝑥 2 +...+𝑤𝑛·𝑥𝑛 𝑤 1 +𝑤 2 +...+𝑤𝑛
Moda
O valor que ocorre com maior frequência no conjunto de dados (mais se repete).
*Um conjunto de dados pode ter mais de uma moda.
Mediana
O valor central de um conjunto de dados ordenado, que divide as observações em duas metades iguais (50% abaixo, 50% acima).
Não é sensível aoutliers.
( 2 )
2
*Quando a média é próxima da mediana, isso significa que a amostra não apresenta possíveis outliers.
Usadas quando as medidas de posição não são suficientes para descrever o comportamento dos dados, usa-se as medidas de dispersão (Amplitude, Desvio médio absoluto, Variância, Desvio Padrão e Coeficiente de Variação).
Indicam o grau de variabilidade ou espalhamento dos dados em torno do centro.
Amplitude
A diferença/distância entre o valor máximo e o valor mínimo dos dados
Desvio médio absoluto
Tem como objetivo verificar o quanto os valores em média estão se distanciando da média.
𝑛 ∑ |𝑥𝑖−𝑥| 𝑛
*É sempre um valor positivo
Variância
Mede a dispersão dos dados em relação à média. É calculada como a média dos quadrados dos desvios:
2
𝑛 ∑ (^) (𝑥 (^) 𝑖−𝑥)
2
𝑛
*É parecido com o desvio médio absoluto (também é sempre positivo), mas penaliza grandes desvios e não dá um valor na mesma unidade dos dados.
*A variância não tem interpretação direta, podendo ser utilizada como comparação.
Desvio Padrão
É a raiz quadrada da variância:
2
Ele mede o quanto os valores em média estão se distanciando da média.
*Diferentemente da variância, o desvio padrão possui interpretação prática, pois ele volta o valor para a unidade de medida dos dados.
*se o desvio padrão é pequeno em relação à amplitude total, a maioria dos dados está perto da média. Se o desvio padrão é grande em relação à amplitude, os dados estão mais espalhados.
Coeficiente de Variação
Medida de dispersão relativa, calculada como a razão entre o desvio padrão e a média:
*Em geral se multiplica por 100 pra ter o valor em percentual
*É útil para comparar a variabilidade de conjuntos de dados com diferentes escalas ou médias. Quanto menor o CV, mais homogêneos são os dados.
*Só pode calcular o CV quando a média amostral é diferente de 0.
Quartis
observações estão abaixo dele.
observações estão abaixo dele.
Escores Padronizados
São usados para comparar valores de diferentes distribuições, colocando-os em uma escala comum
𝑥𝑖−𝑥 σ𝑥
O resultado indica quantos desvios-padrão uma observação está da média.
*Um conjunto de escores padronizados tem sempre média 0 e variância 1.
Teorema de Chebyshev
O teorema estabelece um limite inferior para a quantidade de dados que deve estar a uma certa distância da média.
Essa distância é medida em número de desvios-padrão (z). A grande vantagem do teorema é que ele é válido para qualquer conjunto de dados, não importando se a distribuição é simétrica, assimétrica ou de qualquer outra forma
Para qualquer distribuição de dados,
2
A teoria da probabilidade surgiu a partir do estudo de jogos de azar no século XVII, com contribuições notáveis de Pierre de Fermat e Blaise Pascal, que buscaram resolver o "Problema dos Pontos".
Embora suas origens estejam nos jogos, a probabilidade é uma ferramenta fundamental para modelar e quantificar a incerteza em diversos campos do conhecimento.
Existem diferentes maneiras de interpretar o que a probabilidade de um evento significa:
● Clássica: A probabilidade é uma fração. A razão entre o número de resultados favoráveis e o número total de resultados possíveis, assumindo que todos os resultados são igualmente prováveis.
● Frequentista: A probabilidade de um evento é a frequência observada que ele ocorre em um grande número de repetições do experimento.
● Lógica: A probabilidade como a relação entre proposições.
● Subjetivista (Bayesiana): Não existe. A probabilidade representa o grau de crença de um indivíduo sobre a ocorrência de um evento, que pode ser atualizado com novas evidências.
● Experimento Aleatório: Um processo que pode ser repetido e cujo resultado é incerto.
Ex: lançamento de um dado ou a retirada de uma carta de um baralho.
todos os resultados possíveis de um experimento aleatório.
Ex: no lançamento de um dado, o espaço amostral é
● Evento: Qualquer subconjunto do
evento.
Ex: o evento "obter um número par" no lançamento de um dado é
Como os eventos são conjuntos, a teoria de conjuntos pode ser aplicada aos eventos.
ou o evento B (ou ambos) ocorrerem.
evento A e o B ocorrerem.
𝐶 ( ) evento A não ocorrer.
● União Generalizada : Ocorre se 𝑖=
𝑛 ( ⋃ 𝐴𝑖) pelo menos um dos eventos (^) (𝐴 1 , ..., 𝐴𝑛) ocorrer
● Interseção Generalizada : Ocorre 𝑖=
𝑛
se todos os eventos (^) (𝐴 1 , ..., 𝐴𝑛) ocorrerem
● Eventos Mutuamente Excludentes: Dois eventos que não podem ocorrer
juntos, ou seja, sua interseção é o
A noção primitiva de probabilidade leva em conta que todos os elementos do espaço amostral são equiprováveis e a probabilidade de um evento A ocorrer é:
A probabilidade é uma função que atribui a cada evento um número entre
A função probabilidade deve satisfazer os seguintes axiomas:
A partir desses axiomas, derivam-se propriedades importantes:
● A probabilidade de um evento impossível (representado pelo conjunto vazio, ∅) é sempre zero:
● A probabilidade de um evento não
𝐶
é igual a 1 (100%) menos a probabilidade de ele ocorrer:
𝐶 ( ) = 1 − 𝑃(𝐴)
● Se o evento A é um subconjunto do evento B (ou seja, toda vez que A acontece, B também acontece), então
a probabilidade de A nunca pode ser
● A probabilidade de qualquer evento (P(A)) é sempre um valor entre 0 e 1 (ou 0% e 100%). Não existem probabilidades negativas ou maiores
● A probabilidade de A acontecer E B não acontecer é igual à probabilidade total de A, subtraindo a parte de A que também é B (a interseção). Basicamente, é a probabilidade de acontecer "apenas
𝐶
● Regra da soma para eventos gerais (o Princípio da Inclusão-Exclusão): A probabilidade de A OU B ocorrer é a soma das suas probabilidades, menos a probabilidade da interseção. Subtraímos a interseção para não contá-la duas vezes:
A probabilidade de um evento A ocorrer, dado que um evento B já ocorreu, é chamada de probabilidade condicional.
𝑃(𝐴∣𝐵) = 𝑃(𝐴∩𝐵)𝑃(𝐵)
● Regra da Multiplicação: A partir da probabilidade condicional, podemos calcular a probabilidade da interseção de dois eventos:
● Diagrama da árvore: Ferramenta visual usada para organizar e calcular as probabilidades de
𝑥𝑖∈Ω𝑋
Propriedades:
𝐸 𝑋[ 1 + 𝑋 2 +... + 𝑋𝑛] = 𝐸 𝑋[ 1 ] +... + 𝐸 𝑋[ (^) 𝑛]
● Variância de Variáveis Aleatórias
valores da variável aleatória em
2 [ ] 𝑉𝑎𝑟(𝑥) = 𝐸 𝑋 [ 2 ] − (𝐸 𝑋 [ ])^2
2 [ ] =^ 𝑥𝑖∈Ω𝑋
2
Propriedades:
● Desvio padrão de uma variável
padrão de uma variável aleatória
● Coeficiente de variação de uma
Alguns padrões de probabilidade ocorrem com frequência, dando origem a distribuições de probabilidade bem conhecidas.
Distribuições Discretas
● Distribuição de Bernoulli: Modela um único experimento com apenas dois resultados possíveis, sendo possível criar uma variável aleatória que associe cada resultado a 1 e 0 (sucesso/fracasso).
Função de probabilidade p/ Bernoulli:
𝑥
1−𝑥
Valor esperado p/ Bernoulli:
Variância p/ Bernoulli: 𝑉𝑎𝑟(𝑥) = 𝐸 𝑋 [ 2 ] − (𝐸 𝑋 [ ])^2
2
2
● Distribuição Binomial: Modela o número de sucessos em uma sequência de n ensaios de Bernoulli independentes, onde a probabilidade de sucessop é constante.
Função de probabilidade p/ Dist. Binomial:
𝑛 ( )𝑝
𝑥
𝑛−𝑥
Valor esperado p/ Dist. Binomial:
Variância p/ Dist. Binomial:
● Distribuição de Poisson: Modela o número de ocorrências de um evento em um intervalo de tempo ou espaço, quando a taxa média de ocorrência é conhecida.
Função de probabilidade p/ Dist. Poisson:
−λ· λ𝑥
Valor esperado e variância p/ Dist. Poisson: :
Variáveis Aleatórias Contínuas
Assumem qualquer valor em um intervalo de números reais (não sendo possível atribuir probabilidades para um ponto específico, apenas para intervalos da reta), como alturas, intervalos de tempos, pesos, profundidades.
A variável X é contínua se:
−∞
+∞
● Função Densidade de Probabilidade (FDP): A probabilidade de a variável assumir um valor em um determinado intervalo é dada pela área sob a curva da FDP nesse intervalo. A probabilidade de uma variável contínua assumir um valor específico é zero.
𝑎
𝑏
● Função de Distribuição Acumulada (FDA): É calculada através da integral da FDP.
−∞
𝑦
● Valor Esperado (Esperança) de
−∞
+∞
● Variância de Variáveis Aleatórias
2 [ ] −^ (𝐸 𝑋^ [^ ])
2
2 [ ] =^ −∞
+∞
2
Uma variável aleatória Z tem uma distribuição Normal Padrão quando sua
A função de densidade de probabilidade é dada por:
− 𝑧
2
Propriedades:
● A curva é simétrica em torno da média, que é 0. ● A probabilidade de um evento, como
a curva. ● A integral da fdp
−∞
𝑧 0
− 𝑧
2 2
resolvida analiticamente, tornando necessário o uso de tabelas de probabilidade (ou software) para encontrar esses valores.
Uma variável aleatória X segue uma distribuição Normal geral quando
A função de densidade de probabilidade é dada por:
2πσ^2
− (𝑥−μ^ )
2
Esse método incorpora a variabilidade do estimador e é construído com base na sua distribuição amostral.
● Caso 1 - Intervalo de Confiança para a Média com Variância Conhecida: Este caso se aplica quando o objetivo é construir um intervalo de confiança para a média populacional
2
um valor conhecido.
2
σ 𝑛
2
σ 𝑛
2
σ 𝑛
● Caso 2 - Intervalo de Confiança para a Proporção: Este caso é utilizado quando se deseja estimar uma
2
𝑝(1−𝑝)
𝑝(1−𝑝) 𝑛
Ambos são usados para contar as maneiras de escolher um grupo de p elementos a partir de um conjunto maior de n elementos.
Arranjos (ordem importa)
A ordem em que os elementos são escolhidos cria um resultado diferente.
𝐴 𝑛,𝑝
=
Combinações (ordem NÃO importa)
A ordem em que os elementos são escolhidos NÃO cria um resultado diferente.
𝐶 𝑛,𝑝
=