Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Análise de Dados e Modelagem Estatística: Métodos e Aplicações, Trabalhos de Estatística Aplicada

Estatística descritiva aplicada a engenharia florestal

Tipologia: Trabalhos

2021

Compartilhado em 23/06/2021

eng.maria
eng.maria 🇧🇷

1 documento

1 / 208

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
1
1. NOÇÕES DE ESTATÍSTICA DESCRITIVA
Mesmo em se tratando de um trabalho com finalidade de auxiliar os estudantes nas técnicas
de Estatística Experimental, torna-se necessário que certos conceitos básicos de Estatística
Descritiva fiquem bem posicionados, pois eles são, de certa forma, fundamentais na área de
Estatística Experimental, Inventário Florestal e Manejo Florestais.
A Estatística, sendo uma parte da Matemática Aplicada encarregada em fazer interferências
a partir de dados observados, ajuda diretamente os processos empregados em Inventário
Florestal, porque neste ramo da Ciência Florestal, também chegamos a conclusões a partir
de dados observados em campo.
Esses dados sobre os quais tiram-se conclusões, procedem de dois modos: enumeração e
mensuração. MEYER (1976).
a) ENUMERAÇÃO.
Este se caso limita a coletar dados dos atributos estudados, na base da ausência ou
presença. Por exemplo: se fizéssemos um levantamento de plantas de Pinus spp portadores
de fox tail (rabo de raposa), simplesmente enumeraria-se o número de plantas com esse tal
defeito nas unidades amostrais.
b) MENSURAÇÃO
Nesta segunda parte, diretamente ligada à mensuração florestal, pelo fato de que as
observações referem a intensidades de uma grandeza contínua. Por exemplo: altura,
volume, DAP, fator de forma, etc.
Vale a pena salientar que em qualquer dos dois casos, a coleta de dados deve ser a mais
compreensível e rigorosa possível, pois uma coleta malfeita de um ou mais dados, pode
modificar completamente as conclusões de um levantamento, acarretando sempre
desvantagens para o técnico responsável por tal levantamento.
Dois conceitos básicos da Estatística Descritiva também devem ser comentados: população
e amostra.
Em termos de conceituação, população é um conjunto de indivíduos de mesma natureza,
mas que diferem quanto ao atributo, isto é, pode-se ter uma população de arvores, mas
dentro desta população os indivíduos diferem em suas características. Por exemplo, altura,
volume, etc. MEMÓRIA (1973).
Em termos de amostragem, pode-se concluir que população ou universo é o conjunto global
dentro do qual lança-se um conjunto parcial (unidades amostrais ou parcelas), onde os
dados são coletados para se chegar a conclusões globais. Como exemplo, poder-se-ia
considerar um povoamento volumétrico. Assim sendo, a população seria os 3.000ha de
Eucalyptus spp. e a amostra seria composta por exemplo, de 20 unidades amostrais de 0,5
ha cada, nas quais coletar-se iam os dados necessários, calcular-se ia qual o número mínimo
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Pré-visualização parcial do texto

Baixe Análise de Dados e Modelagem Estatística: Métodos e Aplicações e outras Trabalhos em PDF para Estatística Aplicada, somente na Docsity!

1. NOÇÕES DE ESTATÍSTICA DESCRITIVA

Mesmo em se tratando de um trabalho com finalidade de auxiliar os estudantes nas técnicas

de Estatística Experimental, torna-se necessário que certos conceitos básicos de Estatística

Descritiva fiquem bem posicionados, pois eles são, de certa forma, fundamentais na área de

Estatística Experimental, Inventário Florestal e Manejo Florestais.

A Estatística, sendo uma parte da Matemática Aplicada encarregada em fazer interferências

a partir de dados observados, ajuda diretamente os processos empregados em Inventário

Florestal, porque neste ramo da Ciência Florestal, também chegamos a conclusões a partir

de dados observados em campo.

Esses dados sobre os quais tiram-se conclusões, procedem de dois modos: enumeração e

mensuração. MEYER (1976).

a) ENUMERAÇÃO.

Este se caso limita a coletar dados dos atributos estudados, na base da ausência ou

presença. Por exemplo: se fizéssemos um levantamento de plantas de Pinus spp portadores

de fox tail (rabo de raposa), simplesmente enumeraria-se o número de plantas com esse tal

defeito nas unidades amostrais.

b) MENSURAÇÃO

Nesta segunda parte, diretamente ligada à mensuração florestal, pelo fato de que as

observações referem a intensidades de uma grandeza contínua. Por exemplo: altura,

volume, DAP, fator de forma, etc.

Vale a pena salientar que em qualquer dos dois casos, a coleta de dados deve ser a mais

compreensível e rigorosa possível, pois uma coleta malfeita de um ou mais dados, pode

modificar completamente as conclusões de um levantamento, acarretando sempre

desvantagens para o técnico responsável por tal levantamento.

Dois conceitos básicos da Estatística Descritiva também devem ser comentados: população

e amostra.

Em termos de conceituação, população é um conjunto de indivíduos de mesma natureza,

mas que diferem quanto ao atributo, isto é, pode-se ter uma população de arvores, mas

dentro desta população os indivíduos diferem em suas características. Por exemplo, altura,

volume, etc. MEMÓRIA (1973).

Em termos de amostragem, pode-se concluir que população ou universo é o conjunto global

dentro do qual lança-se um conjunto parcial (unidades amostrais ou parcelas), onde os

dados são coletados para se chegar a conclusões globais. Como exemplo, poder-se-ia

considerar um povoamento volumétrico. Assim sendo, a população seria os 3.000ha de

Eucalyptus spp. e a amostra seria composta por exemplo, de 20 unidades amostrais de 0,

ha cada, nas quais coletar-se iam os dados necessários, calcular-se ia qual o número mínimo

de unidades amostrais representativo daquele local, para assim chegar-se a conclusões

sobre o volume da população a um determinado nível de probabilidades.

Em termos gerais uma população pode ser considerada finita quando o numero de

elementos da mesma é contável e infinita quando não se pode determinar o número de

elementos que compõem a mesma.

Mas, em termos de amostragem, uma população é considerada finita, quando os números

de unidades amostrais (n) lançado dentro da população é igual ou superior a 5% do número

total de unidades amostrais (n) cabíveis dentro da população.

Ex: Considerada que em 100 ha uma determinada espécie florestal, fossem lançadas mais

de 5 unidades amostrais da 1 ha cada, o numero total de unidades amostrais (N) cabíveis na

população seria 100 e poderia-se ter lançado 8 unidades amostrais (n) dentro da população,

tendo-se, pois, n >5%N, e se fossem lançadas a população seria finita.

Já na população infinita o valor de n é inferior a 5% de N. Mesmo sendo um exemplo muito

hipotético, poder-se-ia considerar cada árvore como uma unidade amostral na região

amazônica, o que seria praticamente impossível calcular o N, ou no caso anterior fazer uma

amostra de tamanho 4 (n<5%N).

Sabe-se que as características de uma população são expressas através de certos valores,

denominados de “parâmetros”.Como na prática, por motivos de tempo, custos, etc, se torna

inviável medir característica desejada em todos os indivíduos componentes da população,

no caso unidades amostrais, o que se faz é estimar tal característica em um certo número de

amostras, sendo que as medidas que estimam tal característica são denominadas de

“estatísticas”, que tanto podem ser medidas de posição ou de variação.Os parâmetros são

representados por símbolos do alfabeto grego, enquanto que as estatísticas são

representadas por símbolos do alfabeto latino. MEMÓRIA (1973).

Os valores que forem coletados nas amostras sendo de população, são considerados como

variáveis que podem ser “discretas” e “contínuas”.

Uma variável é considerada discreta quando esta sempre é um número real absoluto. Ex:

número de cones numa árvore de pinus, número de árvores numa parcela ou população, etc.

Já a variável contínua pode assumir valores decimais. Ex: altura de uma árvore, DAP,

volume, etc.

Todos estes valores (dados) que foram coletados numa população ou amostra podem ser

representados de três formas: tabelas, gráficos e forma aritmética (medidas de posição e

dispersão) SPIEDEL (1968).

As duas primeiras maneiras, apesar de suas importâncias, deixarão de ser consideradas no

presente trabalho, pelo fato de em mensuração florestal, se trabalhar mais com medidas de

dispersão, muito embora gráficos e tabelas ajudarem na representação dos dados.

a) A variável em estudo é discreta ou contínua, e o número de dados

observados (n) é ímpar. Neste caso a mediana será o valor da variável que

ocupe a posição n + 1/2.

Ex: Altura média (m) de árvores em 9 amostras de 10 árvores cada.

AMOSTRA

Alt. Média (m) (h)

Neste caso torna-se importante o agrupamento dos dados na ordem crescente.

h (m)

Então, a mediana será o valor colocado na ordem 9+1=10=5, isto é, 18,5m.

b) A variável em estudo é discreta ou continua e o número de dados (n) é par.

Neste caso a mediana será o valor compreendido entre os valores que

ocupam as posições n/2 e n + 2.

Ex: Adicionar ao caso 1, mais uma observação.

h (m)

Assim sendo, tem-se:

n

= 5 e

n  2

Será, pois, a mediana (hm), o valor médio das observações 5 e 6.

hm =

= 18,75m

c) Os valores dos dados estão agrupados por freqüência, podendo o número de

observações (n) ser par ou ímpar (casos a e b).

Ex: Considerar o mesmo exemplo com as freqüências que se seguem:

h (m)

F (^) f `

TOTAL 24 137

Neste caso como n é par, ter-se-á que encontrar os valores

n

e

n  2

Então:

n

= 12 e

A mediana será o valor médio das observações 12 e 13. Como até 17,1 temos 8

observações e até 18,5 temos 14, as observações 12 e 13 estão contidas na h = 18,5 que será

a mediana.

  1. MÉDIA ARITMÉTICA: A média aritmética é igual a soma de todos os dados

coletados, dividida pelo número total de dados coletados.

É representada por x.

Ex: Os dados abaixo referem-se a diâmetros (DAP) de 10 árvores coletadas ao acaso num

povoamento de Eucalyptus spp.

DAP (cm)

X =

n

x i

n

i

 1

=

= 23,9 cm

Muito comum também são os casos em que os dados se repetem, isto é, são agrupados por

freqüências.

Nestes, o cálculo de X é feito da seguinte maneira:

Variável (x (^) i _) Freqüência (f (^) i ) f (^) i x (^) i

X 1
X 2

Xn

f (^1)

f (^2)

f (^) n

f 1 x (^1)

f 2 x 2

fn xn

TOTAIS

n

i 1

fi = n

n

i 1

fi xi

Onde,

X =

n

i

n

i

f i

fi xi

1

1

Ex: Supor que no exemplo anterior os dados se repetissem da seguinte maneira:

xi fi Fi * xi

TOTAIS 59 1395

Então,

X =

= 23,6 cm.

Podem ocorrer casos em que além de agrupados em freqüência, os dados podem estar

agrupados em classes.

Ex: Os dados abaixo se referem à mensuração de DAP (cm), agrupados em classes de

amplitude de 3 cm.

Classes F Xc d F*d

TOTAIS 49 2
  1. A soma dos quadrados dos desvios em relação a média da amostra é mínima. Então

a melhor estimativa de tal média proveniente de uma amostra de população, é a

própria média de amostra, pois sendo esta adotada como melhor estimativa do valor

real, o número representativo desta é que torna a soma de quadrados dos desvios

mínimo.PIMENTEL GOMES (1970).

Então,

n

i 1

( Xi - X )

2 = mínima

n

i 1

Xi

2

  • 2 X

n

i 1

Xi + n X

2

n

i 1

Xi

2

  • 2 *

n

Xi

n

i

 1

n

i 1

Xi + n *

n

Xi

in

i

 1

n

i 1

Xi

2

  • 2 *

n

Xi

in

i

 1

n

Xi

in

i

 1

n

i 1

Xi

2

n

Xi

in

i

 1

Isto quer dizer que se for calculada a soma dos quadrados dos desvios das variáveis em

relação a outro valor qualquer diferente da média da distribuição, o resultado final será

sempre um valor superior ao encontrado em relação à média.

Pode-se também, provar tal afirmação se forem considerados os desvios em relação a um

valor qualquer (a).

n

i 1

(Xi – a)

2 = Z

a

z

n

i 1

(Xi – a) ( -1 ) = 0

n

i 1

(Xi – a) = 0

n

i 1

(Xi – a) =

n

i 1

(Xi – a) = 0

n

i 1

Xi – na = 0

na =

n

i 1

Xi

a =

n

Xi

in

i

 1

a = X

Provando, pois, que o número que torna a soma de quadrados dos desvios mínimo, será

sempre a média.

4) OUTRAS MEDIDAS DE POSIÇÃO

Mesmo sendo a média aritmética a medida de posição mais comum e mais usada, nem

sempre a mesma satisfaz a representação dos dados. Em alguns casos ela pode ser

substituída pelas médias geométrica e harmônica.

a) MÉDIA GEOMÉTRICA

A média geométrica de n itens é MG =

n X *X 2 ...Xn 1

, sendo que quando

há apenas dois itens X 1 e X 2 , a média geométrica é a raiz quadrada do seu produto, MG

1 2

X X

. Ela pode ser calculada achando-se o anti-logaritmo da média aritmética dos

logaritmos dos valores, log MG =

n

j

i 1

log Xi , não podendo, portanto, ser determinada

quando há valores nulos ou negativos(29).

Este tipo de média é mais apropriado quando se deseja promediar quantidades que seguem

uma progressão geométrica ou lei exponencial.

Na parte de mensuração florestal esta média é utilizada em estudos de tabelas volumétricas,

precisamente na parte de comparação de modelos volumétricos de naturezas distintas,

através do Índice de Furnival. LOETCH HALLER (1964).

Pode também ser utilizada em levantamentos populacionais da fauna, principalmente, entre

dois levantamentos, quando se deseja conhecer a população intermediária, pois a média

geométrica é uma melhor estimativa que a média aritmética pelo fato da população não

aumentar anualmente na mesma quantidade.

b) MÉDIA HARMÔNICA

A média harmônica (MH) de uma série de dados é o recíproco da média aritmética dos

recíprocos (inversos) desses valores.

Se por exemplo, no caso anterior, onde os dois povoamentos produzirem uma média de 120

m

3 /ha no mesmo período de rotação e se a esta medida de posição estivesse associada à

amplitude, pelo menos já se teria uma idéia da variação ocorrida nos dois povoamentos, o

que daria uma maior oportunidade de conhecer a heterogeneidade dos povoamentos.

Entretanto, a amplitude não é uma medida satisfatória de variação, pelas seguintes razões:

a

  • No seu cálculo considera-se apenas os dois valores extremos, sem considerar a

variação dos valores intermediários.

a

  • Seu valor tende a crescer com o aumento de observações, viciando a comparação das

variações de dois grupos de diferentes tamanhos.

Mas, devido à facilidade de cálculos, o emprego da amplitude pode ser razoável para um

pequeno número de observações.

b) VARIÂNCIA

A variância S

2 é definida como sendo a média dos quadrados dos desvios, e não a média

dos desvios, pois se sabe que a soma dos desvios é igual a zero. Então elevando-se os

valores dos desvios ao quadrado pode-se calcular a variância, que é expressa por:

S

2

 

2

1

N
X X

n

i

 i

Como na prática, a média verdadeira não é conhecida, mas sim estimada pela estatística X ,

há necessidade de se substituir o N na fórmula por N – 1 tendo-se, pois o princípio de grau

de liberdade, tornando a fórmula em:

S

2

 

2

1

N
X X

n

i

i

O princípio do grau de liberdade, baseia-se no fato de que não se conhecendo a média

verdadeira  , e fazendo-se cálculo de S

2 a partir de uma estimativa X , equivale

exatamente à perda de uma observação. RAY (1978).

Outra maneira de tentar explicar o principio do grau de liberdade é a seguinte: supondo-se

que se vá sortear casualmente, sem reposição, 10 unidades amostrais em uma determinada

área. No primeiro sorteio, a chance de qualquer unidade amostral ser sorteada é a mesma,

pois tem-se 10 opções de escolha. Depois de sorteada a primeira, no segundo sorteio passa-

se a ter 9 opções e assim sucessivamente. Quando só restarem duas parcelas e uma delas for

sorteada, na última já não se tem mais opção de escolha, sendo, pois o número de opções

igual a 9, isto é, N – 1.

Outra maneira de conceituar graus de liberdade é a seguinte; considerando-se um grupo “n”

de observações e fixando-se uma média para este grupo, existe a liberdade de escolher os

valores numéricos de n observações; o valor da última observação estará fixado, atendendo

ao requisito de ser a soma dos desvios da média igual a zero. SILVA (?).

Assim sendo, a fórmula de aplicação da variância é expressa da seguinte maneira:

S

2

 

2

1

1

2

2

1

 

N
N
X
X
N
X X

n

i

i n

i

i

n

i

i

Ex: Supondo-se que nos dois povoamentos anteriores, onde as produções médias foram 120

m

3 /ha no período de rotação, obteve-se os seguintes dados em cinco unidades amostrais

para cada povoamento, sendo que cada unidade amostral ou parcela, possuía a área de 1

hectare.

N

o da Parcela m

3 /ha no período de rotação

Povoamento I Povoamento II

TOTAL 600 600
X

As variâncias dos povoamentos I e II seriam:

S

2

1

2

2 2 2

   

S

2

2

2

2 2 2

   

O que prova que o povoamento I é muito mais homogêneo em termos de produção que o

povoamento II.

Outra maneira que também pode ocorrer para cálculo de variância é quando o número de

dados vem agrupado por freqüência, isto é, um ou mais dados podem ocorrer uma ou mais

vezes.

S =

2

1

1

1

1

2

1

n

i

n

i

n

i

i n

i

f

f

f X

f X

Nos dois exemplos de variância obter-se-iam os seguintes desvios:

Ex 1= S 1 = 200 = 14,14 m

3 /ha

S 2 = 2350 = 48,47 m

3 /ha

Ex 2 = = 828 , 65 = 28,78 m

3 /ha.

Como em mensuração florestal é muito comum o dado, além de serem agrupados por

freqüência, ainda são agrupados por classes diamétricas ou de alturas, convém demonstrar

como se calcula o desvio padrão (S) para este caso.

S = a * Sc

Onde: S = desvio padrão

a = amplitude de classe

Sc = desvio padrão codificado

Ex: Os dados que seguem, referem-se a medidas de alturas de árvores, em classes de 2 m.

Classes f d fd fd

2

TOTAL 136 6 402

O desvio padrão codificado é dado por:

Sc =

n

i

n

i

n

i

n

i

f

f

f d

f d

1

1

1

1 2

Então:

Sc =

2

= 1,72 m.

Onde:

S = a * Sc = 2*1,72 = 3,44 m.

Para o cálculo de variância de dados agrupados por freqüência e classes, basta elevar o

desvio padrão ao quadrado.

Em casos em que se vão mensurar grandes amostras (n > 30), o desvio padrão é um

indicador dos prováveis limites dentro dos quais se situam certas proporções das

observações.Verifica-se que cerca de 68% das observações do grupo estará entre os limites

de X  S; 95 % das observações entre X  2 S: e 99% das observações entre X  3 S.

- DISTRIBUIÇÃO NORMAL DA VARIÁVEL X
5) ERRO PADRÃO DA MÉDIA

Se por exemplo se coletassem n amostras de j produções de madeira em m

3 /ha ,ter-se-ia

diversas estimativas para a média e com elas poder-se-ia calcular um novo desvio padrão

que seria o erro padrão da média(S X ), que dá uma idéia da precisão de estimativa para a

média obtida ( (^) X ).

Tal erro padrão da média é expresso por:

S X =

n

S

2

n

S

Em dados agrupados por freqüência:

O limite de confiança L.C ou I.C, é de fundamental importância, pois as estimativas

geralmente são expressas através da média, com uma probabilidade associada.Então, o

limite ou intervalo de confiança descreve os limites dentro do qual um parâmetro da

população é esperado ocorrer a um determinado nível de probabilidade. MACIEL (1974).

O limite de confiança é representado por:

Tα X ±tα s X

Onde:

X = média aritmética das observações

t  = valor tabelado a um nível de probabilidades

s X = erro padrão da média.

O princípio do limite de confiança parte da distribuição de t.

P  

  t 1

S X
X

t

Onde  é o nível de probabilidade escolhido, e t um valor tabelado.

Assim, tem-se:

 t

S X
X

t 

-t  SX X -  t SX
  • (^) X - t  SX   X+ t SX

Multiplicando por (-1)

X + t  SX  X- t SX

Então:

P X  t  * SX Xt SX 1  

O que indica que a média verdadeira da população deverá ocorrer no espaço X t *SX
a um nível de probabilidade .

Então, o limite de confiança é representado por:

X t *SX

ou X  t *

N
S

Exemplo: Considerando-se que foram estimadas alturas de 30 árvores e achou-se uma

média aritmética X =18,5 m com um desvio padrão S = 1,6 m. Qual seria o limite de

confiança para a média verdadeira  a nível de 1% de probabilidades?

X = 18,5 m

S = 1,6 m

N = 30

t (1% , 29 G. L) = 2,76.

Então:

17,7m   19 , 3 m

Indicando que  deve estar próximo de X = 18,5 , mas podendo variar de 17,7m a 19,3m

a nível de 1% de probabilidades.

Outros Conceitos Básicos.

Quando se quer lançar resultados de um levantamento florestal, a parte final do trabalho é

feita em termos de limite de confiança, X  t *SX.

Sabe-se que S X =

n

S

2

; mas ,em termos de populações finitas , a relação entre o número

de unidades amostrais lançadas e o número total de amostras cabíveis na população , no

caso a fração de amostragens n/N, deve ser considerada (DRESS, 1959; FURNIVAL,1961;

SILVA,1977).

Assim sendo, o erro de amostragem se deve à parte que não foi incluída no inventário, ou

seja, a fração (^) 

N

n

1 .Medindo-se todas as unidades amostrais, esta fração seria zero,

porque n = N (CAMPOS, 1974).Então este termo 

N

n

1 pode ser considerado como

sendo um fator de correção(f) para populações finitas,sendo no caso n≥5% de N.