




























































































Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Estatística descritiva aplicada a engenharia florestal
Tipologia: Trabalhos
1 / 208
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Mesmo em se tratando de um trabalho com finalidade de auxiliar os estudantes nas técnicas
de Estatística Experimental, torna-se necessário que certos conceitos básicos de Estatística
Descritiva fiquem bem posicionados, pois eles são, de certa forma, fundamentais na área de
Estatística Experimental, Inventário Florestal e Manejo Florestais.
A Estatística, sendo uma parte da Matemática Aplicada encarregada em fazer interferências
a partir de dados observados, ajuda diretamente os processos empregados em Inventário
Florestal, porque neste ramo da Ciência Florestal, também chegamos a conclusões a partir
de dados observados em campo.
Esses dados sobre os quais tiram-se conclusões, procedem de dois modos: enumeração e
mensuração. MEYER (1976).
a) ENUMERAÇÃO.
Este se caso limita a coletar dados dos atributos estudados, na base da ausência ou
presença. Por exemplo: se fizéssemos um levantamento de plantas de Pinus spp portadores
de fox tail (rabo de raposa), simplesmente enumeraria-se o número de plantas com esse tal
defeito nas unidades amostrais.
b) MENSURAÇÃO
Nesta segunda parte, diretamente ligada à mensuração florestal, pelo fato de que as
observações referem a intensidades de uma grandeza contínua. Por exemplo: altura,
volume, DAP, fator de forma, etc.
Vale a pena salientar que em qualquer dos dois casos, a coleta de dados deve ser a mais
compreensível e rigorosa possível, pois uma coleta malfeita de um ou mais dados, pode
modificar completamente as conclusões de um levantamento, acarretando sempre
desvantagens para o técnico responsável por tal levantamento.
Dois conceitos básicos da Estatística Descritiva também devem ser comentados: população
e amostra.
Em termos de conceituação, população é um conjunto de indivíduos de mesma natureza,
mas que diferem quanto ao atributo, isto é, pode-se ter uma população de arvores, mas
dentro desta população os indivíduos diferem em suas características. Por exemplo, altura,
volume, etc. MEMÓRIA (1973).
Em termos de amostragem, pode-se concluir que população ou universo é o conjunto global
dentro do qual lança-se um conjunto parcial (unidades amostrais ou parcelas), onde os
dados são coletados para se chegar a conclusões globais. Como exemplo, poder-se-ia
considerar um povoamento volumétrico. Assim sendo, a população seria os 3.000ha de
Eucalyptus spp. e a amostra seria composta por exemplo, de 20 unidades amostrais de 0,
ha cada, nas quais coletar-se iam os dados necessários, calcular-se ia qual o número mínimo
de unidades amostrais representativo daquele local, para assim chegar-se a conclusões
sobre o volume da população a um determinado nível de probabilidades.
Em termos gerais uma população pode ser considerada finita quando o numero de
elementos da mesma é contável e infinita quando não se pode determinar o número de
elementos que compõem a mesma.
Mas, em termos de amostragem, uma população é considerada finita, quando os números
de unidades amostrais (n) lançado dentro da população é igual ou superior a 5% do número
total de unidades amostrais (n) cabíveis dentro da população.
Ex: Considerada que em 100 ha uma determinada espécie florestal, fossem lançadas mais
de 5 unidades amostrais da 1 ha cada, o numero total de unidades amostrais (N) cabíveis na
população seria 100 e poderia-se ter lançado 8 unidades amostrais (n) dentro da população,
tendo-se, pois, n >5%N, e se fossem lançadas a população seria finita.
Já na população infinita o valor de n é inferior a 5% de N. Mesmo sendo um exemplo muito
hipotético, poder-se-ia considerar cada árvore como uma unidade amostral na região
amazônica, o que seria praticamente impossível calcular o N, ou no caso anterior fazer uma
amostra de tamanho 4 (n<5%N).
Sabe-se que as características de uma população são expressas através de certos valores,
denominados de “parâmetros”.Como na prática, por motivos de tempo, custos, etc, se torna
inviável medir característica desejada em todos os indivíduos componentes da população,
no caso unidades amostrais, o que se faz é estimar tal característica em um certo número de
amostras, sendo que as medidas que estimam tal característica são denominadas de
“estatísticas”, que tanto podem ser medidas de posição ou de variação.Os parâmetros são
representados por símbolos do alfabeto grego, enquanto que as estatísticas são
representadas por símbolos do alfabeto latino. MEMÓRIA (1973).
Os valores que forem coletados nas amostras sendo de população, são considerados como
variáveis que podem ser “discretas” e “contínuas”.
Uma variável é considerada discreta quando esta sempre é um número real absoluto. Ex:
número de cones numa árvore de pinus, número de árvores numa parcela ou população, etc.
Já a variável contínua pode assumir valores decimais. Ex: altura de uma árvore, DAP,
volume, etc.
Todos estes valores (dados) que foram coletados numa população ou amostra podem ser
representados de três formas: tabelas, gráficos e forma aritmética (medidas de posição e
dispersão) SPIEDEL (1968).
As duas primeiras maneiras, apesar de suas importâncias, deixarão de ser consideradas no
presente trabalho, pelo fato de em mensuração florestal, se trabalhar mais com medidas de
dispersão, muito embora gráficos e tabelas ajudarem na representação dos dados.
a) A variável em estudo é discreta ou contínua, e o número de dados
observados (n) é ímpar. Neste caso a mediana será o valor da variável que
ocupe a posição n + 1/2.
Ex: Altura média (m) de árvores em 9 amostras de 10 árvores cada.
Alt. Média (m) (h)
Neste caso torna-se importante o agrupamento dos dados na ordem crescente.
h (m)
Então, a mediana será o valor colocado na ordem 9+1=10=5, isto é, 18,5m.
b) A variável em estudo é discreta ou continua e o número de dados (n) é par.
Neste caso a mediana será o valor compreendido entre os valores que
ocupam as posições n/2 e n + 2.
Ex: Adicionar ao caso 1, mais uma observação.
h (m)
Assim sendo, tem-se:
n
= 5 e
n 2
Será, pois, a mediana (hm), o valor médio das observações 5 e 6.
hm =
= 18,75m
c) Os valores dos dados estão agrupados por freqüência, podendo o número de
observações (n) ser par ou ímpar (casos a e b).
Ex: Considerar o mesmo exemplo com as freqüências que se seguem:
h (m)
F (^) f `
Neste caso como n é par, ter-se-á que encontrar os valores
n
e
n 2
Então:
n
= 12 e
A mediana será o valor médio das observações 12 e 13. Como até 17,1 temos 8
observações e até 18,5 temos 14, as observações 12 e 13 estão contidas na h = 18,5 que será
a mediana.
coletados, dividida pelo número total de dados coletados.
É representada por x.
Ex: Os dados abaixo referem-se a diâmetros (DAP) de 10 árvores coletadas ao acaso num
povoamento de Eucalyptus spp.
DAP (cm)
n
x i
n
i
1
=
= 23,9 cm
Muito comum também são os casos em que os dados se repetem, isto é, são agrupados por
freqüências.
Nestes, o cálculo de X é feito da seguinte maneira:
Variável (x (^) i _) Freqüência (f (^) i ) f (^) i x (^) i
Xn
f (^1)
f (^2)
f (^) n
f 1 x (^1)
f 2 x 2
fn xn
n
i 1
fi = n
n
i 1
fi xi
Onde,
n
i
n
i
f i
fi xi
1
1
Ex: Supor que no exemplo anterior os dados se repetissem da seguinte maneira:
xi fi Fi * xi
Então,
= 23,6 cm.
Podem ocorrer casos em que além de agrupados em freqüência, os dados podem estar
agrupados em classes.
Ex: Os dados abaixo se referem à mensuração de DAP (cm), agrupados em classes de
amplitude de 3 cm.
Classes F Xc d F*d
a melhor estimativa de tal média proveniente de uma amostra de população, é a
própria média de amostra, pois sendo esta adotada como melhor estimativa do valor
real, o número representativo desta é que torna a soma de quadrados dos desvios
mínimo.PIMENTEL GOMES (1970).
Então,
n
i 1
( Xi - X )
2 = mínima
n
i 1
Xi
2
n
i 1
Xi + n X
2
n
i 1
Xi
2
n
Xi
n
i
1
n
i 1
Xi + n *
n
Xi
in
i
1
n
i 1
Xi
2
n
Xi
in
i
1
n
Xi
in
i
1
n
i 1
Xi
2
n
Xi
in
i
1
Isto quer dizer que se for calculada a soma dos quadrados dos desvios das variáveis em
relação a outro valor qualquer diferente da média da distribuição, o resultado final será
sempre um valor superior ao encontrado em relação à média.
Pode-se também, provar tal afirmação se forem considerados os desvios em relação a um
valor qualquer (a).
n
i 1
(Xi – a)
2 = Z
a
z
n
i 1
(Xi – a) ( -1 ) = 0
n
i 1
(Xi – a) = 0
n
i 1
(Xi – a) =
n
i 1
(Xi – a) = 0
n
i 1
Xi – na = 0
na =
n
i 1
Xi
a =
n
Xi
in
i
1
a = X
Provando, pois, que o número que torna a soma de quadrados dos desvios mínimo, será
sempre a média.
Mesmo sendo a média aritmética a medida de posição mais comum e mais usada, nem
sempre a mesma satisfaz a representação dos dados. Em alguns casos ela pode ser
substituída pelas médias geométrica e harmônica.
a) MÉDIA GEOMÉTRICA
A média geométrica de n itens é MG =
n X *X 2 ...Xn 1
, sendo que quando
há apenas dois itens X 1 e X 2 , a média geométrica é a raiz quadrada do seu produto, MG
1 2
. Ela pode ser calculada achando-se o anti-logaritmo da média aritmética dos
logaritmos dos valores, log MG =
n
j
i 1
log Xi , não podendo, portanto, ser determinada
quando há valores nulos ou negativos(29).
Este tipo de média é mais apropriado quando se deseja promediar quantidades que seguem
uma progressão geométrica ou lei exponencial.
Na parte de mensuração florestal esta média é utilizada em estudos de tabelas volumétricas,
precisamente na parte de comparação de modelos volumétricos de naturezas distintas,
através do Índice de Furnival. LOETCH HALLER (1964).
Pode também ser utilizada em levantamentos populacionais da fauna, principalmente, entre
dois levantamentos, quando se deseja conhecer a população intermediária, pois a média
geométrica é uma melhor estimativa que a média aritmética pelo fato da população não
aumentar anualmente na mesma quantidade.
b) MÉDIA HARMÔNICA
A média harmônica (MH) de uma série de dados é o recíproco da média aritmética dos
recíprocos (inversos) desses valores.
Se por exemplo, no caso anterior, onde os dois povoamentos produzirem uma média de 120
m
3 /ha no mesmo período de rotação e se a esta medida de posição estivesse associada à
amplitude, pelo menos já se teria uma idéia da variação ocorrida nos dois povoamentos, o
que daria uma maior oportunidade de conhecer a heterogeneidade dos povoamentos.
Entretanto, a amplitude não é uma medida satisfatória de variação, pelas seguintes razões:
a
variação dos valores intermediários.
a
variações de dois grupos de diferentes tamanhos.
Mas, devido à facilidade de cálculos, o emprego da amplitude pode ser razoável para um
pequeno número de observações.
b) VARIÂNCIA
A variância S
2 é definida como sendo a média dos quadrados dos desvios, e não a média
dos desvios, pois se sabe que a soma dos desvios é igual a zero. Então elevando-se os
valores dos desvios ao quadrado pode-se calcular a variância, que é expressa por:
2
1
n
i
Como na prática, a média verdadeira não é conhecida, mas sim estimada pela estatística X ,
há necessidade de se substituir o N na fórmula por N – 1 tendo-se, pois o princípio de grau
de liberdade, tornando a fórmula em:
2
1
n
i
i
O princípio do grau de liberdade, baseia-se no fato de que não se conhecendo a média
verdadeira , e fazendo-se cálculo de S
2 a partir de uma estimativa X , equivale
exatamente à perda de uma observação. RAY (1978).
Outra maneira de tentar explicar o principio do grau de liberdade é a seguinte: supondo-se
que se vá sortear casualmente, sem reposição, 10 unidades amostrais em uma determinada
área. No primeiro sorteio, a chance de qualquer unidade amostral ser sorteada é a mesma,
pois tem-se 10 opções de escolha. Depois de sorteada a primeira, no segundo sorteio passa-
se a ter 9 opções e assim sucessivamente. Quando só restarem duas parcelas e uma delas for
sorteada, na última já não se tem mais opção de escolha, sendo, pois o número de opções
igual a 9, isto é, N – 1.
Outra maneira de conceituar graus de liberdade é a seguinte; considerando-se um grupo “n”
de observações e fixando-se uma média para este grupo, existe a liberdade de escolher os
valores numéricos de n observações; o valor da última observação estará fixado, atendendo
ao requisito de ser a soma dos desvios da média igual a zero. SILVA (?).
Assim sendo, a fórmula de aplicação da variância é expressa da seguinte maneira:
2
1
1
2
2
1
n
i
i n
i
i
n
i
i
Ex: Supondo-se que nos dois povoamentos anteriores, onde as produções médias foram 120
m
3 /ha no período de rotação, obteve-se os seguintes dados em cinco unidades amostrais
para cada povoamento, sendo que cada unidade amostral ou parcela, possuía a área de 1
hectare.
o da Parcela m
3 /ha no período de rotação
Povoamento I Povoamento II
As variâncias dos povoamentos I e II seriam:
2
1
2
2 2 2
2
2
2
2 2 2
O que prova que o povoamento I é muito mais homogêneo em termos de produção que o
povoamento II.
Outra maneira que também pode ocorrer para cálculo de variância é quando o número de
dados vem agrupado por freqüência, isto é, um ou mais dados podem ocorrer uma ou mais
vezes.
2
1
1
1
1
2
1
n
i
n
i
n
i
i n
i
f
f
f X
f X
Nos dois exemplos de variância obter-se-iam os seguintes desvios:
Ex 1= S 1 = 200 = 14,14 m
3 /ha
S 2 = 2350 = 48,47 m
3 /ha
Ex 2 = = 828 , 65 = 28,78 m
3 /ha.
Como em mensuração florestal é muito comum o dado, além de serem agrupados por
freqüência, ainda são agrupados por classes diamétricas ou de alturas, convém demonstrar
como se calcula o desvio padrão (S) para este caso.
S = a * Sc
Onde: S = desvio padrão
a = amplitude de classe
Sc = desvio padrão codificado
Ex: Os dados que seguem, referem-se a medidas de alturas de árvores, em classes de 2 m.
Classes f d fd fd
2
O desvio padrão codificado é dado por:
Sc =
n
i
n
i
n
i
n
i
f
f
f d
f d
1
1
1
1 2
Então:
Sc =
2
= 1,72 m.
Onde:
S = a * Sc = 2*1,72 = 3,44 m.
Para o cálculo de variância de dados agrupados por freqüência e classes, basta elevar o
desvio padrão ao quadrado.
Em casos em que se vão mensurar grandes amostras (n > 30), o desvio padrão é um
indicador dos prováveis limites dentro dos quais se situam certas proporções das
observações.Verifica-se que cerca de 68% das observações do grupo estará entre os limites
de X S; 95 % das observações entre X 2 S: e 99% das observações entre X 3 S.
Se por exemplo se coletassem n amostras de j produções de madeira em m
3 /ha ,ter-se-ia
diversas estimativas para a média e com elas poder-se-ia calcular um novo desvio padrão
que seria o erro padrão da média(S X ), que dá uma idéia da precisão de estimativa para a
média obtida ( (^) X ).
Tal erro padrão da média é expresso por:
n
2
n
Em dados agrupados por freqüência:
O limite de confiança L.C ou I.C, é de fundamental importância, pois as estimativas
geralmente são expressas através da média, com uma probabilidade associada.Então, o
limite ou intervalo de confiança descreve os limites dentro do qual um parâmetro da
população é esperado ocorrer a um determinado nível de probabilidade. MACIEL (1974).
O limite de confiança é representado por:
Tα X ±tα s X
Onde:
X = média aritmética das observações
s X = erro padrão da média.
O princípio do limite de confiança parte da distribuição de t.
t 1
t
Assim, tem-se:
t
t
Multiplicando por (-1)
Então:
Então, o limite de confiança é representado por:
ou X t *
Exemplo: Considerando-se que foram estimadas alturas de 30 árvores e achou-se uma
média aritmética X =18,5 m com um desvio padrão S = 1,6 m. Qual seria o limite de
confiança para a média verdadeira a nível de 1% de probabilidades?
X = 18,5 m
S = 1,6 m
t (1% , 29 G. L) = 2,76.
Então:
17,7m 19 , 3 m
Indicando que deve estar próximo de X = 18,5 , mas podendo variar de 17,7m a 19,3m
a nível de 1% de probabilidades.
Outros Conceitos Básicos.
Quando se quer lançar resultados de um levantamento florestal, a parte final do trabalho é
Sabe-se que S X =
n
2
; mas ,em termos de populações finitas , a relação entre o número
de unidades amostrais lançadas e o número total de amostras cabíveis na população , no
caso a fração de amostragens n/N, deve ser considerada (DRESS, 1959; FURNIVAL,1961;
Assim sendo, o erro de amostragem se deve à parte que não foi incluída no inventário, ou
seja, a fração (^)
n
1 .Medindo-se todas as unidades amostrais, esta fração seria zero,
porque n = N (CAMPOS, 1974).Então este termo
n
1 pode ser considerado como
sendo um fator de correção(f) para populações finitas,sendo no caso n≥5% de N.