


























Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
As relações entre duas variáveis X, considerada independente, e Y, considerada dependente, podem ser representadas num diagrama de dispersão, com os valores de yi em ordenada e os de xi em abcissa, Cada par de valores xi e yi fornecerá um ponto e utilizando-se, por exemplo, o método dos desvios mínimos ao quadrado, pode-se calcular a equação de uma reta que melhor se ajuste à nuvem de distribuição.
Tipologia: Notas de estudo
1 / 34
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Professor Assistente Doutor Engenharia Ambiental UNESP/Sorocaba
Professor Emérito da Universidade Estadual Paulista Professor Voluntário do Depto. Geologia Aplicada UNESP/Rio Claro
UNESP/campus de Rio Claro Instituto de Geociências e Ciências Exatas Departamento de Geologia Aplicada Laboratório de Geomatemática Texto Didático 13 2004
Reprodução autorizada desde que citada a fonte. Norma 6023-2000/ABNT ( http://www.abnt.org.br): LOURENÇO, R. W. & LANDIM, P.M.B. Análise de regressão múltipla espacial. UNESP/Rio Claro, IGCE, DGA, Lab.Geomatemática,Texto Didático 13, 34 pp. 2004. Disponível em http://www.rc.unesp.br/igce/aplicada/textodi.html. Acesso em:....
Introdução A comparação entre mapas têm sido preocupação de diversos especialistas pela sua utilidade na interpretação de qualquer banco de dados temático. Se existem, porém, diversos algoritmos à disposição para a confecção de mapas o mesmo não pode ser afirmado com relação à comparação entre mapas. Alguns trabalhos que tratam do assunto podem ser encontrados em BROWER & MERRIAM (1990, 1992), HERZFELD & SONDERGARD (1988) e HERZFELD & MERRIAM (1991). Um interessante enfoque foi apresentado por BOWER & MERRIAM (2001) que utilizaram a análise de regressão múltipla para comparar mapas de contorno estrutural com finalidade de entender a história geológica de uma região. Sendo a camada mais jovem considerada a variável dependente e as demais camadas as variáveis independentes, procuraram verificar qual delas teria tido maior influência na configuração dessa camada. Nesse mesmo sentido LEITE & LANDIM (2003), aplicaram a análise de regressão múltipla em dados provenientes da represa de Três Irmãos, no Rio Tietê, no município de Pereira Barreto/SP, para quantificar a influência de diversas variáveis no comportamento da superfície potenciométrica de um aqüífero livre, escolhida como variável dependente. As variáveis consideradas independentes foram cota do terreno , base da formação aqüífera ou cota do topo do basalto , espessura da formação aqüífera , e as coordenadas X e Y. Nesses dois exemplos a análise de regressão múltipla foi usada para verificar a relação entre dados do tipo “xyz”, e não os mapas, resultantes, entre si. Neste texto, porem, o que se pretende é apresentar a aplicação da análise de regressão múltipla espacial, conforme encontrada no software IDRISI, para a comparação direta entre mapas.
Regressão Múltipla As relações entre duas variáveis X, considerada independente, e Y, considerada dependente, podem ser representadas num diagrama de dispersão, com os valores de yi em ordenada e os de xi em abcissa, Cada par de valores xi e yi fornecerá um ponto e utilizando-se, por exemplo, o método dos desvios mínimos ao quadrado, pode-se calcular a equação de uma reta que melhor se ajuste à nuvem de distribuição. O método mais comum que pode ser adotado é o da análise de regressão linear simples que fornece a equação da reta:
Uma das mais importantes aplicações da análise de regressão múltipla é a escolha, entre diversas variáveis independentes, daquelas mais úteis na previsão de Y_._ A variância total de Y é em parte explicada pelas diversas variáveis X's e o restante pela variabilidade devido ao erro (ε 1 ), O termo “explicada” tem apenas um significado
numérico não implicando necessariamente em um conhecimento físico sobre o porque da relação existente. Os tamanhos relativos dessas duas componentes de variância são obviamente de grande interesse quando da aplicação da análise de regressão múltipla, A proporção da variância dos yi observados explicada por uma equação de regressão ajustada é representada pelo coeficiente de determinação R².
(^2) y
2 2 y*
Valores de R^2 irão dispor-se no intervalo 0-1, fornecendo uma medida relativa à quantidade do ajuste do modelo de regressão múltipla aos dados, Se o valor de R^2 for próximo de 1 isso significa que as diversas variáveis X's medidas são responsáveis quase que totalmente pela variabilidade de Y, Caso contrário R^2 apresentará um valor próximo a zero, Como os coeficientes de regressão são parciais devem ser obtidas as porcentagens
explicadas da soma de quadrados de y segundo 2 k^ − 1 combinações, onde k é o número de variáveis independentes, Finalmente, verifica-se a contribuição pura de cada variável independente por comparações sucessivas entre os diversos resultados.
Exemplo DAWSON & WHITTEN (1962), num estudo petrográfico sobre o complexo granítico de Lacorne, La Motte e Preissac, no Canadá, obtiveram valores para peso específico, quartzo , índice de cor (porcentagem de silicatos escuros) , feldspato total , e as coordenadas N-S e E-W de cada ponto de amostragem (Tabela 1). Para verificar se o peso específico pode ser previsto em função das outras 5 variáveis e, também, qual a sua ordem de importância nessa previsão, aplicou-se a análise de regressão múltipla.
Inicialmente é feita uma análise de regressão levando em consideração todas as 5 variáveis, consideradas independentes, e uma análise de variância para verificar a validade do modelo. Equação encontrada:
A contribuição pura de cada variável independente, com vistas ao seu ordenamento por importância, é encontrada da seguinte maneira: a variável cor é a primeira a ser selecionada com 84,04% do total da soma de quadrados de Y a ela atribuída; em seguida apresentam-se cor+NS com 88,87% e desse modo a variável NS é escolhida com a contribuição de 88,87 – 84,04 = 4,83% para a explicação de Y; de modo idêntico feldspato é escolhida como a terceira variável com 2,24%, resultado de 91,11 – 88,87; quartzo, como a quarta variável, com 0,61%, resultado de 91,72 – 91,11 e, finalmente, EW com 0,05%. Desse modo, a explicação para o comportamento da variável peso específico é mostrada na Tabela 5:
Tabela 5 – Contribuição pura de cada variável independente 84,04% pela cor 4,83% por NS (88,87 - 84,04 = 4,83) 2,24% por feldspato (91,11 - 88,87 = 2,24) 0,61% por quartzo (91,72 – 91,11 = 0,61) 0,05% por EW (91,77 - 91,72 = 0,05)
Esses resultados indicam que, para a explicação do comportamento do peso específico, a variável mais importante é a cor, o que é coerente pois esta variável nada mais é que o resultado da presença de minerais máficos. Além disso, como a segunda variável em importância é a coordenada NS isso também esta a indicar que a variabilidade do peso específico ocorre mais ao longo dessa direção do que no sentido EW. Como se tem à disposição as coordenadas geográficas, pode-se examinar o comportamento espacial das três variáveis, quartzo, feldspato e cor, em confronto com a distribuição do peso específico (Figura 1).
30.00 20.
5 10 15
2
4
6
8
10.00 1 (^0). (^00)
5 10 15
2
4
6
8
5 10 15
2
4
6
8
2.652.70^ 2.652.
2.75 2.802.
5 10 15
2
4
6
8
p e s o e s p e c í f i c o
c o r
q u a r t z o
f e l d s p a t o
Figura 1 – Mapa das varáveis estudadas
Novamente é constatado, por simples comparação visual entre os mapas, a semelhança entre os mapas peso específico e cor. Também pode ser observada a maior variabilidade no sentido norte-sul para o peso específico e a relação inversa entre esta variável e quartzo, como já indicada pelo coeficiente de correlação. Neste caso a análise de regressão múltipla foi efetuada a partir de 44 pontos “ xyz ”. Pode-se, porém, efetuar esta análise com um enfoque espacial e, para tanto, adotar a metodologia encontrada no software IDRISI 3.2 (2001).
(^00 2 4 6 8 10 12 14 )
2
4
6
8
Figura 2 – Localização dos pontos de amostragem Como pode ser visto na Figura 2, a distribuição espacial da amostragem apresenta-
se de forma bastante irregular, com dois grupos distintos, um de centro-leste para
nordeste, e outro de sul para sudoeste, com uma configuração direcional SW-NE.
Como procedimento inicial é aplicada uma análise geoestatística para obter as
superfícies contínuas das quatro variáveis (peso específico, quartzo, feldspato e cor), e
para tanto é utilizado o programa SURFER, versão 8.
Nesse programa os dados são lidos na forma de tabela, na qual as colunas
representam as variáveis e as linhas os registros. A extensão do programa é *.DAT, que
aceita arquivos ASCII com divisores do tipo “espaço” tal como no Excel, ou arquivos
*.TXT Na primeira coluna encontra-se a coordenada EW, na segunda a coordenada NS e
as variáveis nas demais (Figura 3):
EW NS Y (P.E) X1 (Quartzo) X2 (Cor) X3 (Feldspato) 6.09 0.92 2.63 21.3 5.5 73 3.62 1.15 2.64 38.9 2.7 57. 6.75 1.16 2.64 26.1 11.1 62. 3.01 1.3 2.63 29.3 6 63. 7.4 1.4 2.64 24.5 6.6 69. 8.63 1.59 2.61 30.9 3.3 65. 4.22 1.75 2.63 27.9 1.9 69. 2.42 1.82 2.63 22.8 1.2 76 8.84 1.83 2.65 20.1 5.6 74.
“Correlograma”. O Correlograma avalia os padrões espaciais e a correlação espacial de uma malha de pontos gerada a partir da interpolação das variáveis originais. Eles indicam tendências subjacentes na malha e dão uma medida de anisotropia da malha estimada. Geralmente para se realizar essa interpolação é escolhido um método de interpolação do tipo exato, ou seja, que honra o valor original da variável quando este coincidir com o nó da malha gerado no processo de interpolação. Para gerar o correlograma execute os
Figura 5 – Editor da malha de pontos estimada Após a geração da malha de pontos calcular o correlograma de acordo com a
seguinte seqüência:
Figura 6 – Malha do Correlograma
Para visualizar o mapa gerado, a partir da malha de pontos do correlograma,
acionar na página principal do programa Map/Contour Map/New Contour Map
selecionando na caixa de diálogo Open/Grid o arquivo gerado anteriormente GS
ASCII.grd (Figura 6).
Para cada variável foram gerados correlogramas, com as características
específicas que refletem o comportamento espacial de cada variável.
Para colorir e manipular o mapa gerado acionar duplamente, na parte central do
mapa, ativando a caixa de diálogo Map/Contours properties| com múltiplas funções para
a edição desse mapa (Figura 7):
-4 -2 0 2 4
0
2
4
-0.
0
(C) - Correlograma do feldspato
-4 -2 0 2 4
0
2
4
-0.
-0.
1
(D) - Correlograma da cor Figura 8 - Correlogramas De uma maneira geral os quatro correlogramas apresentam um padrão espacial
bastante semelhante, sendo que para o peso específico e quartzo há indício de
anisotropia pouco significativa, com maior intensidade na direção SW-NE e menor na
direção SE-NW, e nas variáveis feldspato e cor um padrão isotrópico.
O passo seguinte é a aplicação dos estudos variográficos, que neste exemplo
foram feitos considerando-se um padrão de distribuição espacial isotrópico para todas as
variáveis.
Na página principal do programa acionar Grid/Variogram/New variogram e em
seguida é solicitado a escolha do arquivo contendo a planilha de dados, conforme a
Figura 3. Em seguida será disponibilizada uma caixa de entrada de dados New
Variogram como na Figura 9:
Figura 9 – Caixa de entrada para modelagem do variograma
Na caixa de entrada New Variogram, em Data Columns selecionar a coluna
A(EW) para X: , coluna B(NS) para Y e coluna C para Z (Var Zi).
Em Duplicate Data selecionar ALL para To keep: , e 0 para X e Y Tolerance ,
manter os valores padrão para a opção General. Pressionar OK para o variograma
calculado surgir no monitor.
Para o ajuste do variograma experimental gerado acionar duplamente sobre a parte
central do gráfico, ativando a caixa de diálogo Variogram properties com múltiplas
funções para modelagem variográfica (Figura 10):
(^00) 0.5 1 1.5 (^) Distância 2 2.5 3 3.
10
20
30
40
50
60
70
80
Variograma
Direction: 0.0 Tolerance: 90.
(C) – Variograma para feldspato
(^00) 0.5 1 1.5 (^) Distância 2 2.5 3 3.5 4
20
40
60
80
100
120
140
160
180
200
220
Vario grama
Direction: 0.0 Tolerance: 90.
12 25
(^3349)
58
64 81
89 98 97
(^102102)
110108 70
(D) – Variograma para cor
Figura 11 – Variogramas experimentais e ajustados. Os variogramas calculados foram utilizados para a aplicação da técnica de interpolação da “krigagem ordinária/KO” na confecção dos mapas de distribuição espacial das variáveis. Para tanto a seguinte seqüência é obedecida:
Figura 12 – Caixa de entrada da planilha de dados para interpolação por krigagem ordinária
Figura 13 – Caixa para entrada dos parâmetros do variograma