Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Análise de Regressão Múltipla, Notas de estudo de Engenharia Civil

As relações entre duas variáveis X, considerada independente, e Y, considerada dependente, podem ser representadas num diagrama de dispersão, com os valores de yi em ordenada e os de xi em abcissa, Cada par de valores xi e yi fornecerá um ponto e utilizando-se, por exemplo, o método dos desvios mínimos ao quadrado, pode-se calcular a equação de uma reta que melhor se ajuste à nuvem de distribuição.

Tipologia: Notas de estudo

2010

Compartilhado em 22/04/2010

joabe-cerqueira-11
joabe-cerqueira-11 🇧🇷

5

(1)

11 documentos

1 / 34

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
1
ANÁLISE DE REGRESSÃO MÚLTIPLA
ESPACIAL
ROBERTO WAGNER LOURENÇO
Professor Assistente Doutor
Engenharia Ambiental
UNESP/Sorocaba
PAULO M. BARBOSA LANDIM
Professor Emérito da Universidade Estadual Paulista
Professor Voluntário do Depto. Geologia Aplicada
UNESP/Rio Claro
UNESP/campus de Rio Claro
Instituto de Geociências e Ciências Exatas
Departamento de Geologia Aplicada
 Laboratório de Geomatemática
Texto Didático 13
2004
Reprodução autorizada desde que citada a fonte. Norma 6023-2000/ABNT ( http://www.abnt.org.br):
LOURENÇO, R. W. & LANDIM, P.M.B. Análise de regressão múltipla espacial. UNESP/Rio Claro, IGCE, DGA, Lab.
Geomatemática,Texto Didático 13, 34 pp. 2004. Disponível em <http://www.rc.unesp.br/igce/aplicada/textodi.html>. Acesso
em:....
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22

Pré-visualização parcial do texto

Baixe Análise de Regressão Múltipla e outras Notas de estudo em PDF para Engenharia Civil, somente na Docsity!

ANÁLISE DE REGRESSÃO MÚLTIPLA

ESPACIAL

ROBERTO WAGNER LOURENÇO

Professor Assistente Doutor Engenharia Ambiental UNESP/Sorocaba

PAULO M. BARBOSA LANDIM

Professor Emérito da Universidade Estadual Paulista Professor Voluntário do Depto. Geologia Aplicada UNESP/Rio Claro

UNESP/campus de Rio Claro Instituto de Geociências e Ciências Exatas Departamento de Geologia Aplicada  Laboratório de Geomatemática  Texto Didático 13 2004

Reprodução autorizada desde que citada a fonte. Norma 6023-2000/ABNT ( http://www.abnt.org.br): LOURENÇO, R. W. & LANDIM, P.M.B. Análise de regressão múltipla espacial. UNESP/Rio Claro, IGCE, DGA, Lab.Geomatemática,Texto Didático 13, 34 pp. 2004. Disponível em http://www.rc.unesp.br/igce/aplicada/textodi.html. Acesso em:....

ANÁLISE DE REGRESSÃO MÚLTIPLA

Introdução A comparação entre mapas têm sido preocupação de diversos especialistas pela sua utilidade na interpretação de qualquer banco de dados temático. Se existem, porém, diversos algoritmos à disposição para a confecção de mapas o mesmo não pode ser afirmado com relação à comparação entre mapas. Alguns trabalhos que tratam do assunto podem ser encontrados em BROWER & MERRIAM (1990, 1992), HERZFELD & SONDERGARD (1988) e HERZFELD & MERRIAM (1991). Um interessante enfoque foi apresentado por BOWER & MERRIAM (2001) que utilizaram a análise de regressão múltipla para comparar mapas de contorno estrutural com finalidade de entender a história geológica de uma região. Sendo a camada mais jovem considerada a variável dependente e as demais camadas as variáveis independentes, procuraram verificar qual delas teria tido maior influência na configuração dessa camada. Nesse mesmo sentido LEITE & LANDIM (2003), aplicaram a análise de regressão múltipla em dados provenientes da represa de Três Irmãos, no Rio Tietê, no município de Pereira Barreto/SP, para quantificar a influência de diversas variáveis no comportamento da superfície potenciométrica de um aqüífero livre, escolhida como variável dependente. As variáveis consideradas independentes foram cota do terreno , base da formação aqüífera ou cota do topo do basalto , espessura da formação aqüífera , e as coordenadas X e Y. Nesses dois exemplos a análise de regressão múltipla foi usada para verificar a relação entre dados do tipo “xyz”, e não os mapas, resultantes, entre si. Neste texto, porem, o que se pretende é apresentar a aplicação da análise de regressão múltipla espacial, conforme encontrada no software IDRISI, para a comparação direta entre mapas.

Regressão Múltipla As relações entre duas variáveis X, considerada independente, e Y, considerada dependente, podem ser representadas num diagrama de dispersão, com os valores de yi em ordenada e os de xi em abcissa, Cada par de valores xi e yi fornecerá um ponto e utilizando-se, por exemplo, o método dos desvios mínimos ao quadrado, pode-se calcular a equação de uma reta que melhor se ajuste à nuvem de distribuição. O método mais comum que pode ser adotado é o da análise de regressão linear simples que fornece a equação da reta:

Uma das mais importantes aplicações da análise de regressão múltipla é a escolha, entre diversas variáveis independentes, daquelas mais úteis na previsão de Y_._ A variância total de Y é em parte explicada pelas diversas variáveis X's e o restante pela variabilidade devido ao erro (ε 1 ), O termo “explicada” tem apenas um significado

numérico não implicando necessariamente em um conhecimento físico sobre o porque da relação existente. Os tamanhos relativos dessas duas componentes de variância são obviamente de grande interesse quando da aplicação da análise de regressão múltipla, A proporção da variância dos yi observados explicada por uma equação de regressão ajustada é representada pelo coeficiente de determinação R².

(^2) y

2 2 y*

s

s

(variaˆnciatotal)

R = (variânciadeyexplicadapelaana&lisederegressa~o)=

Valores de R^2 irão dispor-se no intervalo 0-1, fornecendo uma medida relativa à quantidade do ajuste do modelo de regressão múltipla aos dados, Se o valor de R^2 for próximo de 1 isso significa que as diversas variáveis X's medidas são responsáveis quase que totalmente pela variabilidade de Y, Caso contrário R^2 apresentará um valor próximo a zero, Como os coeficientes de regressão são parciais devem ser obtidas as porcentagens

explicadas da soma de quadrados de y segundo 2 k^ − 1 combinações, onde k é o número de variáveis independentes, Finalmente, verifica-se a contribuição pura de cada variável independente por comparações sucessivas entre os diversos resultados.

Exemplo DAWSON & WHITTEN (1962), num estudo petrográfico sobre o complexo granítico de Lacorne, La Motte e Preissac, no Canadá, obtiveram valores para peso específico, quartzo , índice de cor (porcentagem de silicatos escuros) , feldspato total , e as coordenadas N-S e E-W de cada ponto de amostragem (Tabela 1). Para verificar se o peso específico pode ser previsto em função das outras 5 variáveis e, também, qual a sua ordem de importância nessa previsão, aplicou-se a análise de regressão múltipla.

Tabela 1. Variáveis Y e X´s para o exemplo consi derado

Inicialmente é feita uma análise de regressão levando em consideração todas as 5 variáveis, consideradas independentes, e uma análise de variância para verificar a validade do modelo. Equação encontrada:

A contribuição pura de cada variável independente, com vistas ao seu ordenamento por importância, é encontrada da seguinte maneira: a variável cor é a primeira a ser selecionada com 84,04% do total da soma de quadrados de Y a ela atribuída; em seguida apresentam-se cor+NS com 88,87% e desse modo a variável NS é escolhida com a contribuição de 88,87 – 84,04 = 4,83% para a explicação de Y; de modo idêntico feldspato é escolhida como a terceira variável com 2,24%, resultado de 91,11 – 88,87; quartzo, como a quarta variável, com 0,61%, resultado de 91,72 – 91,11 e, finalmente, EW com 0,05%. Desse modo, a explicação para o comportamento da variável peso específico é mostrada na Tabela 5:

Tabela 5 – Contribuição pura de cada variável independente 84,04% pela cor 4,83% por NS (88,87 - 84,04 = 4,83) 2,24% por feldspato (91,11 - 88,87 = 2,24) 0,61% por quartzo (91,72 – 91,11 = 0,61) 0,05% por EW (91,77 - 91,72 = 0,05)

Esses resultados indicam que, para a explicação do comportamento do peso específico, a variável mais importante é a cor, o que é coerente pois esta variável nada mais é que o resultado da presença de minerais máficos. Além disso, como a segunda variável em importância é a coordenada NS isso também esta a indicar que a variabilidade do peso específico ocorre mais ao longo dessa direção do que no sentido EW. Como se tem à disposição as coordenadas geográficas, pode-se examinar o comportamento espacial das três variáveis, quartzo, feldspato e cor, em confronto com a distribuição do peso específico (Figura 1).

30.00 20.

5 10 15

2

4

6

8

10.00 1 (^0). (^00)

5 10 15

2

4

6

8

5 10 15

2

4

6

8

2.652.70^ 2.652.

2.75 2.802.

5 10 15

2

4

6

8

p e s o e s p e c í f i c o

c o r

q u a r t z o

f e l d s p a t o

Figura 1 – Mapa das varáveis estudadas

Novamente é constatado, por simples comparação visual entre os mapas, a semelhança entre os mapas peso específico e cor. Também pode ser observada a maior variabilidade no sentido norte-sul para o peso específico e a relação inversa entre esta variável e quartzo, como já indicada pelo coeficiente de correlação. Neste caso a análise de regressão múltipla foi efetuada a partir de 44 pontos “ xyz ”. Pode-se, porém, efetuar esta análise com um enfoque espacial e, para tanto, adotar a metodologia encontrada no software IDRISI 3.2 (2001).

(^00 2 4 6 8 10 12 14 )

2

4

6

8

Figura 2 – Localização dos pontos de amostragem Como pode ser visto na Figura 2, a distribuição espacial da amostragem apresenta-

se de forma bastante irregular, com dois grupos distintos, um de centro-leste para

nordeste, e outro de sul para sudoeste, com uma configuração direcional SW-NE.

Como procedimento inicial é aplicada uma análise geoestatística para obter as

superfícies contínuas das quatro variáveis (peso específico, quartzo, feldspato e cor), e

para tanto é utilizado o programa SURFER, versão 8.

Nesse programa os dados são lidos na forma de tabela, na qual as colunas

representam as variáveis e as linhas os registros. A extensão do programa é *.DAT, que

aceita arquivos ASCII com divisores do tipo “espaço” tal como no Excel, ou arquivos

*.TXT Na primeira coluna encontra-se a coordenada EW, na segunda a coordenada NS e

as variáveis nas demais (Figura 3):

EW NS Y (P.E) X1 (Quartzo) X2 (Cor) X3 (Feldspato) 6.09 0.92 2.63 21.3 5.5 73 3.62 1.15 2.64 38.9 2.7 57. 6.75 1.16 2.64 26.1 11.1 62. 3.01 1.3 2.63 29.3 6 63. 7.4 1.4 2.64 24.5 6.6 69. 8.63 1.59 2.61 30.9 3.3 65. 4.22 1.75 2.63 27.9 1.9 69. 2.42 1.82 2.63 22.8 1.2 76 8.84 1.83 2.65 20.1 5.6 74.

Em seguida aplica-se para cada uma das variáveis uma análise do tipo

“Correlograma”. O Correlograma avalia os padrões espaciais e a correlação espacial de uma malha de pontos gerada a partir da interpolação das variáveis originais. Eles indicam tendências subjacentes na malha e dão uma medida de anisotropia da malha estimada. Geralmente para se realizar essa interpolação é escolhido um método de interpolação do tipo exato, ou seja, que honra o valor original da variável quando este coincidir com o nó da malha gerado no processo de interpolação. Para gerar o correlograma execute os

  • 2,63 21,3 5,5 73,0 0,92 6, P. E. (Y) Quartzo (X1) Cor (X2) Feldspato (X3) NS (X4) EW (X5)
  • 2,64 38,9 2,7 57,4 1,15 3,
  • 2,64 26,1 11,1 62,6 1,16 6,
  • 2,63 29,3 6 63,6 1,3 3,
  • 2,64 24,5 6,6 69,1 1,4 7,
  • 2,61 30,9 3,3 65,1 1,59 8,
  • 2,63 27,9 1,9 69,1 1,75 4,
  • 2,63 22,8 1,2 76,0 1,82 2,
  • 2,65 20,1 5,6 74,1 1,83 8,
  • 2,69 16,4 21,3 61,7 1,855 10,
  • 2,67 15,0 18,9 65,6 2,01 14,
  • 2,83 0,6 35,9 62,5 2,04 10,
    • 2,7 18,4 16,6 64,9 2,05 8,
  • 2,68 19,5 14,2 65,4 2,21 8,
  • 2,62 34,4 4,6 60,7 2,27 2,
  • 2,63 26,9 8,6 63,6 2,53 3,
  • 2,61 28,7 5,5 65,8 2,62 7,
  • 2,62 28,5 3,9 67,8 3,025 5,
  • 2,61 38,4 3,0 57,6 3,06 5,
  • 2,63 28,1 12,9 59 3,07 12,
  • 2,63 37,4 3,5 57,6 3,12 12,
  • 2,78 0,9 22,9 74,4 3,4 15,
  • 2,76 8,8 34,9 55,4 3,52 9,
  • 2,63 16,2 5,5 77,6 3,61 11,
  • 2,74 2,2 28,4 69,3 4,22 16,
  • 2,64 29,1 5,1 65,7 4,25 11,
    • 2,7 24,9 6,9 67,8 4,94 5,
  • 2,63 39,6 3,6 56,6 5,04 1,
  • 2,71 17,1 11,3 70,9 5,06 11,
  • 2,84 0 47,8 52,2 5,09 16,
  • 2,68 19,9 11,6 67,2 5,24 11,
  • 2,84 1,2 34,8 64 5,32 8,
  • 2,74 13,2 18,8 67,4 5,32 13,
  • 2,74 13,7 21,2 64,0 5,33 12,
  • 2,61 26,1 2,3 71,2 5,35 1,
  • 2,63 19,9 4,1 76,0 5,61 4,
  • 2,77 4,9 18,8 74,3 5,85 13,
  • 2,72 15,5 12,2 69,7 6,46 11,
  • 2,83 0 39,7 60,2 6,59 14,
  • 2,77 4,5 30,5 63,9 7,26 12,
  • 2,92 0 63,8 35,2 7,42 16,
  • 2,77 4 24,1 71,8 7,91 14,
  • 2,79 23,4 12,4 63,1 8,47 13,
  • 2,69 29,5 9,8 60,4 8,74 15,
  • com R^2 = 0, Y = 4,0607 -0,0158X1 -0,0106X2 -0,0143X3 + 0,0080X4 -0,0006X5,
  • 10.92 1.85 2.69 16.4 21.3 61.
  • 14.22 2.01 2.67 15 18.9 65.
    • 10.6 2.04 2.83 0.6 35.9 62.
    • 8.32 2.05 2.7 18.4 16.6 64.
    • 8.06 2.21 2.68 19.5 14.2 65.
    • 2.73 2.27 2.62 34.4 4.6 60.
      • 3.5 2.53 2.63 26.9 8.6 63.
    • 7.44 2.62 2.61 28.7 5.5 65.
    • 5.06 3.025 2.62 28.5 3.9 67.
    • 5.42 3.06 2.61 38.4 3 57.
  • 12.55 3.07 2.63 28.1 12.9
  • 12.13 3.12 2.63 37.4 3.5 57.
    • 15.4 3.4 2.78 0.9 22.9 74.
    • 9.91 3.52 2.76 8.8 34.9 55.
  • 11.52 3.61 2.63 16.2 5.5 77.
    • 16.4 4.22 2.74 2.2 28.4 69.
  • 11.43 4.25 2.64 29.1 5.1 65.
    • 5.91 4.94 2.7 24.9 6.9 67.
    • 1.84 5.04 2.63 39.6 3.6 56.
  • 11.76 5.06 2.71 17.1 11.3 70.
  • 16.43 5.09 2.84 0 52.2 52.
  • 11.33 5.24 2.68 19.9 11.6 67.
    • 8.78 5.32 2.84 1.2 34.8
  • 13.73 5.32 2.74 13.2 18.8 67.
  • 12.45 5.33 2.74 13.7 21.2
    • 1.43 5.35 2.61 26.1 2.3 71.
    • 4.15 5.61 2.63 19.9 4.1
  • 13.84 5.85 2.77 4.9 18.8 74.
  • 11.66 6.46 2.72 15.5 12.2 69.
  • 14.64 6.59 2.83 0 60.2 60.
  • 12.81 7.26 2.77 4.5 30.5 63.
  • 16.61 7.42 2.92 0 35.2 35.
  • 14.65 7.91 2.77 4 24.1 71.
  • 13.33 8.47 2.79 23.4 12.4 63.
  • 15.77 8.74 2.69 29.5 9.8 60. - Figura 3 – Entrada de dados segundo o SURFER

Figura 5 – Editor da malha de pontos estimada Após a geração da malha de pontos calcular o correlograma de acordo com a

seguinte seqüência:

  • na página principal do programa acionar Grid/Calculus selecionando o arquivo gerado anteriormente GS ASCII.grd (Figura 5):
  • na caixa de entrada Grid/Calculus selecionar Fourier & Spectral Analysis/Grid Correlogram Na caixa de entrada Output Grid File gravar o arquivo resultante na pasta desejada, na extensão GS ASCII .grd.
  • o resultado pode ser visto na página principal do programa ao acessar Grid/Grid Node Editor e selecionando o arquivo gerado anteriormente (Figura 6):

Figura 6 – Malha do Correlograma

Para visualizar o mapa gerado, a partir da malha de pontos do correlograma,

acionar na página principal do programa Map/Contour Map/New Contour Map

selecionando na caixa de diálogo Open/Grid o arquivo gerado anteriormente GS

ASCII.grd (Figura 6).

Para cada variável foram gerados correlogramas, com as características

específicas que refletem o comportamento espacial de cada variável.

Para colorir e manipular o mapa gerado acionar duplamente, na parte central do

mapa, ativando a caixa de diálogo Map/Contours properties| com múltiplas funções para

a edição desse mapa (Figura 7):

-4 -2 0 2 4

0

2

4

-0.

0

(C) - Correlograma do feldspato

-4 -2 0 2 4

0

2

4

-0.

-0.

1

(D) - Correlograma da cor Figura 8 - Correlogramas De uma maneira geral os quatro correlogramas apresentam um padrão espacial

bastante semelhante, sendo que para o peso específico e quartzo há indício de

anisotropia pouco significativa, com maior intensidade na direção SW-NE e menor na

direção SE-NW, e nas variáveis feldspato e cor um padrão isotrópico.

O passo seguinte é a aplicação dos estudos variográficos, que neste exemplo

foram feitos considerando-se um padrão de distribuição espacial isotrópico para todas as

variáveis.

Na página principal do programa acionar Grid/Variogram/New variogram e em

seguida é solicitado a escolha do arquivo contendo a planilha de dados, conforme a

Figura 3. Em seguida será disponibilizada uma caixa de entrada de dados New

Variogram como na Figura 9:

Figura 9 – Caixa de entrada para modelagem do variograma

Na caixa de entrada New Variogram, em Data Columns selecionar a coluna

A(EW) para X: , coluna B(NS) para Y e coluna C para Z (Var Zi).

Em Duplicate Data selecionar ALL para To keep: , e 0 para X e Y Tolerance ,

manter os valores padrão para a opção General. Pressionar OK para o variograma

calculado surgir no monitor.

Para o ajuste do variograma experimental gerado acionar duplamente sobre a parte

central do gráfico, ativando a caixa de diálogo Variogram properties com múltiplas

funções para modelagem variográfica (Figura 10):

(^00) 0.5 1 1.5 (^) Distância 2 2.5 3 3.

10

20

30

40

50

60

70

80

Variograma

Direction: 0.0 Tolerance: 90.

(C) – Variograma para feldspato

(^00) 0.5 1 1.5 (^) Distância 2 2.5 3 3.5 4

20

40

60

80

100

120

140

160

180

200

220

Vario grama

Direction: 0.0 Tolerance: 90.

12 25

(^3349)

58

64 81

89 98 97

(^102102)

110108 70

(D) – Variograma para cor

Figura 11 – Variogramas experimentais e ajustados. Os variogramas calculados foram utilizados para a aplicação da técnica de interpolação da “krigagem ordinária/KO” na confecção dos mapas de distribuição espacial das variáveis. Para tanto a seguinte seqüência é obedecida:

  • na página principal do programa manter aberto o variograma ajustado selecionado;
  • acessar Grid/Data, e na seqüência é solicitado a escolha do arquivo contendo a planilha de dados;
  • em seguida é disponibilizada uma caixa de entrada de dados como na Figura 12.

Figura 12 – Caixa de entrada da planilha de dados para interpolação por krigagem ordinária

  • na caixa de entrada Data Columns selecionar a coluna A(EW) para X: , coluna B(NS) para Y e coluna C para Z Var(Zi) para ;
  • na caixa de entrada Gridding Method| selecionar o método Kriging;
  • ativar na caixa de entrada Advanced Optins, e uma nova caixa de entrada aparece como a da Figura 13:

Figura 13 – Caixa para entrada dos parâmetros do variograma