Função de covariância

Função de covariância, ou simplesmente covariância, refere-se, no campo da geoestatística a uma medição da continuidade espacial de dado fenómeno à semelhança do seu análogo variograma. Pretende assim estudar a variabilidade de uma variável re-amostrando uma população para conter apenas os pares de pontos que se encontrem a uma dada distância h {\displaystyle h} . É utilizada especialmente em estudos onde se justifique um variograma experimental (método gráfico que considera o valor de variograma ou semi-variograma para várias distâncias) calculando a covariância directamente ou a partir do valor do variograma.


Definição

O estimador de covariância não centrada é dado pela média do produto de amostras que se encontram à distância de h {\displaystyle h} (Soares, 2006)[1]:

C ( h ) = 1 N ( h ) α = 1 N ( h ) [ Z ( x α ) Z ( x α + h ) ] {\displaystyle C'(h)={\frac {1}{N(h)}}\sum _{\alpha =1}^{N(h)}[Z(x_{\alpha })Z(x_{\alpha }+h)]\quad }

Para obter o estimador centrado precisamos subtrair o produto das médias das amostra que se encontrem nos pares distânciados por h {\displaystyle h} :


  
    
      
        
          C
          
        
        (
        h
        )
        =
        
          
            1
            
              N
              (
              h
              )
            
          
        
        
          
          
            α
            =
            1
          
          
            N
            (
            h
            )
          
        
        [
        Z
        (
        
          x
          
            α
          
        
        )
        Z
        (
        
          x
          
            α
          
        
        +
        h
        )
        
        m
        (
        
          x
          
            α
          
        
        )
        m
        (
        
          x
          
            α
          
        
        +
        h
        )
        ]
        
      
    
    {\displaystyle C'(h)={\frac {1}{N(h)}}\sum _{\alpha =1}^{N(h)}[Z(x_{\alpha })Z(x_{\alpha }+h)-m(x_{\alpha })m(x_{\alpha }+h)]\quad }
  

Onde:

m ( x α ) = 1 N ( h ) α = 1 N ( h ) Z ( x α ) {\displaystyle m(x_{\alpha })={\frac {1}{N(h)}}\sum _{\alpha =1}^{N(h)}Z(x_{\alpha })\quad }

e,

m ( x α + h ) = 1 N ( h ) α = 1 N ( h ) Z ( x α + h ) {\displaystyle m(x_{\alpha }+h)={\frac {1}{N(h)}}\sum _{\alpha =1}^{N(h)}Z(x_{\alpha }+h)\quad }


A função covariância está directamente ligada com o variograma no qual sabendo que a covariância centrada é dada por:

C ( h ) = E [ Z ( x ) Z ( x + h ) ] E [ Z ( x ) ] E [ Z ( x + h ) ] {\displaystyle C(h)=E[Z(x)Z(x+h)]-E[Z(x)]E[Z(x+h)]\quad }

e que o variograma é dado por:

γ ( h ) = 1 2 E [ ( Z ( x ) Z ( x + h ) ) 2 ] {\displaystyle \gamma (h)={\frac {1}{2}}E[(Z(x)-Z(x+h))^{2}]\quad }

Assumindo que a média é igual para todas as populações Z ( x ) {\displaystyle Z(x)} e Z ( x ) {\displaystyle Z(x)} (portanto uma função aleatória estacionária, conceito generalizado da série estacionária):

C ( h ) = E [ Z ( x ) Z ( x + h ) ] E [ Z ( x ) ] 2 {\displaystyle C(h)=E[Z(x)Z(x+h)]-E[Z(x)]^{2}\quad }

Se desenvolvermos os termos do quadrado do variograma ficamos com:

γ ( h ) = 1 2 { E [ Z ( x ) ] 2 + E [ Z ( x + h ) ] 2 2 E [ Z ( x ) Z ( x + h ) ] } {\displaystyle \gamma (h)={\frac {1}{2}}\{E[Z(x)]^{2}+E[Z(x+h)]^{2}-2E[Z(x)Z(x+h)]\}\quad }

Mais uma vez admitindo a estacionariedade das populações ficamos com:

γ ( h ) = 1 2 { E [ Z ( x ) ] 2 E [ Z ( x ) Z ( x + h ) ] } {\displaystyle \gamma (h)={\frac {1}{2}}\{E[Z(x)]^{2}-E[Z(x)Z(x+h)]\}\quad }

Subtraindo m 2 {\displaystyle m^{2}} a cada um dos termos:

γ ( h ) m 2 = E [ Z ( x ) ] 2 E [ Z ( x ) Z ( x + h ) ] m 2 {\displaystyle \gamma (h)-m^{2}=E[Z(x)]^{2}-E[Z(x)Z(x+h)]-m^{2}\quad }
γ ( h ) = E [ Z ( x ) ] 2 m 2 E [ Z ( x ) Z ( x + h ) ] + m 2 {\displaystyle \gamma (h)=E[Z(x)]^{2}-m^{2}-E[Z(x)Z(x+h)]+m^{2}\quad }
γ ( h ) = E [ Z ( x ) ] 2 m 2 ( E [ Z ( x ) Z ( x + h ) ] m 2 ) {\displaystyle \gamma (h)=E[Z(x)]^{2}-m^{2}-(E[Z(x)Z(x+h)]-m^{2})\quad }

deduz-se que:

γ ( h ) = ( E [ Z ( x ) Z ( x + h ) ] m 2 ) = C ( h ) {\displaystyle \gamma (h)=-(E[Z(x)Z(x+h)]-m^{2})=-C(h)\quad }

da qual para evitar ajustes com patamar, C ( 0 ) {\displaystyle C(0)} , negativo se utiliza a expressão:


  
    
      
        γ
        (
        h
        )
        =
        C
        (
        0
        )
        
        C
        (
        h
        )
        
      
    
    {\displaystyle \gamma (h)=C(0)-C(h)\quad }
  

Por esse motivo se nota, no formato gráfico, a covariância ser o exacto oposto do variograma:

Discussão

Em geoestatística são usadas habitualmente três funções para estudar a variabilidade espacial da amostragem que são: covariância, correlograma, e semi-variograma (comumente designado variograma). Na hipótese de estacionaridade da variável, as três funções são equivalentes: deduzem-se umas a partir das outras e dão a mesma informação sobre o comportamento espacial da variável. A figura seguinte mostra o variograma experimental, covariância e correlograma para o mesmo conjunto de dados:


Ver também


Referências

  1. Soares, A. (2006), "Geoestatística para as ciências da Terra e do Ambiente" (2006), Lisboa: Instituto Superior Técnico