jueves, 18 de junio de 2009

Como calcular una correlación.

Vamos a explicar de forma sencilla como correlacionar índices o valores concretos con índices (sólo de forma lineal).

Para calcular la correlación entre dos índices por ejemplo o entre un valor del índice y el propio índice se puede aplicar la fórmula:

R= [F(x)*F(y)]/Sqr[F(x^2)*F(y^2)]

Donde R es el factor de correlación.

Donde F(x) sería la función sumatório de la diferencia entre los puntos y la media de los mismos.
F(x)=SUMi (xi-xmedia)

(F(x^2)= SUMi((xi-xmedia)^2)

Los pasos a seguir son sencillos.

Lo primero que hay que hacer es elegir que temporalidad le vamos a dar a los puntos. Es decir, el valor en el cierre del día, el valor cierre semanal, horario.... Lo mejor es como máximo un cierre diario ya que correlacionar intradiario puede no tener demasiado sentido.

Después decidir que intervalo de puntos podemos escoger, por ejemplo una tendencia temporal trimestral o todo un año o elegir entre máximos y mínimos significativos. Pero lo importante es que coincidan los valores de ambas variables temporalemente. Es decir si decido calcular la correlación anual con valores de cierre diario escogería todos los valores desde el 1 de Enero al 31 de Diciembre de ambas variables (por ejemplo de Telefónica y del Ibex, o del Eurusd y el oro).

Una vez tengo el intervalo y todos los valores, debería calcular su media, la media del una y otra variable (suma de todos los valores dividido por el número de valores). Por ejemplo si tuviera un intervalo de una semana laboral (cinco días):

Xmedia=(xlunes+xmartes+... +xviernes) /5

Luego ya puedo calcular la F(x)

F(x)=(xlunes-Xmedia)+(xmartes-Xmedia)+.... +(xviernes-Xmedia)

y la F(x^2)

F(x^2)=(xlunes-Xmedia)^2+ (xmartes-Xmedia)^2+.... + (xviernes-Xmedia)^2

(para todo un años por ejemplo: F(x^2)=(x_1enero-Xmedia)^2+(x_2Enero – Xmedia)^2.....)


Se hace la raíz cuadrada de (F(x^2)*F(y^2)) (donde x puede ser telefónica y puede ser el Ibex por ejemplo), y se calcula la fórmula final de R puesta al inicio.



Interpretaciones:
El resultado de R será un valor entre –1 y 1. Donde 1 es que está muy correlacionado, 0 es que está nada correlacionado y –1 sería que está muy correlacionado a la inversa (si uno sube el otro baja por ejemplo)

Si por ejemplo queremos valores que no estén muy correlacionados con el Ibex haremos la correlación de cada uno de los valores candidatos y el Ibex y buscaremos aquellos con un valor más cercano a 0. (Aunque podría interesar que sea lo más negativo posible por ejemplo también pero eso solo en el caso de querer ponernos en largos con un Ibex a la baja o al revés).

No olvidar que estamos dentro de correlaciones LINEALES y por lo tanto la interpretación de correlaciones cuadráticas y semejantes deben realizar transformadas o retoques previos en las funciones. Lo que significa que limitamos nuestras correlaciones a ver si en todo momento, una variable tiene el mismo peso de forma lineal con respecto a otra en su evolución.

Posibilidades:

-Es muy posible que se produzca un desfase sobretodo entre correlaciones entre índices, por lo que podemos aplicar un desfase en los cálculos de correlación.

En ese caso por ejemplo R=F(xi)*F(yj)/Sqr(...)

Donde j sería i+desfase o i-desfase.
Es decir podemos considerar un desfase de cinco días (una semana laboral) entonces mezclaremos valores del lunes con valores del lunes siguiente por ejemplo.

-También podemos optar a una desestacionalidad de alguno de los dos datos aunque por lo general los mercados se mueven en la misma estacionalidad.

-Para la elección del intervalo es importante tener alguna idea coherente ya que lo único que hacemos es solo aplicar fórmulas matemáticas, no ir a un adivino.

-En caso de existencia de alguna anomalía puede variar mucho el resultado (por ejemplo ampliaciones de capital, anuncios de OPAs...). Pueden ser anomalías puntuales o pueden ser anomalías de escalón. Se recomienda realizar la correlación considerando esto como punto de inicio o final del intervalo (es decir, no considerándolo). Por la cuestión de anomalías es adecuado tener el gráfico a la vista de ambas variables a correlacionar.