Al usar Hojas de cálculo de Google para trabajar con dos conjuntos de datos, es posible que desee comparar los dos determinando el grado en que uno influye en el otro.

Las correlaciones pueden ofrecer una idea de si existe una relación predictiva entre los planos x e y, pero no necesariamente indican causalidad. Así es como puede usar Hojas de cálculo de Google para identificar correlaciones en sus datos.

¿Qué es la correlación y para qué se puede usar?

Cuando dos variables están correlacionadas, una puede determinar cómo una variable afecta a la otra. Pero es crucial recordar que la correlación no implica confianza en este caso; simplemente muestra cuán cerca y rápidamente se comparan o relacionan dos variables.

Las métricas estadísticas ayudan a comprender las tendencias subyacentes en el análisis de datos. La correlación es una de las métricas estadísticas más utilizadas y determina qué tan estrechamente relacionadas o dependientes son dos variables.

Comprender el coeficiente de correlación en las hojas de cálculo de Google

instagram viewer

En Hojas de cálculo de Google, se calcula un coeficiente de correlación mediante la función CORREL. El coeficiente de correlación sirve como indicador de cuán estrechamente conectados están los conjuntos de datos. Puede usarse para obtener el coeficiente de correlación producto-momento de Pearson (r) si tiene dos conjuntos de datos variables. Si desea obtener más información sobre este coeficiente, puede leer más en esta guía de Estadísticas en Leard.

Uno podría encontrarse con una de las tres métricas de correlación. Cada medición define las relaciones entre las variables de manera diferente. Su valor está entre -1 y +1:

  • -1 denota una correlación negativa perfecta: Cuando una correlación tiene un coeficiente de correlación igual o inferior a -0,9, se dice que es fuertemente negativa. Es una indicación de que los datos se están correlacionando. Sin embargo, la variable x sigue aumentando, mientras que la variable y sigue disminuyendo.
  • 0 indica que no hay conexión: Se considera que las variables no se correlacionan si el coeficiente de correlación es superior a 0,01 pero inferior a 0,1, ya que no existe una relación perceptible entre cada variable. Son independientes entre sí.
  • +1 denota una correlación positiva perfecta: Cuando el coeficiente de correlación se encuentra entre 0,9 y 1, se considera altamente positivo. Indica que ha habido un aumento en los dos conjuntos de variables.

El valor más alto de un coeficiente puede haber sido un coeficiente de correlación de 1. Cuando el valor de correlación es 1, implica que si tuviera que graficar los datos, estaría completamente alineado para crear una línea recta.

Si todavía estás un poco perdido, no te preocupes. Explicaremos la sintaxis de la función CORREL y luego nos sumergiremos en algunos ejemplos del mundo real para ayudarlo a comprenderlo mejor. Comprender las líneas de mejor ajuste y Cómo hacer líneas de tendencia en Hojas de cálculo de Google te ayudará con esto.

Sintaxis de la función CORREL en Hojas de cálculo de Google

=CORREL(datos_y, datos_x) 

Desglosemos esto en sus partes y entendamos mejor lo que significa cada frase:

  • = CORREL: esta es la función de Google Sheet que determina r, (el coeficiente de correlación producto-momento de Pearson del conjunto de datos).
  • datos_y: Esto se refiere al grupo de celdas que contienen los datos dependientes o el rango de valores para esas celdas.
  • datos x: Esta es una referencia hacia la matriz de celdas con los datos independientes o el rango de valores para esas celdas.

Si tuviera que graficar los puntos de datos, data_y sería el eje Y y data_x el eje X. Notará que hay dos formas diferentes de ingresar el rango de datos. Las opciones son un rango de celdas de referencia o una entrada directa de datos en la función.

En la mayoría de los casos, es preferible el uso del rango de celdas de referencia. Eso es porque lo más probable es que la hoja de cálculo ya contenga sus datos. El uso de un rango de celdas de referencia puede evitar una cantidad excesiva de entradas escritas que pueden provocar un error del usuario.

Ejemplos de funciones CORREL en hojas de cálculo de Google

Veamos algunos ejemplos para comprender cómo usar la función CORREL en Hojas de cálculo de Google.

Ejemplo 1: una fuerte correlación positiva

Para este primer ejemplo, supongamos que estamos trabajando en la industria de bienes raíces. En la siguiente hoja de cálculo, tenemos particiones de hectáreas de tierra que está vendiendo y la cantidad de unidades vendidas de los datos de esas diferentes tierras en su Hoja de Google.

  1. Si está siguiendo una hoja, comenzará ingresando los datos de las variables en su hoja de cálculo, como se muestra a continuación:
  2. Haz clic en la celda C2
  3. Tipo = CORREL(
  4. Luego procederá a escribir data_y, que en nuestro caso, es el rango de celdas al que se hace referencia A2:A6, luego ingrese una coma.
  5. Proceda a escribir data_x, que en nuestro caso, se hace referencia como B2:B6.
  6. Termine con un soporte de cierre, como se muestra a continuación:
  7. Por último, presione Ingresar para devolver el coeficiente de correlación de los dos datos en la celda C2.

Usando el ejemplo que se acaba de mostrar, ha obtenido un coeficiente de correlación de 0,90, que es una fuerte correlación positiva ya que su valor se encuentra entre 0,9 y 1. Por lo tanto, esto indica que a medida que y cambia, x también cambia de manera sustancialmente comparable.

A continuación se muestra una representación de nuestros datos de muestra de ejemplo en un gráfico de dispersión XY. Como puede ver, la línea de mejor ajuste está cerca de los puntos de datos en el gráfico, lo que respalda la idea de que las cifras están fuertemente correlacionadas.

Puedes aprender más sobre creando gráficos de dispersión XY en Hojas de cálculo de Google en nuestro otro artículo.

Ejemplo 2: una correlación negativa débil

Esta vez, usaremos un ejemplo más genérico de "variable x e y" en nuestra hoja de cálculo. Hemos incluido cifras a propósito para demostrar una correlación negativa, que la función CORREL demuestra a continuación:

No existe una fuerte relación entre las variables y y x, por lo que el resultado que obtenemos es un coeficiente de correlación menos significativo que en el ejemplo anterior. El resultado que logramos es -0.47. Sin embargo, esto no implica que no haya ninguna correlación. Veamos una línea de mejor ajuste nuevamente para darle sentido.

Como puede ver en el gráfico de dispersión, los puntos de datos están más alejados de la línea de mejor ajuste. Hay, por tanto, menos correlación que en el primer ejemplo, pero no ninguna. También notará que la línea de mejor ajuste está disminuyendo. Esto muestra una correlación negativa, un valor disminuye a medida que el otro aumenta.

Ejemplo 3: Sin conexión

Aquí tenemos un conjunto de números completamente aleatorios. Veamos rápidamente cómo usar la función CORREL nuevamente:

  1. Escriba en la celda C2 la fórmula de CORREL
  2. Nuestros argumentos son A2:A10 y B2:B10
  3. Presione enter

El valor devuelto en C2 es 0,02. Si un coeficiente de correlación se encuentra entre 0,01 y 0,1, se determina que las variables en cuestión no se correlacionan ya que no existe una conexión perceptible entre ellas. Las relaciones entre las variables son totalmente independientes.

A continuación se muestra la representación de la misma en un gráfico de dispersión. La línea de mejor ajuste es casi plana, lo que indica poca correlación entre los dos conjuntos de datos.

Correlacione fácilmente sus datos en hojas de cálculo de Google

La correlación podría ser un tema desafiante si no trabajaste mucho con ella en la escuela secundaria. Esta guía cubrió todos los conceptos básicos, pero deberá seguir usando la función CORREL en Hojas de cálculo de Google para mantenerla fresca en su mente.

Esta es una función poderosa ya que ayuda a evitar la creación de gráficos de dispersión y puede encontrar rápidamente tendencias en sus datos. Aún así, no tenga miedo de agregar gráficos para ayudar a otros usuarios a comprender mejor los datos en sus hojas de cálculo.