Puntos claves para Inferencia y probabilidad

- El coeficiente de correlación lineal de Pearson.

El coeficiente de correlación de Pearson es una prueba que mide la relación estadística entre dos variables continuas. Si la asociación entre los elementos no es lineal, entonces el coeficiente no se encuentra representado adecuadamente.

Puede tomar un rango de valores de +1 a -1. Un valor de 0 indica que no hay asociación entre las dos variables. Un valor mayor que 0 indica una asociación positiva. Es decir, a medida que aumenta el valor de una variable, también lo hace el valor de la otra. Un valor menor que 0 indica una asociación negativa; es decir, a medida que aumenta el valor de una variable, el valor de la otra disminuye.

-Para llevar a cabo la correlación de Pearson es necesario cumplir lo siguiente:

. La escala de medida debe ser una escala de intervalo o relación.

. Las variables deben estar distribuida de forma aproximada.

. La asociación debe ser lineal.

. No debe haber valores atípicos en los datos.

-Cómo se calcula el coeficiente de correlación de Pearson

La fórmula del coeficiente de correlación de Pearson es la siguiente donde “x” es igual a la variable número uno, “y” pertenece a la variable número dos, “zx” es la desviación estándar de la variable uno, “zy” es la desviación estándar de la variable dos y “N” es número de datos.

-Diagrama de dispersión.

También conocido como gráfico de dispersión, gráfico de puntos, diagrama de XY, diagrama de dispersión o Scattergram. Los diagramas de dispersión usan una colección de puntos colocados usando coordenadas cartesianas para mostrar valores de dos variables. Al mostrar una variable en cada eje, se puede detectar si existe una relación o correlación entre las dos variables Se pueden interpretar varios tipos de correlación a través de los patrones mostrados en los diagramas de dispersión.

Estos son: positivo (los valores aumentan juntos), negativo (un valor disminuye a medida que el otro aumenta), nulo (sin correlación), lineal, exponencial y en forma de U. La fuerza de la correlación puede determinarse por la proximidad de los puntos entre sí en el gráfico. Los puntos que terminan muy lejos del conjunto general de puntos se conocen como valores atípicos.

Las líneas o curvas se ajustan dentro del gráfico para ayudar en el análisis y se dibujan tan cerca de todos los puntos como sea posible para mostrar cómo se condensaron todos los puntos en una sola línea. Esto se conoce normalmente como «línea de mejor ajuste» un «línea de tendencias» y se puede utilizar para hacer estimaciones mediante interpolación. Los diagramas de dispersión son ideales cuando se tienen datos numéricos emparejados y se desea ver si una variable afecta a la otra. Sin embargo, recuerde que la correlación no es causal y otra variable inadvertida puede estar influyendo en los resultados.

-Interpretación del coeficiente de correlación de Karl Pearson.

El coeficiente de correlación de Pearson tiene el objetivo de indicar cuán asociadas se encuentran dos variables entre sí por lo que.

Correlación menor a cero: Si la correlación es menor a cero, significa que es negativa, es decir, que las variables se relacionan inversamente.

Cuando el valor de alguna variable es alto, el valor de la otra variable es bajo. Mientras más próximo se encuentre a -1, más clara será la covariación extrema. Si el coeficiente es igual a -1, nos referimos a una correlación negativa perfecta.

Correlación mayor a cero: Si la correlación es igual a +1 significa que es positiva perfecta. En este caso significa que la correlación es positiva, es decir, que las variables se correlacionan directamente.

Cuando el valor de una variable es alto, el valor de la otra también lo es, sucede lo mismo cuando son bajos. Si es cercano a +1, el coeficiente será la covariación.

Correlación igual a cero: Cuando la correlación es igual a cero significa que no es posible determinar algún sentido de covariación. Sin embargo, no significa que no exista una relación no lineal entre las variables.

Cuando las variables son independientes significa que esta se encuentra correlacionadas, pero esto no significa que el resultado sea verdadero.

- Ecuaciones de normalidad.

Son un conjunto de fórmulas matemáticas que se utilizan para modelar la distribución normal de una variable aleatoria continua. Estas ecuaciones se basan en la teoría de la probabilidad y permiten calcular la media y la desviación estándar de la distribución normal, lo que a su vez permite hacer predicciones precisas sobre los valores futuros de la variable aleatoria. Las ecuaciones de normalidad son ampliamente utilizadas en campos como la estadística, la econometría y las ciencias sociales para analizar datos y tomar decisiones informadas basadas en modelos probabilísticos.

- Interpretación de los coeficientes del modelo lineal simple.

En un modelo lineal simple, los coeficientes representan la relación entre la variable independiente (X) y la variable dependiente (Y).

El coeficiente de intercepto (b0) es el valor de Y cuando X es igual a cero. En otras palabras, es el valor de Y cuando no hay influencia de X.

Coeficiente de pendiente (b1) representa el cambio en Y que se produce cuando X aumenta en una unidad. Si b1 es positivo, significa que a medida que X aumenta, Y también aumenta. Si b1 es negativo, significa que a medida que X aumenta, Y disminuye.

Coeficiente de determinación (R²) indica la proporción de la variabilidad total de Y que se explica por la variabilidad de X. Un valor de R² cercano a 1 indica que el modelo explica una gran parte de la variabilidad de Y un valor cercano a 0 indica que el modelo no explica bien la variabilidad de Y.

El coeficiente de error estándar (SE) mide la precisión del modelo al predecir los valores de Y. Cuanto menor sea el valor de SE, mayor será la precisión del modelo.

En resumen, los coeficientes del modelo lineal simple son herramientas importantes para entender la relación entre las variables independientes y dependientes y para predecir los valores de Y en función de los valores de X.

-Coeficiente de correlación lineal de Pearson

Es una medida estadística que indica la relación lineal entre dos variables continuas. Este coeficiente se calcula dividiendo la covarianza entre las dos variables por el producto de sus desviaciones estándar. El resultado varía entre -1 y 1, donde -1 indica una correlación negativa perfecta, 0 indica ausencia de correlación y 1 indica una correlación positiva perfecta. Es importante tener en cuenta que el coeficiente de correlación lineal de Pearson solo mide la relación lineal entre las variables, por lo que no es adecuado para medir relaciones no lineales.

-Diagramas de dispersión

Son una herramienta gráfica que permite visualizar la relación entre dos variables. En un diagrama de dispersión, cada punto representa un par de valores para cada variable. Si los puntos están cerca unos de otros y siguen una tendencia lineal, esto indica una relación positiva o negativa entre las variables. Si los puntos no siguen una tendencia clara, esto indica ausencia de correlación. Los diagramas de dispersión son útiles para identificar patrones y relaciones entre variables, lo que puede ayudar a tomar decisiones basadas en datos.

- Interpretación del coeficiente de correlación lineal de Pearson

Depende del valor obtenido y se utiliza para determinar si existe una relación lineal entre dos variables. Un valor cercano a 0 indica que no hay relación lineal entre las variables, mientras que un valor cercano a 1 o -1 indica una fuerte relación lineal positiva o negativa, respectivamente. Es importante tener en cuenta que el coeficiente de correlación lineal de Pearson solo mide la relación lineal entre las variables, por lo que no es adecuado para medir relaciones no lineales. Además, una correlación estadísticamente significativa no implica necesariamente causalidad.

- Ecuaciones de normalidad

Son utilizadas en estadística para modelar el comportamiento de las variables aleatorias continuas. Estas ecuaciones permiten calcular la probabilidad de que una variable aleatoria tome un valor determinado o se encuentre dentro de un intervalo específico. La ecuación de normalidad más común es la distribución normal, que se utiliza para modelar muchos fenómenos en la naturaleza y en las ciencias sociales. Las ecuaciones de normalidad son útiles para hacer predicciones y estimaciones basadas en datos.

- Interpretación de los coeficientes del modelo lineal simple

Es importante para entender cómo afectan las variables independientes a la variable dependiente en un modelo estadístico. En un modelo lineal simple, la variable dependiente se explica a través de una o varias variables independientes. Los coeficientes del modelo indican cuánto cambia la variable dependiente al cambiar una unidad en la variable independiente, manteniendo todas las demás constantes. Por ejemplo, si el coeficiente es positivo, significa que un aumento en la variable independiente se asocia con un aumento en la variable dependiente, mientras que un coeficiente negativo indica lo contrario. Los coeficientes también pueden utilizarse para hacer predicciones y estimaciones basadas en datos. Es importante tener en cuenta que los modelos lineales solo son adecuados para medir relaciones lineales entre variables, por lo que no son útiles para medir relaciones no lineales.