Contexto
Los enfoques del análisis factorial
Ahora ya sabes que el análisis factorial es un procedimiento que se utiliza para reducir y reunir datos en el que cada variable se expresa como una combinación lineal de los factores subyacentes. Aprendiste que los factores se extraen de manera tal que el primer factor explica la varianza más alta, el segundo la varianza que sigue y así sucesivamente.
A continuación verás que el análisis factorial tiene dos enfoques básicos: el análisis de componentes principales y el análisis de factores comunes.
Enfoques del análisis factorial
Análisis de componentes principales | Análisis de factores comunes |
El análisis de componentes principales es conveniente cuando el mayor interés consiste en determinar el número mínimo de factores que explicarán la varianza máxima de los datos para utilizarlos en un análisis multivariado posterior. | En el análisis de factores comunes el cálculo de los factores se basa sólo en la varianza común. Este procedimiento es adecuado cuando el interés principal es identificar las dimensiones subyacentes y cuando hay interés por la varianza común. |
Ahora bien, el número de factores puede determinarse a priori o con base en los valores propios, las gráficas de sedimentación, el porcentaje de la varianza, la confiabilidad de división en mitades o pruebas de significancia.
Preguntas detonadoras o de reflexión:
¿Cuál tipo de análisis consideras más valioso: componentes principales o factores comunes?
¿Piensas que distinguirlos por varianza máxima o varianza común haga mucha diferencia en los resultados?
Explicación
Imagen obtenida de http://www.girvin.com/blog/?p=9937 sólo para fines educativos.
¿Cuáles son los criterios (o factores) de selección de los consumidores al seleccionar un restaurante de comida rápida? Si fueras Director de Mercadotecnia de Wendy’s, ¿qué estrategias formularías para incrementar tu clientela?
Para plantear tus estrategias un análisis factorial resultaría muy útil, ya que, como sabes, éste reúne todas las variables que son independientes y que pueden incidir en la decisión (de compra en este caso). Con el análisis podrías reducir y resumir datos (insumos de tus estrategias).
8.1 Etapas para aplicar el análisis factorial
En el tema de introducción al análisis factorial trabajaste con las primeras etapas del análisis factorial, pero, ¿cómo se completa el proceso? A continuación se muestra un resumen de todas las etapas (Malhotra, 2008):
Planteamiento del problema
Elaborar la matriz de correlación
Determinar el método de análisis factorial
Determinar el número de factores
Rotación de factores
Interpretación de factores
Cálculo de las puntuaciones de los factores y elección de variables sustitutas
Ajustar el modelo
Como verás, en la etapa 3 se debe determinar el método de análisis factorial. Es necesario que comprendas los tipos de métodos de análisis factorial para que selecciones el idóneo.
8.2 Análisis de los componentes principales
En este tipo de análisis se considera la varianza total de los datos, es decir, se asume que es posible explicar el 100% de la varianza observada. A partir de esa tabla se puede observar si los factores obtenidos son suficientes para explicar todas y cada una de las variables incluidas en el análisis. De igual manera podemos ver si algunas variables incluidas pueden sacarse también. Este tipo de análisis es recomendable cuando el interés principal del investigador consiste en determinar el número mínimo de factores que explicarán la varianza máxima de los datos, para usarlos en un análisis multivariante posterior. En este análisis nos importan los autovalores mayores que 1 porque ésos representan la mayor parte de la varianza y por tanto pesan más en el análisis (Malhotra, 2008; Hair, 2007).
8.3 Análisis de factores comunes
En este tipo de análisis el cálculo de los factores se basa sólo en la varianza común, es decir, un coeficiente de correlación parcial expresa el grado de relación existente entre dos variables tras eliminar el efecto de las restantes incluidas en el análisis. Cuando las variables incluidas comparten gran cantidad de información debido a la presencia de factores comunes, la correlación parcial entre cualquier par de variables debe ser reducida. Como las correlaciones parciales son también estimaciones de las correlaciones entre los factores únicos, se espera que las correlaciones parciales estén cercanas a cero. Este procedimiento es adecuado cuando el interés principal es identificar las dimensiones subyacentes y cuando hay interés por la varianza común. Este tipo de análisis también es conocido como factorización del eje principal (Hair 2007; Luque 2012).
Instrucciones: Haz clic para ver detalle el ejemplo.
Cierre
El análisis factorial es una herramienta muy útil para relacionar distintos factores a una misma variable independiente.
Recurrimos a él cuando tenemos variables que no pueden clasificarse como dependientes o independientes, de esa manera se reduce el número de variables y se encuentran factores que pueden ser comunes a los datos.
Existe un gran número de aplicaciones en las que se aplica el análisis factorial, ya que da una buena idea de qué parámetro es relevante para nuestros encuestados, de tal forma que puede simplificarse muchísimo el modelo a estudiar.
Recuerda que el mayor problema al que nos enfrentamos cuando buscamos factores importantes, que describan un producto o un servicio, es que son muchos los que influyen y el hecho de reducirlos de forma drástica, permite operativamente hacer el trabajo de análisis mucho más fácil.
Por ejemplo: se puede emplear el análisis factorial en la selección de materias optativas a abrir en alguna universidad, o para encontrar relación entre distintos tipos de diversiones (cine-teatro, tv-videojuegos), así como en la relación del estilo de vida con el hábito de gastar dinero, etc.
En los siguientes módulos aprenderás cómo realizar otros métodos multivariantes, que también te permitirán analizar distintos modelos de comportamiento.
Checkpoint
Antes de concluir el tema, asegúrate de poder contestar las preguntas que se enlistan a continuación.
Instrucciones: Haz clic en cada pregunta para conocer su respuesta.
Un valor propio representa la cantidad de varianza que se asocia con cada factor, así sólo se incluyen los factores con varianza superior a 1.0. Aquellos factores que tienen una varianza inferior a 1.0 no son mejores que una sola variable, ya que, dada la estandarización cada variable tiene una varianza de 1.0.
La matriz factorial no rotada indica la relación entre los factores y las variables originales, y por lo general da como resultado factores que son complicados de interpretar, ya que muchos de ellos están correlacionados entre sí. Una forma sencilla de lograr la interpretación es a través de la rotación de los factores.
Cuando rotamos la matiz, se busca que cada factor tenga cargas o coeficientes significativos, sólo con unas pocas variables, y que cada variable tenga cargas significativas sólo con un factor (o con pocos), lo que facilita la interpretación.
Glosario
Cargas de los factores: son correlaciones simples entre las variables y los factores.
Gráfica de sedimentación: es una gráfica de los valores propios contra el número de factores en orden de extracción.
Índice de Kaiser-Meyer_Olkin (KMO): indicador que sirve para examinar si el análisis factorial es adecuado. Valores altos (entre 0.5 y 1.0) indican que es adecuado el análisis factorial.
Matriz de correlación: es una matriz triangular inferior que muestra las correlaciones simples entre pares posibles de variables incluidas en el análisis. Los elementos de la diagonal tendrán valores iguales a 1.
Matriz factorial: contiene cargas de los factores de todas las variables en todos los factores extraídos.
Puntuaciones de los factores: son calificaciones compuestas que se calculan para cada encuestado en los valores residuales.
Prueba de esfericidad de Bartlett: prueba estadística que se utiliza para examinar la hipótesis de que las variables no están correlacionadas en la población. Se espera un resultado de la prueba grande a fin de rechazar la hipótesis nula.
Residuales: son las diferencias entre las correlaciones observadas (tal como se presentan en la matriz de correlaciones de entrada) y las correlaciones reproducidas (como se calcularon en la matriz factorial).
Valor propio (eigenvalor): representa la varianza total explicada por cada factor.
Referencias
Libros de apoyo: