Contexto


Los enfoques del análisis factorial

Ahora ya sabes que el análisis factorial es un procedimiento que se utiliza para reducir y reunir datos en el que cada variable se expresa como una combinación lineal de los factores subyacentes. Aprendiste que los factores se extraen de manera tal que el primer factor explica la varianza más alta, el segundo la varianza que sigue y así sucesivamente. 

A continuación verás que el análisis factorial tiene dos enfoques básicos: el análisis de componentes principales y el análisis de factores comunes. 

Enfoques del análisis factorial


Análisis de componentes principales Análisis de factores comunes
El análisis de componentes principales es conveniente cuando el mayor interés consiste en determinar el número mínimo de factores que explicarán la varianza máxima de los datos para utilizarlos en un análisis multivariado posterior. En el análisis de factores comunes el cálculo de los factores se basa sólo en la varianza común. Este procedimiento es adecuado cuando el interés principal es identificar las dimensiones subyacentes y cuando hay interés por la varianza común.

Ahora bien, el número de factores puede determinarse a priori o con base en los valores propios, las gráficas de sedimentación, el porcentaje de la varianza, la confiabilidad de división en mitades o pruebas de significancia.

Preguntas detonadoras o de reflexión:

¿Cuál tipo de análisis consideras más valioso: componentes principales o factores comunes?

¿Piensas que distinguirlos por varianza máxima o varianza común haga mucha diferencia en los resultados?

Explicación


Imagen obtenida de http://www.girvin.com/blog/?p=9937 sólo para fines educativos.

¿Cuáles son los criterios (o factores) de selección de los consumidores al seleccionar un restaurante de comida rápida? Si fueras Director de Mercadotecnia de Wendy’s, ¿qué estrategias formularías para incrementar tu clientela?

Para plantear tus estrategias un análisis factorial resultaría muy útil, ya que, como sabes, éste reúne todas las variables que son independientes y que pueden incidir en la decisión (de compra en este caso). Con el análisis podrías reducir y resumir datos (insumos de tus estrategias).

8.1 Etapas para aplicar el análisis factorial

En el tema de introducción al análisis factorial trabajaste con las primeras etapas del análisis factorial, pero, ¿cómo se completa el proceso? A continuación se muestra un resumen de todas las etapas (Malhotra, 2008):

Planteamiento del problema

  • Se identifican los objetivos del AF y las variables.

Elaborar la matriz de correlación

  • Se examina si las variables definidas están correlacionadas, para lo cual se utiliza la prueba de esfericidad de Bartlett y el índice de Kaiser-Meyer-Olkin (KMO).

Determinar el método de análisis factorial

  • Se selecciona el análisis de componentes principales (mínimo de factores) o el de análisis de factores comunes (dimensiones subyacentes).

Determinar el número de factores

  • A priori, basado en eigenvalores, en gráfica de sedimientación, en porcentaje de varianza o en confiabilidad de división en mitades.

Rotación de factores

  • La rotación redistribuye la varianza explicada por los factores individuales y puede ayudar a identificar cargas significativas con mayor facilidad.

Interpretación de factores

  • Permite identificar las variables que tienen cargas altas sobre el mismo factor.

Cálculo de las puntuaciones de los factores y elección de variables sustitutas

  • Calcular las puntuaciones de acuerdo al objetivo del análisis factorial; luego separar algunas variables originales para usarlas en análisis posteriores.

Ajustar el modelo

  • Analizar las diferencias entre las correlaciones observadas y las correlaciones reproducidas, si hay muchas diferencias (residuales), entonces debe reconsiderarse el modelo.

Como verás, en la etapa 3 se debe determinar el método de análisis factorial. Es necesario que comprendas los tipos de métodos de análisis factorial para que selecciones el idóneo.

8.2 Análisis de los componentes principales

En este tipo de análisis se considera la varianza total de los datos, es decir, se asume que es posible explicar el 100% de la varianza observada. A partir de esa tabla se puede observar si los factores obtenidos son suficientes para explicar todas y cada una de las variables incluidas en el análisis. De igual manera podemos ver si algunas variables incluidas pueden sacarse también. Este tipo de análisis es recomendable cuando el interés principal del investigador consiste en determinar el número mínimo de factores que explicarán la varianza máxima de los datos, para usarlos en un análisis multivariante posterior. En este análisis nos importan los autovalores mayores que 1 porque ésos representan la mayor parte de la varianza y por tanto pesan más en el análisis (Malhotra, 2008; Hair, 2007). 

8.3 Análisis de factores comunes

En este tipo de análisis el cálculo de los factores se basa sólo en la varianza común, es decir, un coeficiente de correlación parcial expresa el grado de relación existente entre dos variables tras eliminar el efecto de las restantes incluidas en el análisis. Cuando las variables incluidas comparten gran cantidad de información debido a la presencia de factores comunes, la correlación parcial entre cualquier par de variables debe ser reducida. Como las correlaciones parciales son también estimaciones de las correlaciones entre los factores únicos, se espera que las correlaciones parciales estén cercanas a cero. Este procedimiento es adecuado cuando el interés principal es identificar las dimensiones subyacentes y cuando hay interés por la varianza común. Este tipo de análisis también es conocido como factorización del eje principal (Hair 2007; Luque 2012).

Instrucciones: Haz clic para ver detalle el ejemplo.

Cierre


El análisis factorial es una herramienta muy útil para relacionar distintos factores a una misma variable independiente. 

Recurrimos a él cuando tenemos variables que no pueden clasificarse como dependientes o independientes, de esa manera se reduce el número de variables y se encuentran factores que pueden ser comunes a los datos.

Existe un gran número de aplicaciones en las que se aplica el análisis factorial, ya que da una buena idea de qué parámetro es relevante para nuestros encuestados, de tal forma que puede simplificarse muchísimo el modelo a estudiar. 

Recuerda que el mayor problema al que nos enfrentamos cuando buscamos factores importantes, que describan un producto o un servicio, es que son muchos los que influyen y el hecho de reducirlos de forma drástica, permite operativamente hacer el trabajo de análisis mucho más fácil.

Por ejemplo: se puede emplear el análisis factorial en la selección de materias optativas a abrir en alguna universidad, o para encontrar relación entre distintos tipos de diversiones (cine-teatro, tv-videojuegos), así como en la relación del estilo de vida con el hábito de gastar dinero, etc.

En los siguientes módulos aprenderás cómo realizar otros métodos multivariantes, que también te permitirán analizar distintos modelos de comportamiento.

Checkpoint


Antes de concluir el tema, asegúrate de poder contestar las preguntas que se enlistan a continuación.

Instrucciones: Haz clic en cada pregunta para conocer su respuesta.

Un valor propio representa la cantidad de varianza que se asocia con cada factor, así sólo se incluyen los factores con varianza superior a 1.0. Aquellos factores que tienen una varianza inferior a 1.0 no son mejores que una sola variable, ya que, dada la estandarización cada variable tiene una varianza de 1.0.

La matriz factorial no rotada indica la relación entre los factores y las variables originales, y por lo general da como resultado factores que son complicados de interpretar, ya que muchos de ellos están correlacionados entre sí. Una forma sencilla de lograr la interpretación es a través de la rotación de los factores.

Cuando rotamos la matiz, se busca que cada factor tenga cargas o coeficientes significativos, sólo con unas pocas variables, y que cada variable tenga cargas significativas sólo con un factor (o con pocos), lo que facilita la interpretación.

Glosario


Cargas de los factores: son correlaciones simples entre las variables y los factores.

Gráfica de sedimentación: es una gráfica de los valores propios contra el número de factores en orden de extracción.

Índice de Kaiser-Meyer_Olkin (KMO)indicador que sirve para examinar si el análisis factorial es adecuado. Valores altos (entre 0.5 y 1.0) indican que es adecuado el análisis factorial. 

Matriz de correlación: es una matriz triangular inferior que muestra las correlaciones simples entre pares posibles de variables incluidas en el análisis. Los elementos de la diagonal tendrán valores iguales a 1.

Matriz factorial: contiene cargas de los factores de todas las variables en todos los factores extraídos.

Puntuaciones de los factores: son calificaciones compuestas que se calculan para cada encuestado en los valores residuales.

Prueba de esfericidad de Bartlett: prueba estadística que se utiliza para examinar la hipótesis de que las variables no están correlacionadas en la población. Se espera un resultado de la prueba grande a fin de rechazar la hipótesis nula.

Residuales: son las diferencias entre las correlaciones observadas (tal como se presentan en la matriz de correlaciones de entrada) y las correlaciones reproducidas (como se calcularon en la matriz factorial).

Valor propio (eigenvalor): representa la varianza total explicada por cada factor.

Referencias


Libro de texto:
  • Malhotra, N. (2008). Investigación de Mercados: Un enfoque aplicado. (5ª ed.) México: Pearson. 
    ISBN: 9789702611851

Libros de apoyo:

  • Hair, J. F. (2007). Análisis Multivariante. (5ª ed.). México: Pearson/ Prentice Hall.
    ISBN: 9788483220351. 
  • Pérez, L.C. (2014). Técnicas de Análisis Multivariante de Datos. España: Pearson /Prentice.