Análisis de Componentes Principales

class: title-slide, middle, center
background-image: url(data:image/png;base64,#img/LOGOCCM-GRIS.png), url(img/P3.png)
background-position: 50% 10%, 75% 75%
background-size: 15%, cover

.center-column[
# .my-gold[Análisis de Componentes Principales]
### .my-gold[Estadística Multivariada]

####Haydeé Peruyero 
#### 
]

.white[.left[.footnote[Based in Overleaf template CCM3[Overleaf template CCM3](https://www.overleaf.com/latex/templates/ccm-beamer-template-3/bfqcwdmwkxkx)]]]

---
background-image: url(data:image/png;base64,#img/FONDO.png)
background-size: cover
class: middle, center

# Análisis de Componentes Principales

El análisis de componentes principales tiene como objetivo reducir la dimensión y conservar en lo posible la estructura de estos, la cual no depende de los ejes utilizados para las coordenadas.

Dadas `$n$` observaciones de `$p$` variables, se analiza si es posible representar adecuadamente la información con un número menor de variables construidas como **combinaciones lineales** de las originales.

El **primer componente principal** es la combinación lineal de las variables originales que tienen **varianza máxima**.

---
background-image: url(data:image/png;base64,#img/FONDO.png)
background-size: cover
class: middle

.pull-left[

### Ejemplo introductorio (PCA en 2D)

Imaginemos que tenemos dos mediciones para un conjunto de ciudades:

- `$x_1$`: **temperatura media anual**  
- `$x_2$`: **precipitación media anual**

Cada ciudad se representa como un punto en el plano `$(x_1, x_2)$`.  
Si dibujamos la nube de puntos, suele verse **alargada** en alguna dirección.
]

.pull-right[
![](data:image/png;base64,#pca_files/figure-html/plot1-1.png)

]

---
background-image: url(data:image/png;base64,#img/FONDO.png)
background-size: cover
class: middle

.pull-left[

Lo que se busca es proyectar los datos sobre un eje que reproduzca de la mejor manera la .my-red[forma] de los datos.

![](data:image/png;base64,#pca_files/figure-html/plot2-1.png)
]

.pull-right[

Lo primero que se hace es **centrar** los datos en el centroide `$(\bar{X_1}, \bar{X_2})$`. Después se realiza una **rotación** de manera que las .my-red[proyecciones] sean lo más parecidas posibles a los vectores originales.

Los puntos proyectados sobre el primer nuevo eje `$OY1$` reflejan la **combinación** de temperatura y lluvia que mejor explica las diferencias entre ciudades.

- A la izquierda del eje `$OY1$` están las ciudades frías y secas, a la derecha las cálidas y húmedas.
 
 El segundo eje `$OY2$`, ortogonal al primero, explica la variación “residual”:
 
 - por encima están las ciudades con más lluvia de la esperada para su temperatura, por debajo, las que tienen menos lluvia de la esperada para su temperatura.

En conclusión, hay mucha variación en clima general (primer eje) y poca variación en la desviación lluvia–temperatura (segundo eje)

]

---
background-image: url(data:image/png;base64,#img/FONDO.png)
background-size: cover
class: middle

Rotar los ejes un ángulo `$\alpha$` corresponde a aplicar una transformación lineal de los datos:

`$$\left[ \begin{matrix}
Y1 \\
Y2 
\end{matrix} \right] = \left[ \begin{matrix} 
\cos \alpha & \sin \alpha \\
-\sin \alpha & \cos \alpha 
\end{matrix}\right] \left[ \begin{matrix}
X1 \\
X2 
\end{matrix} \right] = \left[ \begin{matrix} 
X1\cos \alpha + X2\sin \alpha \\
-X1 \sin \alpha + X2 \cos \alpha 
\end{matrix}\right]$$`

Las proyecciones de los puntos sobre el eje `$OY1$` son una buena aproximación de los datos ya que en la otra dirección hay poca variación. Entonces se puede usar únicamente
`$$Y1=X1\cos \alpha + X2\sin \alpha$$`
y así la nueva variable `$Y1$` resume a las otras dos.

---
background-image: url(data:image/png;base64,#img/FONDO.png)
background-size: cover
class: middle

.pull-left[
![Proyección de un punto](data:image/png;base64,#img/cp_proyeccion.png)
]

.pull-right[

Supongamos que tenemos el punto `$P_i$`, entonces se cumple

`$$(OP_i)^2 = (OP_i^{'})^2 + (P_i P_i^{'})^2.$$`

La cantidad `$(P_i P_i^{'})^2$` se puede ver como un error que se desea minimizar.

Si sumamos sobre todas las observaciones y se divide entre `$n-1$`

`$$C = \frac{\sum_{i=1}^{n}(OP_i)^2}{n-1} = \frac{\sum_{i=1}^{n}(OP_i^{'})^2}{n-1} + \frac{\sum_{i=1}^{n}(P_i P_i^{'})^2}{n-1}.$$`
El objetivo es minimizar `$\frac{\sum_{i=1}^{n}(OP_i)^2}{n-1}$`.
]

---
background-image: url(data:image/png;base64,#img/FONDO.png)
background-size: cover
class: middle

La cantidad

`$$\frac{\sum_{i=1}^{n}(OP_i)^2}{n-1}$$`

es fija, es decir no depende de las coordenadas.

Entonces minimizar

`$$\frac{\sum_{i=1}^{n}(P_i P_i^{'})^2}{n-1}$$`

es equivalente a maximizar

`$$\frac{\sum_{i=1}^{n}(OP_i^{'})^2}{n-1}$$`

que coincide con .my-red[la varianza de las proyecciones] sobre el eje `$OY1$` (ya que los datos están centrados).

Entonces el ángulo de rotación que se busca es aquel que .my-red[maximice la varianza de las proyecciones].

---

class: middle, center, inverse

.my-gold[<svg aria-hidden="true" role="img" viewBox="0 0 640 512" style="height:3em;width:3.75em;vertical-align:-0.125em;margin-left:auto;margin-right:auto;font-size:inherit;fill:currentColor;overflow:visible;position:relative;"><path d="M392.8 1.2c-17-4.9-34.7 5-39.6 22l-128 448c-4.9 17 5 34.7 22 39.6s34.7-5 39.6-22l128-448c4.9-17-5-34.7-22-39.6zm80.6 120.1c-12.5 12.5-12.5 32.8 0 45.3L562.7 256l-89.4 89.4c-12.5 12.5-12.5 32.8 0 45.3s32.8 12.5 45.3 0l112-112c12.5-12.5 12.5-32.8 0-45.3l-112-112c-12.5-12.5-32.8-12.5-45.3 0zm-306.7 0c-12.5-12.5-32.8-12.5-45.3 0l-112 112c-12.5 12.5-12.5 32.8 0 45.3l112 112c12.5 12.5 32.8 12.5 45.3 0s12.5-32.8 0-45.3L77.3 256l89.4-89.4c12.5-12.5 12.5-32.8 0-45.3z"/></svg>]
# .my-gold[Práctica:] 
### .my-gold[PCA en R]