Ok, el último análisis multivariado que
vamos a ver es 3Dplot y vamos a ver

regresión

si lo pensamos, creamos el 3Dplot, pero el
3Dplot tiene algunos aspectos únicos

y es que necesitamos los datos en un 
formato diferente

porque ahora necesitamos los datos en una
forma tal que tenemos una variable X, una

variable Y y una variable Z

y entonces necesitamos que los datos estén
en el mismo formato

por ejemplo necesitamos renglones para que
estén en la variable X, contadores para

que estén en la variable Y y celdas para
que estén en la variable Z

podemos empezar contando los datos 
agregados y dividiéndola, dividiendo la

variable Z por la cantidad de gente

aquí tenemos, tomemos la variable Z, que
resulta ser el tiempo medio, luego la

separamos en grupos basados en el número 
de gente

luego unimos estos grupos de vuelta en una
matriz

vemos esa matriz, ahora tenemos renglones
que se corresponden a la cantidad de gente

y columnas que se corresponden con las
diferentes casos del medioambiente, aunque

no les hemos dado un nombre aún, lo vamos
a hacer, tomando simplemente la variable

que nos muestra cómo decae la enfermedad,
la convertimos en factor y poniendo las

etiquetas, que son los valores de estos 
diferentes factores

y una vez que hicimos todo eso, tenemos
ahora exactamente lo que queremos

tenemos renglones, tenemos el número de
personas y en las columnas tenemos la

variable del decaimiento de la enfermedad

podemos usar persp3D que es un comando de
perspectiva en 3D y tenemos que decirle

qué es la variable de enfermedad, que está
en la matriz

tenemos que decirle cómo ordenar los ejes
X e Y y vamos a tomar los nombres de los

renglones de la matriz, y lo vamos a 
transformar en valores numéricos y eso

será lo que se use

tenemos 100, 150 y vamos a tomar los
nombres numéricos, perdón los nombres de

las columnas y los vamos a transformar en
números, así son más amplios, 0, 1, 2, 3,

4 y así sucesivamente, le damos un nombre
le damos una etiqueta para colorear lo que

vemos, le decimos que se expanda en 
ciertas direcciones así es más obvio

cuando se mira, esto nos dice en que
dirección hay que mirar, es algo con lo

que jugamos un poco, debido a que si
estamos mirando la parte de atrás del pico

de densidad, va a ser difícil mirar el 
gráfico, entonces en vez de eso, lo que

hacemos es alejar el pico de densidad

ponemos varios ticks en el eje X, para 
que sea obvio, etiquetamos los ejes X e Y

hacemos esto todo junto y obtenemos este
gráfico que se ve así

y podemos ver muchos de los patrones de 
los que estuvimos hablando, cuando el

medio ambiente decae lentamente y el
número de gente se enlentece, es cuando

vemos las mayores interacciones

el modelo produce algunos resultados 
cuando el número de personas es alto

o la enfermedad decae rápidamente, esto es
porque se alcanza el 100% de las

infecciones muy rápidamente en estos casos
cuando estas variables son lentas, podemos

ver la mayoría de los resultados

podemos guardar los resultados en un 
archivo png y tirarlo en una grilla

hablemos de una forma no gráfica de ver
estos datos

y esa forma se denomina regresión

como les dije, miremos la regresión. La 
idea detrás de la regresión, es que vamos

a, esencialmente, tomar

las variables de salida de algún tipo y
compararla con diferentes variables de

entrada y entonces podemos mostrar 
básicamente de que manera podemos ordenar

estas variables de entrada con las de 
salida, para crear una línea que va desde

la entrada a la salida

claro esto no es una clase sobre regresión
pero quiero ilustrar brevemente como se

puede pensar en usar una regresión, en 
este caso vamos a usar el paquete glm

(modelizador lineal general), vamos a
tomar los valores de la media y vamos a

decir que ese valor medio, es igual a un
valor desconocido de la cantidad de gente

más otro valor desconocido del tiempo
que tarda la enfermedad en decaer

y juntos nos brindan una constante 
adicional

juntas las vamos a usar para fijar en 
línea a esas dos variables basadas en

esas variables de entrada

entonces el glm va a hacer eso, y nos va 
a mostrar un resumen de esos datos

podemos ver, donde se intercepta, nos
dice cual es la intercepción, nos da

el número de personas, cuando la 
enfermedad decae en relación a la salida

un promedio de los datos con los que 
estamos trabajando y que nos dice que nos

va a tomar aproximadamente 200 ticks para
si todo tiende a cero, para la infección

para cada incremento en el número de 
personas, veremos un decaimiento en el

número de ticks, de aproximadamente la
mitad y para cada incremento en el

decaimiento de la enfermedad, ese 
decaimiento es de aproximadamente 11

no sabemos que son estos efectos, no son
completamente lineales, pero esto nos

muestra una forma lineal de los datos que
tenemos

y podemos ver en las interacciones y 
podemos agregar una forma no lineal del

modelo, así podemos decir que ahora no es
igual al número de personas más el

decaimiento de la enfermedad más el número
de veces que la gente deja de enfermarse

y podemos ver esos resultados y aquí

estamos mirando que la intercepción, 
perdón, ampliemos esta ventana

en promedio tenemos esto, para valores de
0 en la intercepción 1, hay una

disminución leve para el número de gente, 
una leve disminución para el decaimiento

de la enfermedad, y un pequeño incremento
en la interacción entre ellos

tomando en cuenta que es lo que está 
pasando cuando los dos se incrementan a lo

largo del tiempo y también podemos ver
cuando los valores de salida son

estadísticamente significativos, en este 
caso eso sucede en todas las variables que

estamos observando, creo que con este 
ejemplo al menos eso sucede con una de las

variables y esto en parte es porque es un
proceso estocástico