Ok, el último análisis multivariado que vamos a ver es 3Dplot y vamos a ver regresión si lo pensamos, creamos el 3Dplot, pero el 3Dplot tiene algunos aspectos únicos y es que necesitamos los datos en un formato diferente porque ahora necesitamos los datos en una forma tal que tenemos una variable X, una variable Y y una variable Z y entonces necesitamos que los datos estén en el mismo formato por ejemplo necesitamos renglones para que estén en la variable X, contadores para que estén en la variable Y y celdas para que estén en la variable Z podemos empezar contando los datos agregados y dividiéndola, dividiendo la variable Z por la cantidad de gente aquí tenemos, tomemos la variable Z, que resulta ser el tiempo medio, luego la separamos en grupos basados en el número de gente luego unimos estos grupos de vuelta en una matriz vemos esa matriz, ahora tenemos renglones que se corresponden a la cantidad de gente y columnas que se corresponden con las diferentes casos del medioambiente, aunque no les hemos dado un nombre aún, lo vamos a hacer, tomando simplemente la variable que nos muestra cómo decae la enfermedad, la convertimos en factor y poniendo las etiquetas, que son los valores de estos diferentes factores y una vez que hicimos todo eso, tenemos ahora exactamente lo que queremos tenemos renglones, tenemos el número de personas y en las columnas tenemos la variable del decaimiento de la enfermedad podemos usar persp3D que es un comando de perspectiva en 3D y tenemos que decirle qué es la variable de enfermedad, que está en la matriz tenemos que decirle cómo ordenar los ejes X e Y y vamos a tomar los nombres de los renglones de la matriz, y lo vamos a transformar en valores numéricos y eso será lo que se use tenemos 100, 150 y vamos a tomar los nombres numéricos, perdón los nombres de las columnas y los vamos a transformar en números, así son más amplios, 0, 1, 2, 3, 4 y así sucesivamente, le damos un nombre le damos una etiqueta para colorear lo que vemos, le decimos que se expanda en ciertas direcciones así es más obvio cuando se mira, esto nos dice en que dirección hay que mirar, es algo con lo que jugamos un poco, debido a que si estamos mirando la parte de atrás del pico de densidad, va a ser difícil mirar el gráfico, entonces en vez de eso, lo que hacemos es alejar el pico de densidad ponemos varios ticks en el eje X, para que sea obvio, etiquetamos los ejes X e Y hacemos esto todo junto y obtenemos este gráfico que se ve así y podemos ver muchos de los patrones de los que estuvimos hablando, cuando el medio ambiente decae lentamente y el número de gente se enlentece, es cuando vemos las mayores interacciones el modelo produce algunos resultados cuando el número de personas es alto o la enfermedad decae rápidamente, esto es porque se alcanza el 100% de las infecciones muy rápidamente en estos casos cuando estas variables son lentas, podemos ver la mayoría de los resultados podemos guardar los resultados en un archivo png y tirarlo en una grilla hablemos de una forma no gráfica de ver estos datos y esa forma se denomina regresión como les dije, miremos la regresión. La idea detrás de la regresión, es que vamos a, esencialmente, tomar las variables de salida de algún tipo y compararla con diferentes variables de entrada y entonces podemos mostrar básicamente de que manera podemos ordenar estas variables de entrada con las de salida, para crear una línea que va desde la entrada a la salida claro esto no es una clase sobre regresión pero quiero ilustrar brevemente como se puede pensar en usar una regresión, en este caso vamos a usar el paquete glm (modelizador lineal general), vamos a tomar los valores de la media y vamos a decir que ese valor medio, es igual a un valor desconocido de la cantidad de gente más otro valor desconocido del tiempo que tarda la enfermedad en decaer y juntos nos brindan una constante adicional juntas las vamos a usar para fijar en línea a esas dos variables basadas en esas variables de entrada entonces el glm va a hacer eso, y nos va a mostrar un resumen de esos datos podemos ver, donde se intercepta, nos dice cual es la intercepción, nos da el número de personas, cuando la enfermedad decae en relación a la salida un promedio de los datos con los que estamos trabajando y que nos dice que nos va a tomar aproximadamente 200 ticks para si todo tiende a cero, para la infección para cada incremento en el número de personas, veremos un decaimiento en el número de ticks, de aproximadamente la mitad y para cada incremento en el decaimiento de la enfermedad, ese decaimiento es de aproximadamente 11 no sabemos que son estos efectos, no son completamente lineales, pero esto nos muestra una forma lineal de los datos que tenemos y podemos ver en las interacciones y podemos agregar una forma no lineal del modelo, así podemos decir que ahora no es igual al número de personas más el decaimiento de la enfermedad más el número de veces que la gente deja de enfermarse y podemos ver esos resultados y aquí estamos mirando que la intercepción, perdón, ampliemos esta ventana en promedio tenemos esto, para valores de 0 en la intercepción 1, hay una disminución leve para el número de gente, una leve disminución para el decaimiento de la enfermedad, y un pequeño incremento en la interacción entre ellos tomando en cuenta que es lo que está pasando cuando los dos se incrementan a lo largo del tiempo y también podemos ver cuando los valores de salida son estadísticamente significativos, en este caso eso sucede en todas las variables que estamos observando, creo que con este ejemplo al menos eso sucede con una de las variables y esto en parte es porque es un proceso estocástico