Skip to playerSkip to main content
  • 20 hours ago
Diplomado en IA Aplicado a la Investigación Científica
Módulo III - Sesión 06

Escuela de Posgrado
Unidad de Posgrado de la Facultad de Ingeniería Mecánica Eléctrica, Electrónica y Sistemas

Category

📚
Learning
Transcript
00:00:00Machine Learning me bota cero, quiere decir que a este paciente mi modelo le va a colocar como sano.
00:00:07Y a este paciente, número dos, lo va a colocar como enfermo.
00:00:12O sea, todo lo contrario.
00:00:15Quiere decir que, estamos hablando, este es mi Machine Learning y este de aquí es el diagnóstico del especialista del médico.
00:00:23Quiere decir que mi Machine Learning es totalmente de lo peor, porque...
00:00:30Ha diagnosticado todo lo contrario.
00:00:33Entonces, mientras más se aproxima a cero, mi modelo es peor.
00:00:39Y más, mientras más se aproxima a uno, quiere decir que es más preciso.
00:00:43Entonces, posiblemente aquí me va a colocar enfermo y aquí sano.
00:00:49En el caso de que sea más cercano a uno.
00:00:56Otro tema, también otro aspecto.
00:00:58Estas métricas que se utilizan, nunca, nunca, nunca son perfectas.
00:01:07O sea, si nosotros encontramos, por ejemplo, una métrica y nos botó uno, ya, entonces ahí hay un problema.
00:01:15O todos nosotros son lo mismo, o hemos hecho un... hemos sobreentrenado.
00:01:22Hay veces cuando sobreentrenamos, aprende tanto, entonces nuestra máquina como que memoriza y dice, tiene que ser esa forma.
00:01:30Y si no es, simplemente no.
00:01:33Y no es eso el objetivo, ¿no?
00:01:36Entonces, no podemos sobreentrenar también, ya.
00:01:39A eso se refiere en cuanto a lo que es esas métricas que dice aquí, métricas de rendimiento, ya.
00:01:48Que eso también vamos a ir viendo qué clases de métricas hay, ya con el paso que vamos avanzando, ya.
00:01:58Entonces, tenemos la experiencia que serían datos, el tipo de tarea o el objetivo, o sea, lo clasifica si está enfermo o no, y el rendimiento, ¿no?
00:02:07Una métrica que me diga si mi modelo es muy bueno o muy malo.
00:02:11Ya, a partir más o menos en este caso, utilizando esta métrica, yo podría decir que mi modelo es considerablemente bueno a partir de 0.7, ¿no?
00:02:20Porque me está garantizando que un 70% de probabilidad de que me diga que es correcto, o sea, me vote la respuesta correcta.
00:02:30Pero hay un 30% que no, ¿no?
00:02:32Entonces, corremos ese riesgo, ¿ya?
00:02:38Y mejoran con la experiencia.
00:02:41Como que él le da un concepto un poco más formal.
00:02:46Bueno, listo, entonces, ¿cuáles serían los objetivos del aprendizaje automático?
00:02:55Realizar predicciones sobre nuevos datos, ¿no?
00:02:58Porque obviamente entrenamos con los datos que ya tenemos, entonces queremos predecir nuevos datos.
00:03:04Por ejemplo, mañana, ¿cuál podría ser la temperatura?
00:03:07O de aquí a una semana, de aquí a un mes, ¿no?
00:03:11Realizar predicciones sobre esos nuevos datos.
00:03:14Luego, necesitamos optimizar el algoritmo mediante el entrenamiento para aprender a hacer predicciones basadas en datos históricos.
00:03:23Exacto.
00:03:25Utilizamos los datos históricos para poder entrenar a nuestro modelo.
00:03:34Y una vez entrenado, ya puede hacer predicciones.
00:03:38¿Ya?
00:03:38Entonces, ¿qué se va a requerir para eso?
00:03:40Para eso, nosotros vamos a requerir datos, obviamente.
00:03:46Luego, vamos a requerir, sobre esos datos, hacer un análisis exploratorio.
00:03:51Ya habíamos hecho en la clase anterior.
00:03:54Y en ese análisis exploratorio de datos, nosotros identificamos las variables que vamos a necesitar para hacer el entrenamiento.
00:04:06Y vamos a identificar también el objetivo, ¿no?
00:04:12¿Qué es lo que queremos predecir?
00:04:14¿Ya?
00:04:15Entonces, una vez que identificamos todo eso, de acuerdo a nuestro análisis exploratorio que hemos hecho en la anterior clase,
00:04:23creamos, vamos a tener nuestro Analytical Based Table, o ABT.
00:04:28Básicamente es este, ¿no?
00:04:29Aquí, que pueden observar.
00:04:31Ya, entonces, nosotros vamos a tener nuestro Analytical Based Table, o nuestra tabla base analítica.
00:04:43Donde solamente vamos a tener las variables independientes y las variables dependientes,
00:04:54que en este caso sería, por ejemplo, en nuestro objetivo, como les había dicho, ¿no?
00:05:03El objetivo, clasificar si está enfermo o no está enfermo, ¿no?
00:05:10De acuerdo a las variables independientes, ¿no?
00:05:14Por el peso, temperatura, no sé, corporal, índices de masa corporal y otras.
00:05:21Y aquí el paciente, ¿no?
00:05:26Entonces, básicamente tendríamos este dataset ya seleccionado previamente a través de un análisis exploratorio de datos.
00:05:42Ya, entonces, llegamos a esto, Analytical Based Table,
00:05:47y utilizamos un tipo de algoritmo, de Machine Learning.
00:05:53Y existen un montón de algoritmos de Machine Learning.
00:05:57Ahora, ¿cuál algoritmo utilizamos para un determinado problema?
00:06:03Ahí la cuestión.
00:06:05Nosotros hemos aprendido que hay variables cuantitativas y variables cualitativas, ¿no?
00:06:10Entonces, de acuerdo a esas variables, a la identificación de esas variables,
00:06:15nosotros vamos a utilizar un determinado algoritmo.
00:06:18Por ejemplo, los algoritmos de regresión son generalmente para cuando nuestro objetivo es numérico.
00:06:27¿Ya?
00:06:29Y los algoritmos de clasificación generalmente es cuando nuestro objetivo son categóricos.
00:06:36¿Cuándo es categórico, por ejemplo?
00:06:39Cuando decimos si está enfermo o no está enfermo, ¿no?
00:06:42Eso sería categórico.
00:06:44¿Y cuándo sería regresión?
00:06:46Sería, por ejemplo, la temperatura.
00:06:50¿No?
00:06:50Porque es numérico.
00:06:52No vamos a clasificar, pues, ¿no?
00:06:55A ver, 37.1, 32, ¿no?
00:07:01Entonces, es una predicción por regresión, ¿no?
00:07:05Entonces, por ese motivo era importante entender que debemos identificar qué tipo de variables tenemos, ¿ya?
00:07:17Entonces, las variables...
00:07:20A ver aquí.
00:07:21Sí, Marco, dime.
00:07:24Hola, doctora.
00:07:25A ver, ahora que está tocando el tema de variables,
00:07:28nos hemos reunido con mi grupo el fin de semana para tratar de ver un dataset.
00:07:33pero finalmente no nos quedó claro, en realidad, no sé si lo tiene escrito o en algún lugar.
00:07:40Definir exactamente...
00:07:41Hemos conseguido un dataset, por ejemplo, de 4,000 registros,
00:07:44pero en algún momento en clase usted comentaba que eran insuficientes.
00:07:47Nos gustaría saber, no sé si ya lo tiene especificado...
00:07:52Por ejemplo, este dataset que hemos hecho de 4,000 registros,
00:07:55¿es suficiente para el trabajo que vamos a hacer?
00:07:57Y el trabajo que vamos a hacer es así con estos algoritmos de regresión o...
00:08:01Sí.
00:08:01¿Algo o...?
00:08:02Sí, Marco.
00:08:06Es suficiente.
00:08:08Ya no hay problema.
00:08:09En cuanto a la cantidad de datasets,
00:08:17como es una clase más para que ustedes se capaciten,
00:08:23no hay problema de que utilicen datasets pequeños.
00:08:27Incluso nosotros los problemas aquí estamos haciendo con datasets menores
00:08:30para que ustedes puedan palpar los resultados, ¿no?
00:08:33Y puedan verificar visualmente.
00:08:36Ahora, 4,000 y es bastante.
00:08:39Un humano visualmente quizás no lo pueda identificar y es bastante.
00:08:44Aunque cuando hablamos en términos de Big Data,
00:08:47hablando de volumen, quizás no llegaría, ¿no?
00:08:52No necesitaríamos utilizar la nube, ¿no?
00:08:56Utilizar más recursos computacionales, ¿no?
00:08:59Sino suficiente con este Google...
00:09:02Con esta plataforma Google Colab.
00:09:05Y ahí se ejecuta.
00:09:08Entonces, no hay problema en cuanto a la cantidad de datos.
00:09:114,000, 5,000 datos, 10,000, 100,000 datos, 20,000.
00:09:16Está excelente.
00:09:19¿Ya?
00:09:20El objetivo es de que ustedes entiendan su dataset,
00:09:24encuentren el problema, hagan bien, ¿no?
00:09:27Encuentren el problema,
00:09:29interpreten, lo expliquen, lo entiendan.
00:09:31Ese es el objetivo, ¿ya?
00:09:36No hay problema.
00:09:39Solamente eso.
00:09:42En cuanto a las variables, me preguntabas, ¿no?
00:09:44En las anteriores sesiones hemos hablado sobre los tipos de variables.
00:09:49Hemos hablado en la clase de análisis exploratorio de datos.
00:09:54¿Ya?
00:09:55Ahí hemos hablado que hay variables cualitativas y variables cuantitativas.
00:10:00Entonces...
00:10:00Y también hemos hablado de que necesitamos entender cada variable...
00:10:06¿Cómo está organizado mis datos en cada variable?
00:10:12Ya sean las cualitativas o cuantitativas.
00:10:14Y de acuerdo a eso, nosotros tomamos una decisión.
00:10:16Por ejemplo, si tenemos datos vacíos, ¿qué vamos a hacer?
00:10:20De acuerdo al tipo de datos, nosotros eliminamos los datos vacíos
00:10:25o tal vez imputamos datos.
00:10:30¿Ya?
00:10:32También habíamos dicho hacer una limpieza de datos,
00:10:37hacer una estandarización, una transformación de datos, ¿no?
00:10:43Básicamente.
00:10:44A ver, vamos a hacer un resumen aquí
00:10:45de los pasos que ustedes tienen que hacer
00:10:47para llegar a este analytical base table.
00:10:50Los pasos mínimos.
00:10:52¿Ya?
00:10:53A ver.
00:10:59Pasos para llegar a analytical base table.
00:11:18Table.
00:11:18Table.
00:11:19¿Ya?
00:11:22Eh...
00:11:22Ya.
00:11:23¿Ya?
00:11:23¿Ya?
00:11:24¿Ya?
00:11:24¿Ya?
00:11:24¿Ya?
00:11:24¿Ya?
00:11:28¿Ya?
00:11:29¿Ya?
00:11:30¿Ya?
00:11:32Primer paso.
00:11:33El primer paso era que ustedes hagan la colecta de datos.
00:11:40¿Dónde está aquí?
00:11:41Este, este de aquí es el símbolo de base de datos, ¿ya?
00:11:54Este símbolo porque representa una base de datos.
00:11:59También puede representar un dataset, ¿no?
00:12:02Una base de datos.
00:12:03Entonces, aquí hacemos una colecta de datos, ¿no?
00:12:11Pero antes de colectar nuestros datos, nosotros obviamente tenemos que saber qué queremos,
00:12:16qué queremos, qué problema queremos resolver, ¿no?
00:12:24Antes de la colecta de datos, porque si no, ¿cómo vamos a colectar datos?
00:12:27Suponiendo que queremos colectar datos sobre la diabetes, ¿no?
00:12:34Si está enfermo, no está, qué tan enfermo, diabetes, ¿ya?
00:12:39Sobre la diabetes, ¿no?
00:12:42Entonces, yo voy a querer predecir, por ejemplo, voy a querer predecir si mi paciente está con
00:12:50diabetes muy grave, regular, ¿no?
00:12:56O está, comienzas, o simplemente está sano, ¿no?
00:13:00Entonces, yo voy a querer colectar datos sobre pacientes con la diabetes, ¿ya?
00:13:10Entonces, vamos a colocar así, básicamente.
00:13:13Ese sería nuestro problema.
00:13:15Problema.
00:13:17Diabetes.
00:13:18Entonces, voy y busco, colecto mis datos, no sé, voy al hospital, al médico, hago mi investigación, ¿no?
00:13:27Bueno, una vez que tengo mi dataset, hago el análisis exploratorio de datos.
00:13:40Análisis exploratorio de datos.
00:13:43EDA, en inglés, Explorative Data Analysis.
00:13:47En inglés, es el más conocido, ¿no?
00:13:50Como en inglés.
00:13:51Lo voy a colocar aquí en español.
00:13:53Bueno, análisis exploratorio de datos.
00:14:00Eso es lo que hemos hecho en la anterior clase.
00:14:04Hacemos esto.
00:14:06Y en este análisis exploratorio de datos,
00:14:09vamos a identificar,
00:14:13vamos a identificar
00:14:18que
00:14:20básicamente vamos a identificar
00:14:23primero vamos a conocer nuestro dataset, ¿no?
00:14:27Vamos a conocer nuestro dataset
00:14:28y finalmente vamos a identificar
00:14:30vamos a identificar
00:14:34vamos a identificar
00:14:40identificar
00:14:43las variables
00:14:45independientes
00:14:49independientes
00:14:51y
00:14:54la variable
00:14:55y las variables dependientes
00:14:57o la variable dependiente.
00:14:59En este caso, como ejemplo, voy a colocar la variable dependiente, ¿ya?
00:15:03y la variable dependiente.
00:15:07Suponiendo que yo voy a utilizar
00:15:09un
00:15:10un algoritmo de Machine Learning
00:15:13de regresión
00:15:15porque
00:15:15el objetivo
00:15:17va a ser
00:15:19qué tan
00:15:20no sé
00:15:24la cantidad
00:15:25en cantidad numérica
00:15:27qué tan
00:15:28malo
00:15:29está mi paciente.
00:15:30¿no?
00:15:31Puede ser
00:15:3180, 90, 100, 200, 300, 500, ¿no?
00:15:35Solo un médico puede sacar ese valor, ¿no?
00:15:38Suponiendo.
00:15:40Entonces,
00:15:40mi variable dependiente
00:15:42va a ser justamente ese objetivo, ¿no?
00:15:45Lo que voy a querer predecir.
00:15:47Y mis variables independientes
00:15:48van a ser
00:15:49todas las características
00:15:51que van
00:15:53a ser necesarios
00:15:55para llegar a ese diagnóstico.
00:15:58¿no?
00:15:58Esas serían las variables independientes.
00:15:59Entonces, yo voy a identificar eso
00:16:02cuáles serían las
00:16:04necesarias
00:16:05porque imagínense
00:16:06que en esta
00:16:06colecta de datos
00:16:07exista
00:16:08ciudad.
00:16:10No importa la ciudad
00:16:11en este caso.
00:16:13La diabetes puede tenerlo cualquiera.
00:16:15¿no?
00:16:15No es relevante.
00:16:16Entonces,
00:16:17tienen que identificar
00:16:18las variables relevantes
00:16:20para ese problema
00:16:21de la diabetes.
00:16:22¿no?
00:16:23Entonces,
00:16:25ahí van a hacer una limpieza
00:16:26de datos.
00:16:26Van a ver también
00:16:27si hay datos faltantes,
00:16:28si hay un outlier
00:16:29por ahí,
00:16:30eliminar el outlier,
00:16:32etcétera.
00:16:33Una vez que hacen
00:16:34esa selección,
00:16:36ahí recién
00:16:37llegan a esta parte
00:16:38que es el
00:16:39Analytical Based Table.
00:16:41¿no?
00:16:42Que básicamente
00:16:43sería
00:16:44aquí.
00:16:54Aquí.
00:17:00Sería
00:17:01Analytical
00:17:02Based Table.
00:17:04¿no?
00:17:13Table.
00:17:14Vamos a colocarlo
00:17:17con ese nombre
00:17:18porque nosotros
00:17:19utilizamos mucho
00:17:20ese nombre.
00:17:22Ya.
00:17:23Una tabla
00:17:24base analítica.
00:17:26¿no?
00:17:26Donde
00:17:27aquí van a estar
00:17:29mis
00:17:29mis
00:17:30mis
00:17:31características
00:17:32variables
00:17:33independientes
00:17:34uno.
00:17:35Digamos que
00:17:35característica
00:17:36uno,
00:17:36característica
00:17:37dos,
00:17:38característica
00:17:39tres
00:17:40y aquí
00:17:41el objetivo.
00:17:44objetivo.
00:17:47Y aquí
00:17:48vamos a colocar
00:17:48paciente,
00:17:49¿no?
00:17:49El código
00:17:50del paciente.
00:17:55Código
00:17:55del paciente.
00:17:57Entonces,
00:17:57sería aquí
00:17:58característica
00:17:58uno,
00:18:00característica
00:18:00dos,
00:18:01característica
00:18:02tres,
00:18:02dependiendo,
00:18:03¿no?
00:18:03Cuántas
00:18:03características
00:18:04se necesite
00:18:05para
00:18:06para saber
00:18:07el grado
00:18:08de diabetes
00:18:09que tiene
00:18:09mi paciente.
00:18:11Puede ser
00:18:11cinco,
00:18:12seis,
00:18:13siete,
00:18:13ocho,
00:18:13seis,
00:18:13¿no?
00:18:15Entonces,
00:18:16esos serían
00:18:18los pasos
00:18:19que necesitamos
00:18:20para llegar
00:18:20a esta tabla.
00:18:22¿ya?
00:18:23Esos serían
00:18:24los pasos.
00:18:25Entonces,
00:18:26tenemos los datos,
00:18:27tenemos el análisis
00:18:27productorio,
00:18:28identificamos las variables
00:18:30independientes,
00:18:30las variables dependientes
00:18:31y tenemos nuestro
00:18:32analytical base table.
00:18:33La variable dependiente
00:18:35es el target,
00:18:36en términos técnicos
00:18:39le decimos target,
00:18:40en español
00:18:41sería objetivo,
00:18:43en portugués
00:18:44algo,
00:18:46y
00:18:47las variables
00:18:49independientes
00:18:50en inglés,
00:18:54en términos técnicos
00:18:55se le dice
00:18:56features,
00:18:57cuando les diga
00:18:58¿cuáles son tus features?
00:19:00Entonces,
00:19:00ya saben que me estoy
00:19:01dirigiendo
00:19:01a las variables
00:19:03independientes
00:19:04y en español
00:19:06serían características,
00:19:07¿no?
00:19:08Entonces,
00:19:08¿cuáles son tus
00:19:08características?
00:19:10Independientes,
00:19:11¿ya?
00:19:11Entonces,
00:19:12conocer bien
00:19:12esos conceptos,
00:19:16yo creo que con eso
00:19:17ya para todos
00:19:18los demás,
00:19:19todas las demás técnicas
00:19:20lo mismo,
00:19:21parecido,
00:19:22¿ya?
00:19:22Y agarramos
00:19:23nuestro tipo
00:19:25de algoritmo,
00:19:26¿no?
00:19:26Finalmente,
00:19:28puede ser
00:19:29redes neuronales,
00:19:30KNN,
00:19:31árboles de decisión,
00:19:32regresión,
00:19:34¿ya?
00:19:35Listo.
00:19:38Entonces,
00:19:39estos algoritmos
00:19:40de Machine Learning,
00:19:43ellos están
00:19:43clasificados
00:19:44de acuerdo
00:19:47a esto,
00:19:50a esto de aquí
00:19:50que está en la lista,
00:19:51¿no?
00:19:51Aprendizaje
00:19:52supervisionado,
00:19:53aprendizaje no
00:19:54supervisionado,
00:19:55aprendizaje
00:19:55semi supervisionado,
00:19:57aprendizaje
00:19:58por refuerzo,
00:20:01ahí tenemos
00:20:02cuatro tipos
00:20:03de aprendizaje
00:20:04automático,
00:20:05¿ya?
00:20:06Entonces,
00:20:06básicamente nosotros
00:20:07en este curso
00:20:08vamos a hablar
00:20:09de estos dos
00:20:10principalmente.
00:20:11Si nos sobra
00:20:12tiempo,
00:20:12tal vez un ejercicio
00:20:13aprendizaje
00:20:14por refuerzo.
00:20:15ya que
00:20:19gran parte
00:20:22de los algoritmos
00:20:23están,
00:20:25los estudios
00:20:27están
00:20:27enfocados
00:20:28en estos dos.
00:20:28Sí,
00:20:29Marco.
00:20:31Profesora,
00:20:32este código
00:20:34que nos está
00:20:34mostrando
00:20:35es,
00:20:36ya lo deberíamos
00:20:37usar en la data
00:20:38limpia que ya
00:20:39después de hacer
00:20:40el EDA,
00:20:40¿no es así?
00:20:41Después de hacer el EDA
00:20:41ya vamos con este
00:20:43algoritmo.
00:20:45Exacto,
00:20:45vamos aquí a este
00:20:46notebook.
00:20:47Aquí ya,
00:20:48ya tienen sus datos
00:20:49limpios aquí.
00:20:50Claro,
00:20:50no sé si a mí
00:20:51se me ha pasado
00:20:52o no sé,
00:20:53la clase pasada
00:20:53usted mostró
00:20:54una serie de pasos,
00:20:55muchas,
00:20:56muchas formas
00:20:56de hacer el EDA,
00:20:57limpieza de datos,
00:20:58duplicados,
00:20:59además.
00:21:00¿También dejó código
00:21:00para esas limpiezas
00:21:02o no?
00:21:02Porque la verdad
00:21:02que no me acuerdo
00:21:03o no lo tengo,
00:21:04no sé.
00:21:05O así como está dejando
00:21:06un código así
00:21:06para este tipo
00:21:07de aprendizaje.
00:21:09¿También hay código
00:21:09para la limpieza
00:21:10de datos?
00:21:12Sí,
00:21:12sí,
00:21:13un código.
00:21:13Yo les voy a proporcionar
00:21:15ese código
00:21:15para que puedan ver,
00:21:17ya.
00:21:18Solo que
00:21:18yo les había mostrado
00:21:20un código
00:21:21con una biblioteca
00:21:22que todavía
00:21:23no se ha lanzado
00:21:24al,
00:21:27para el público
00:21:27y que se va a lanzar
00:21:28en noviembre
00:21:29de este año.
00:21:32Pero sí,
00:21:33yo tengo
00:21:33otros notebooks
00:21:34donde
00:21:35hay algunos ejemplos
00:21:37y eso
00:21:38les puedo compartir.
00:21:39También ha sido
00:21:40un notebook
00:21:40donde ustedes
00:21:41pueden hacer clic
00:21:42y ya
00:21:42hacen la prueba.
00:21:44Ya,
00:21:44no hay problema.
00:21:44pero lo importante
00:21:48es que sepan
00:21:49los conceptos
00:21:50y después
00:21:51de esos conceptos
00:21:51ustedes
00:21:52lo llevan,
00:21:53utilizan
00:21:53cualquier herramienta,
00:21:54no necesariamente
00:21:55el Python.
00:21:56Existen otras
00:21:57herramientas
00:21:58porque en la primera clase
00:21:59habíamos hecho
00:21:59el Tableau
00:22:02y ahí también,
00:22:04¿no?
00:22:04Ya hace
00:22:05como un
00:22:05primer
00:22:06preprocesamiento
00:22:09de datos,
00:22:09¿no?
00:22:10ya como que
00:22:11las,
00:22:13hace una limpieza
00:22:14inicial
00:22:15y ya
00:22:16sube
00:22:17a la nube,
00:22:19mejor dicho,
00:22:19sube
00:22:19al entorno
00:22:21para hacer los análisis
00:22:22ya un poco más limpio.
00:22:24Entonces,
00:22:24podría utilizar
00:22:25también esas
00:22:25que ya
00:22:26ustedes
00:22:26están haciendo
00:22:27clic,
00:22:27clic,
00:22:27clic
00:22:28y ya está
00:22:29limpio
00:22:30los datos.
00:22:32Ya,
00:22:32bueno.
00:22:33Entonces tenemos,
00:22:36vamos a enfocarnos
00:22:37en aprendizaje
00:22:38supervisionado
00:22:39y no supervisionado.
00:22:40¿Qué significa
00:22:41supervisionado
00:22:41y no supervisionado?
00:22:42Como su nombre
00:22:43lo dice.
00:22:44Supervisionado
00:22:45es porque
00:22:46alguien lo está
00:22:46supervisionando.
00:22:48¿Quién lo está
00:22:48supervisionando?
00:22:49El profesional.
00:22:50Por ejemplo,
00:22:52el médico,
00:22:54¿no?
00:22:54En el ejemplo
00:22:54de la diabetes.
00:22:56¿Quién está
00:22:56supervisionado?
00:22:57¿Quién sabe
00:22:57si el paciente
00:23:00está enfermo
00:23:01o no
00:23:01de diabetes?
00:23:02El profesional,
00:23:05¿no?
00:23:06El médico.
00:23:06Entonces,
00:23:07tenemos una
00:23:08una columna
00:23:11objetivo
00:23:12que está
00:23:13siendo supervisionado
00:23:15por un profesional
00:23:16o por alguien
00:23:16que sabe.
00:23:18Eso es
00:23:19aprendizaje
00:23:20supervisionado.
00:23:22Ya que alguien
00:23:22existe
00:23:24una columna
00:23:26que está
00:23:28siendo supervisionado
00:23:29por un
00:23:29profesional.
00:23:31Y ahora,
00:23:31aprendizaje
00:23:32no supervisionado
00:23:33es porque
00:23:35no existe
00:23:35un profesional
00:23:36o una persona
00:23:37que está supervisionando.
00:23:38Es lo contrario.
00:23:39Por ejemplo,
00:23:40¿cuándo?
00:23:41Yo les había comentado
00:23:43el dataset
00:23:44que
00:23:45habíamos hecho
00:23:47sobre datos
00:23:49de
00:23:50los artículos
00:23:52científicos
00:23:53en el área
00:23:54de ciencias
00:23:54de la computación.
00:23:56¿No?
00:23:56Habíamos
00:23:56colectado
00:23:57datos
00:23:57de diferentes
00:23:58bases
00:23:58de datos
00:23:59y habíamos
00:24:01colectado
00:24:02un millón
00:24:02de datos.
00:24:04¿No?
00:24:05Entonces,
00:24:05ahí no ha habido
00:24:06un profesional
00:24:07que uno por uno
00:24:08diga,
00:24:08bueno,
00:24:09este artículo
00:24:09es
00:24:10de redes
00:24:12neuronales,
00:24:13este artículo
00:24:13es de base
00:24:14de datos,
00:24:15este artículo
00:24:16es de,
00:24:17no sé,
00:24:17y digamos que
00:24:18ha clasificado
00:24:19en 30.
00:24:19¿No?
00:24:20Entonces,
00:24:21no hay una columna
00:24:22objetivo
00:24:24donde indique
00:24:26y haya
00:24:27una persona
00:24:29etiquetado
00:24:30a qué categoría
00:24:32pertenece
00:24:33cada artículo.
00:24:35¿No?
00:24:36Entonces,
00:24:36en ese caso,
00:24:37por ejemplo,
00:24:38es aprendizaje,
00:24:39se utiliza técnicas
00:24:40de aprendizaje
00:24:40no supervisionado.
00:24:42¿Ya?
00:24:42En esos casos
00:24:44el algoritmo
00:24:46ya te,
00:24:47como que te
00:24:47identifica
00:24:49un clúster,
00:24:51por ejemplo.
00:24:52¿No?
00:24:52Ya te identifica,
00:24:53estos son muy similares,
00:24:55son iguales,
00:24:56entonces lo clasifica
00:24:56como un
00:24:58grupo.
00:25:00¿No?
00:25:01Un grupo A.
00:25:02Por eso había
00:25:02los top 10.
00:25:04¿No?
00:25:04Este de aquí,
00:25:05otro,
00:25:05otro grupo,
00:25:06otro grupo.
00:25:07¿No?
00:25:07Y ahí recién
00:25:09viene,
00:25:09una vez que ya
00:25:10los resultados,
00:25:11recién viene
00:25:11el especialista.
00:25:12Ah,
00:25:12ha descubierto
00:25:1310 grupos.
00:25:17A ver,
00:25:17vamos a ver
00:25:17este grupo
00:25:17de qué es.
00:25:18¿No?
00:25:19Ya este grupo
00:25:20es sobre,
00:25:21dice base de datos,
00:25:22dice datos,
00:25:23dice data,
00:25:24no sé,
00:25:24todo lo que tiene que ver,
00:25:25big data,
00:25:26todo lo que tiene que ver,
00:25:27data.
00:25:27Ah,
00:25:27entonces es área
00:25:28de base de datos.
00:25:30Ahora,
00:25:30en este otro grupo,
00:25:31¿qué dice?
00:25:31A ver,
00:25:32dice inteligencia artificial,
00:25:33machine learning,
00:25:34redes neuronales,
00:25:35regresión,
00:25:36aprendizaje por regresión,
00:25:38esto,
00:25:38esto.
00:25:39Entonces,
00:25:39esto es
00:25:40inteligencia artificial.
00:25:42Ahora,
00:25:42en el otro,
00:25:43¿qué dice?
00:25:43Ah,
00:25:43dice criptografía,
00:25:44seguridad,
00:25:46dice esto,
00:25:46ya,
00:25:47entonces es el área de,
00:25:48así,
00:25:49¿no?
00:25:49solo cuando ya hay un resultado,
00:25:52ahí va el especialista
00:25:54y etiqueta,
00:25:57¿no?
00:25:58Eso es en el aprendizaje
00:25:59supervisional.
00:26:01Es un ejemplo que les he dado,
00:26:03¿ya?
00:26:04Entonces,
00:26:05como tenemos esos dos tipos
00:26:07de aprendizaje
00:26:08de máquina,
00:26:10¿no?
00:26:11Supervisionado
00:26:12y no supervisionado,
00:26:13estos algoritmos
00:26:16de
00:26:16supervisionado
00:26:18generalmente son
00:26:19utilizados
00:26:20para modelos
00:26:21predictivos,
00:26:22¿no?
00:26:22Para predecir,
00:26:24¿ya?
00:26:24Y el no supervisionado
00:26:26generalmente es para
00:26:27describir,
00:26:28por eso es que
00:26:29había descrito,
00:26:31¿no?
00:26:31A ver,
00:26:31vamos a ver este grupo
00:26:32qué es,
00:26:32entonces como que
00:26:33describimos ese grupo
00:26:34qué es,
00:26:35¿no?
00:26:35Y el otro grupo
00:26:36qué es,
00:26:36¿ya?
00:26:37Esa es la diferencia.
00:26:39Ahora,
00:26:40dentro de modelos
00:26:42predictivos
00:26:43supervisionados
00:26:44tenemos algoritmos
00:26:45de regresión
00:26:46y de clasificación.
00:26:49Generalmente,
00:26:50los algoritmos
00:26:51de regresión
00:26:52son porque
00:26:54nuestra variable
00:26:55objetivo,
00:26:57¿no?
00:26:57O sea,
00:26:58nuestra variable
00:26:58dependiente
00:26:59es numérica.
00:27:03¿Ya?
00:27:03Entonces,
00:27:03si es numérica,
00:27:04entonces vamos a
00:27:05utilizar una técnica
00:27:06de regresión.
00:27:08Y,
00:27:09las de clasificación
00:27:11si nuestra variable
00:27:12objetivo
00:27:13es categórica,
00:27:15¿no?
00:27:16Por ejemplo,
00:27:16sí o no,
00:27:18o femenino,
00:27:19masculino,
00:27:19cosas así,
00:27:20¿no?
00:27:20Y porque ya están
00:27:21clasificadas
00:27:22y esa variable
00:27:23es categórica
00:27:24o cualitativa,
00:27:26¿ya?
00:27:28Y aquí,
00:27:29en no supervisionado
00:27:32hay algoritmos
00:27:33de agrupamiento
00:27:34que agrupa
00:27:35de acuerdo
00:27:37a la similitud
00:27:38o de acuerdo
00:27:39al algoritmo
00:27:40también
00:27:41de asociación
00:27:43lo que asocia
00:27:45de acuerdo
00:27:46a
00:27:46a una regla,
00:27:49por ejemplo,
00:27:52podría ser,
00:27:53a ver,
00:27:54vamos a asociar
00:27:55en una ciudad
00:27:57A,
00:27:58digamos,
00:27:59ciudad A,
00:28:00en un mercado,
00:28:02en un centro comercial,
00:28:03todos los
00:28:08padres de familia
00:28:10que van a comprar
00:28:12los domingos
00:28:13pañales para sus bebés
00:28:15también compran
00:28:16cerveza,
00:28:17¿no?
00:28:18Entonces,
00:28:19ahí,
00:28:20el modelo
00:28:20ha aprendido
00:28:22diciendo que
00:28:23todos los domingos
00:28:24en esa ciudad,
00:28:26¿no?
00:28:26La mayoría
00:28:26de los padres
00:28:28de familia,
00:28:28varones,
00:28:29compran pañales
00:28:30y a su vez
00:28:31también compran
00:28:32cerveza.
00:28:32Entonces,
00:28:33por lo tanto,
00:28:33la empresa
00:28:34podría identificar
00:28:35eso,
00:28:36¿no?
00:28:36De acuerdo
00:28:36al algoritmo
00:28:37que ha salido,
00:28:37¿no?
00:28:38Ha identificado,
00:28:39ha asociado,
00:28:40¿no?
00:28:41Que los jóvenes
00:28:41de esa ciudad,
00:28:42o los padres
00:28:43de familia
00:28:43de esa ciudad,
00:28:44compran cerveza
00:28:46y pañales
00:28:46y pañales
00:28:46los domingos,
00:28:47¿no?
00:28:48Entonces,
00:28:49la empresa
00:28:50podría
00:28:50tomar una
00:28:52decisión
00:28:54para aumentar
00:28:56sus ventas.
00:28:57¿Qué decisión?
00:28:58Poner las cervezas
00:28:59al lado
00:29:00de los pañales,
00:29:02¿no?
00:29:02Entonces,
00:29:03ahí,
00:29:04hicieron ese experimento
00:29:05y de verdad,
00:29:05efectivamente,
00:29:06las ventas subieron.
00:29:08Ya,
00:29:09entonces,
00:29:09esos son
00:29:09algoritmos
00:29:10de asociación,
00:29:11ya.
00:29:12Y algoritmos
00:29:13de sumarización
00:29:14también.
00:29:16es también
00:29:17muy parecido
00:29:22a lo que es
00:29:22este
00:29:22agrupamiento
00:29:25y a sumarización.
00:29:27Eso también
00:29:27vamos a hacer
00:29:28un ejemplo
00:29:28de cada uno
00:29:30de estos,
00:29:30¿ya?
00:29:32Más para adelante.
00:29:34El día de hoy
00:29:35solamente vamos
00:29:36a enfocar
00:29:36en esta parte
00:29:38de aquí.
00:29:40A ver,
00:29:41¿qué más?
00:29:42Aprendizaje
00:29:42supervisionado.
00:29:44Entonces,
00:29:45lo que les había dicho,
00:29:46el aprendizaje
00:29:46supervisionado
00:29:48de Machine Learning,
00:29:52¿no?
00:29:54Tenemos
00:29:54un
00:29:55Analytical
00:29:56Based Table
00:29:57de esta manera.
00:29:58Voy a reducir
00:29:59aquí la pantalla
00:30:00para que puedan
00:30:01ver.
00:30:04Ya.
00:30:05Tenemos
00:30:05de esta manera,
00:30:06¿no?
00:30:07Tenemos
00:30:07las columnas
00:30:08características
00:30:09o variables
00:30:09independientes
00:30:11o las features
00:30:11denominados
00:30:13como M
00:30:14y tenemos
00:30:15el target
00:30:15que sería
00:30:16la variable
00:30:18objetivo
00:30:19o la variable
00:30:19dependiente
00:30:20o el
00:30:21variable dependiente,
00:30:23¿ya?
00:30:24y cada una
00:30:26de las líneas
00:30:28de los registros
00:30:29es el número
00:30:30de ejemplos.
00:30:33N.
00:30:34Entonces,
00:30:34el ejemplo 1,
00:30:35ejemplo 2,
00:30:36ejemplo 3,
00:30:36ejemplo 4,
00:30:37ejemplo 5.
00:30:37Cada registro
00:30:38es un ejemplo
00:30:39o una observación.
00:30:42¿Ya?
00:30:44Entonces,
00:30:45lo vamos a colocar
00:30:45como N.
00:30:47Variable objetivo
00:30:48como K
00:30:49y las features
00:30:51como M.
00:30:52¿Ya?
00:30:53Tenemos
00:30:54N,
00:30:54M y K.
00:30:59Entonces,
00:31:00básicamente
00:31:00esto.
00:31:02Ahora,
00:31:03vamos a aquí
00:31:03un ejemplo
00:31:04bien sencillo
00:31:05para ustedes.
00:31:07Ya,
00:31:08aquí.
00:31:11Identifiquenme
00:31:11en este ejemplo
00:31:12cuáles son
00:31:17las variables
00:31:18la variable
00:31:21objetivo.
00:31:23Identifiquenme
00:31:24cuál es la variable
00:31:25objetivo,
00:31:26las variables
00:31:26independiente,
00:31:32independiente,
00:31:34mejor dicho,
00:31:35las características.
00:31:36Ya veo aquí.
00:31:38En el Word
00:31:39les voy a
00:31:40colocar
00:31:41para que ustedes
00:31:41me identifiquen.
00:31:43Ya,
00:31:44habíamos dicho
00:31:44que
00:31:47ya,
00:31:49habíamos dicho
00:31:50que tenemos
00:31:52las features,
00:31:53features
00:31:55llamadas
00:31:55también
00:31:56características
00:31:57y
00:31:59la
00:32:01colocamos
00:32:01como
00:32:02N
00:32:03igual a
00:32:04¿era N?
00:32:06Déjenme decir
00:32:07N.
00:32:09M,
00:32:10¿no?
00:32:10M, K
00:32:11y N.
00:32:11Ya.
00:32:12Entonces,
00:32:13era M.
00:32:14Tenemos las features
00:32:15que es M.
00:32:17Tenemos la variable
00:32:19objetivo
00:32:19que es K.
00:32:22Objetivo
00:32:23que es K.
00:32:25Y tenemos
00:32:26el número
00:32:27de ejemplos,
00:32:28o sea,
00:32:28N.
00:32:29¿Cuántos registros?
00:32:31Los ejemplos
00:32:32que es N.
00:32:34¿Ya?
00:32:35Entonces,
00:32:35ahora ustedes
00:32:36me van a decir
00:32:36en ese ejemplo
00:32:37cuáles serían
00:32:38las features,
00:32:42las características,
00:32:43el objetivo
00:32:45y el N.
00:32:50Ya.
00:33:00Ya.
00:33:01Entonces,
00:33:01este es un
00:33:02dataset
00:33:03de una persona,
00:33:05¿no?
00:33:05Edad.
00:33:06Una persona
00:33:07que aquí
00:33:07tiene esa edad.
00:33:08aquí es
00:33:11de un vehículo.
00:33:13Está en portugués
00:33:16aquí.
00:33:16¿Cómo es una imagen?
00:33:18Es de un vehículo.
00:33:20La V
00:33:20significa van
00:33:21y la E
00:33:23significa
00:33:24no sé,
00:33:28pero es otro
00:33:28tipo de vehículo,
00:33:29¿no?
00:33:30El tipo
00:33:30de vehículo
00:33:31V
00:33:31y el tipo
00:33:32de vehículo
00:33:33E.
00:33:34¿Ya?
00:33:34Entonces,
00:33:36por ejemplo,
00:33:37aquí dice
00:33:37clase,
00:33:38sí,
00:33:38no,
00:33:39sí,
00:33:39no,
00:33:39sí.
00:33:40¿Ya?
00:33:40¿Cuáles serían
00:33:41las características
00:33:43en este dataset?
00:33:52El tipo
00:33:53de vehículo
00:33:54será,
00:33:54¿no?
00:33:57Ya.
00:33:58Juan Cruz
00:33:59dice
00:33:59el tipo
00:34:00de vehículo
00:34:00y también
00:34:01la colega.
00:34:02¿Qué más?
00:34:11Por ejemplo,
00:34:12¿ustedes quieren saber
00:34:13ya el objetivo?
00:34:15¿Cuál sería el objetivo
00:34:16y cuántos ejemplos
00:34:18hay?
00:34:20El objetivo
00:34:20determinar
00:34:21qué tipo
00:34:22de vehículo
00:34:23usan
00:34:25según las edades,
00:34:27¿no?
00:34:28Sí,
00:34:28entonces sería
00:34:29cuál variable.
00:34:30Digan el nombre
00:34:34de la variable.
00:34:35Una es la edad
00:34:36y el otro
00:34:36tipo de vehículo.
00:34:39Clase.
00:34:41Ya,
00:34:42Willis
00:34:42dice
00:34:43M
00:34:435
00:34:47N2
00:34:48Ah,
00:34:51los ejemplos
00:34:52hemos dicho
00:34:53que son las observaciones.
00:34:56Aquí,
00:34:57¿cuántas
00:34:57observaciones?
00:34:58Sí,
00:35:00¿están por ahí?
00:35:12Sí,
00:35:12ya están
00:35:13más o menos
00:35:13llegando.
00:35:17Casi,
00:35:17casi,
00:35:18casi.
00:35:20Ya,
00:35:21Willis
00:35:22dice
00:35:22M
00:35:23igual a
00:35:24no,
00:35:25después dijo
00:35:25N igual a
00:35:265,
00:35:26excelente,
00:35:27¿no?
00:35:27N igual a
00:35:295,
00:35:291,
00:35:292,
00:35:293,
00:35:304,
00:35:305,
00:35:30ok.
00:35:31¿Y a cuál sería
00:35:32el objetivo?
00:35:37Solo digan
00:35:37el nombre.
00:35:39Clase.
00:35:41Clase.
00:35:42Ok,
00:35:43clase.
00:35:45Ya,
00:35:46ese sería el objetivo.
00:35:47¿Y las características?
00:35:49Tipo de vehículo.
00:35:50¿Qué más?
00:35:51O solo tipo de vehículo.
00:35:55Pues,
00:35:55depende del modelo que queramos sacar.
00:36:00Sí.
00:36:01Si tiene o no el vehículo.
00:36:04Ya,
00:36:04Beatriz dice
00:36:05tipo de vehículo y edad.
00:36:08Ya.
00:36:09Entonces,
00:36:09aquí,
00:36:10en esta,
00:36:11se supone que
00:36:12para llegar a esta
00:36:13analytical base table,
00:36:15ya ha pasado por el análisis
00:36:16exploratorio,
00:36:17ya se ha seleccionado
00:36:18qué columnas
00:36:20van a ser
00:36:20entrenadas,
00:36:22¿no?
00:36:22Entonces,
00:36:23solamente queríamos
00:36:23identificar cuáles son las
00:36:25características y cuáles son
00:36:27los objetivos,
00:36:28¿no?
00:36:28Efectivamente,
00:36:30las características
00:36:31serían edad
00:36:32y tipo de vehículo.
00:36:34El objetivo
00:36:35sería
00:36:38esto,
00:36:40clase.
00:36:40y aquí tenemos
00:36:42cinco
00:36:43registros,
00:36:46¿no?
00:36:46Cinco ejemplos,
00:36:47cinco,
00:36:48cinco ejemplos,
00:36:50¿ya?
00:36:52Eso sería,
00:36:53entonces,
00:36:53en este caso.
00:36:55Excelente.
00:36:57Identificamos eso.
00:37:00A ver,
00:37:01vamos aquí.
00:37:02Las características
00:37:03y efectivamente,
00:37:05¿no?
00:37:05Tenemos cinco ejemplos,
00:37:07dos features,
00:37:07que diría edad
00:37:08y tipo de vehículo.
00:37:09Ah,
00:37:10all.
00:37:11Vean,
00:37:11la E es
00:37:12deportivo.
00:37:13Ah,
00:37:14es que en portugués
00:37:14la E es
00:37:15esportivo,
00:37:17con E,
00:37:18¿no?
00:37:19Pero en español
00:37:20es deportivo.
00:37:23O sea,
00:37:23aquí debería ser
00:37:24D en español,
00:37:25pero bueno.
00:37:27Y la V es
00:37:27van.
00:37:29Dos clases,
00:37:31sí o no.
00:37:32Ah,
00:37:32ya,
00:37:32ya,
00:37:33ya.
00:37:33En cuanto
00:37:33nuestra clase,
00:37:36esta sería la clase,
00:37:37¿no?
00:37:37Pero ¿cuántas clases
00:37:38tiene?
00:37:38Tiene dos,
00:37:39que sí y no.
00:37:40A uno de ustedes
00:37:41ya dijo ahí,
00:37:42¿no?
00:37:43Que la K es igual a dos.
00:37:45Excelente.
00:37:46En esta feature
00:37:47tiene dos clases,
00:37:48¿ah?
00:37:48Sí y no.
00:37:50No hay más o menos,
00:37:51¿no?
00:37:51Por ahí.
00:37:53Vamos a ver aquí.
00:37:54Y aquí otro ejemplo
00:37:55para,
00:37:56para cerrar.
00:37:57como,
00:37:57en el otro era
00:38:04con variable
00:38:05cualitativa,
00:38:07¿no?
00:38:08Porque era sí y no.
00:38:10En este caso
00:38:11ya no es variable
00:38:12cualitativa aquí,
00:38:13es cuantitativa.
00:38:14Ya,
00:38:14pero bueno.
00:38:19En este caso,
00:38:20¿cuál sería la,
00:38:21¿cuál sería la,
00:38:21para este segundo ejemplo
00:38:25cuál sería la M,
00:38:27que sería features?
00:38:29¿Cuál sería la CAC,
00:38:30la clase?
00:38:31¿Y cuántos ejemplos hay?
00:38:38¿A qué se refiere
00:38:40despesa,
00:38:40profesora?
00:38:41Despesa sería gasto.
00:38:44Tipo de vehículo
00:38:45y gasto.
00:38:45El objetivo sería,
00:38:53pues,
00:38:53el,
00:38:54el gasto,
00:38:55¿no?
00:38:55Ya,
00:38:56el gasto.
00:38:57Entonces,
00:38:57tenemos aquí
00:38:58gasto.
00:39:00Tenemos,
00:39:01el objetivo sería gasto,
00:39:02solo que,
00:39:03como es una variable
00:39:04numérica,
00:39:06entonces,
00:39:07ella no,
00:39:07no está clasificada
00:39:08como sí o no,
00:39:09no tiene,
00:39:09no hay dos clases,
00:39:10¿no?
00:39:10Sino que,
00:39:11numérica,
00:39:12y nos vamos a necesitar
00:39:13utilizar un algoritmo
00:39:14de regresión.
00:39:16¿No?
00:39:16Ya,
00:39:17pero sabemos que ese de aquí
00:39:18es el objetivo.
00:39:19Ya.
00:39:20Vamos a colocar aquí
00:39:21K,
00:39:23eh,
00:39:23variable,
00:39:24objetivo.
00:39:27Porque justamente es,
00:39:28eh,
00:39:29variable cuantitativa.
00:39:33Variable,
00:39:33cuantitativa.
00:39:36La anterior aquí era
00:39:37variable cualitativa.
00:39:41Cuantitativa.
00:39:44Cuantitativa.
00:39:45Variable cualitativa.
00:39:49Y en este caso,
00:39:50el variable cuantitativa.
00:39:54Variable cuantitativa.
00:39:56Listo.
00:39:58Y,
00:39:58lo que dijo,
00:39:59¿no?
00:40:00Edad y vehículo,
00:40:01exactamente.
00:40:02Edad y tipo de vehículo.
00:40:05Y también tiene cinco.
00:40:06Excelente.
00:40:08Ahora sí.
00:40:09Es lo mismo,
00:40:09solo que aquí era
00:40:11clase,
00:40:13no,
00:40:13la variable cualitativa
00:40:14y aquí cuantitativa.
00:40:16¿No?
00:40:16Al final es lo mismo.
00:40:18Excelente.
00:40:20Aquí está.
00:40:20deportivo,
00:40:22van y etcétera.
00:40:24Ahora,
00:40:25hay varios tipos de
00:40:26algoritmos de regresión.
00:40:30¿Ya?
00:40:30Ejemplos de
00:40:31algoritmos de aprendizaje
00:40:33supervisionado.
00:40:35Tenemos regresión lineal,
00:40:37regresión logística,
00:40:39árbol de decisión,
00:40:40random forest,
00:40:42gradient,
00:40:42y etcétera,
00:40:43etcétera.
00:40:44SVM,
00:40:46KNN,
00:40:48y otros.
00:40:50Aquí están
00:40:51los más
00:40:53utilizados.
00:40:56Algunos ejemplos.
00:40:57¿Ya?
00:40:58Ustedes lo pueden utilizar
00:41:00en diferentes tipos
00:41:01de problemas.
00:41:03Por ejemplo,
00:41:04en área de salud.
00:41:05Diagnóstico médico
00:41:06basado en imágenes médicas.
00:41:08Por ejemplo,
00:41:09¿no?
00:41:09Radios X,
00:41:11resonancia magnética.
00:41:12De acuerdo a esas imágenes
00:41:14podríamos seleccionar
00:41:15si tiene cáncer
00:41:17o no tiene cáncer,
00:41:18por ejemplo.
00:41:19¿No?
00:41:19Predicción de riesgo
00:41:20de enfermedades crónicas
00:41:21mediante registros
00:41:23clínicos y etcétera.
00:41:24Ciencias sociales,
00:41:26clasificación de encuestas
00:41:27o respuesta de cuestionarios,
00:41:29si es positivo,
00:41:30negativo o neutro.
00:41:31¿No?
00:41:32Entonces,
00:41:32predicción de resultados
00:41:33electorales basados
00:41:34en datos demográficos
00:41:36y comportamentales,
00:41:38por ejemplo.
00:41:39Predicción
00:41:40de
00:41:41de exerción
00:41:42estudiantil
00:41:43en universidades
00:41:44mediante registros
00:41:45académicos.
00:41:46Y así todas las áreas
00:41:47tienen
00:41:48eh
00:41:49eh
00:41:50eh
00:41:51tienen para
00:41:52poder utilizar
00:41:53estas
00:41:54estas técnicas
00:41:55¿no?
00:41:56En ingeniería,
00:41:57en negocios.
00:41:58¿Ya?
00:41:59Entonces,
00:41:59como ustedes tienen el notebook,
00:42:01van leyendo,
00:42:02incluso le pueden decir
00:42:03a Chayepete
00:42:04que les den más ejemplos
00:42:05y no solo eso,
00:42:07le pueden decir a Chayepete
00:42:08a ver un ejemplo
00:42:09paso a paso
00:42:11utilizando este algoritmo.
00:42:13Les va a dar.
00:42:15Ya.
00:42:19Bueno,
00:42:20antes que se nos vaya
00:42:21la hora,
00:42:21ya tenemos cuatro minutos,
00:42:22pasemos a lo que es
00:42:23aprendizaje no supervisionado.
00:42:26El aprendizaje
00:42:27no supervisionado,
00:42:29ya les había dicho,
00:42:30no tiene
00:42:30el o
00:42:32la columna
00:42:33target
00:42:34o la columna
00:42:35objetivo.
00:42:37Ella solamente tiene
00:42:38las features
00:42:40o las características
00:42:41nada más.
00:42:43¿Ya?
00:42:44Eh
00:42:45por ejemplo aquí
00:42:49¿no?
00:42:51Tenemos edad,
00:42:54tipo de vehículo
00:42:55y color.
00:42:57¿Qué podríamos
00:42:58predecir
00:42:59si en el caso
00:43:00fuese
00:43:01eh
00:43:03supervisionado?
00:43:06No se podría,
00:43:06¿no?
00:43:06Porque
00:43:07el color
00:43:09es una variable
00:43:11independiente,
00:43:12no depende
00:43:13del tipo
00:43:13de vehículo.
00:43:15¿No?
00:43:17Eh
00:43:17puede haber
00:43:18vans de color negro,
00:43:19azul,
00:43:20blanco,
00:43:20cualquier color
00:43:21y este deportivo
00:43:23también de igual manera.
00:43:25Entonces en este caso
00:43:25no hay una variable
00:43:28objetivo
00:43:28supervisionado
00:43:29por una persona.
00:43:32Y de igual manera,
00:43:33cinco ejemplos,
00:43:34dos features,
00:43:35edad
00:43:35y vehículo.
00:43:37En este caso
00:43:38no hay asociación
00:43:39explícita
00:43:40de ningún atributo
00:43:41con una clase
00:43:41determinada.
00:43:44Algunos
00:43:45ejemplos
00:43:45de algoritmos
00:43:47de aprendizaje
00:43:48no
00:43:48supervisionado.
00:43:49Tenemos el
00:43:50camins,
00:43:51tenemos el
00:43:52local
00:43:52obliter
00:43:53factor,
00:43:54tenemos el
00:43:54psa,
00:43:55el minshift,
00:43:57el dbs
00:43:58scan
00:43:59y otros.
00:44:04El ejemplo
00:44:05que les había
00:44:06mostrado
00:44:07anteriormente
00:44:08en la
00:44:09última clase
00:44:11sobre
00:44:13encontrar los
00:44:16los tópicos
00:44:20que están,
00:44:20cómo los tópicos
00:44:22están creciendo
00:44:23y los más tops
00:44:24era no
00:44:26supervisionado.
00:44:28Ya era
00:44:28utilizando
00:44:29algoritmos
00:44:29no supervisionados.
00:44:32Y de la misma
00:44:32manera,
00:44:34aplicaciones
00:44:34en las diferentes áreas.
00:44:36Por ejemplo,
00:44:37podemos agrupar,
00:44:38agrupamiento
00:44:39de genes
00:44:39según patrones
00:44:40de expresión.
00:44:41Aquí
00:44:45generalmente
00:44:45se utilizan
00:44:46muchos más
00:44:47datasets
00:44:47porque
00:44:50no,
00:44:52también
00:44:52menores,
00:44:54igual que
00:44:54el anterior.
00:44:55Ya.
00:44:57Tenemos
00:44:57ingeniería,
00:44:58ciencias sociales,
00:44:59medicina
00:45:00y así.
00:45:01Y ya estamos
00:45:01terminando,
00:45:02nos falta un minuto.
00:45:04Ahora
00:45:04los pasos
00:45:05para el uso
00:45:05del modelo.
00:45:07Ya.
00:45:08La siguiente
00:45:08clase
00:45:09vamos a
00:45:10analizar
00:45:10un poco más
00:45:11esta parte
00:45:12de aquí
00:45:12porque
00:45:13vean
00:45:14de que
00:45:14estos conceptos
00:45:15son base
00:45:16para que
00:45:17ustedes puedan
00:45:17entender
00:45:18todos los demás
00:45:19algoritmos.
00:45:20¿No?
00:45:20Entonces,
00:45:20es importante
00:45:21que estudien
00:45:22esta base.
00:45:24Les recomiendo
00:45:25que estudien
00:45:26cosa que
00:45:27en la siguiente
00:45:27clase
00:45:28ya vamos
00:45:31directamente
00:45:32a las herramientas
00:45:33que nos permiten
00:45:34hacer este
00:45:34modelado.
00:45:35Ya.
00:45:36Tenemos aquí
00:45:36por ejemplo
00:45:37varios.
00:45:38Para este caso
00:45:39nosotros vamos
00:45:40a utilizar
00:45:40primeramente
00:45:41esta
00:45:42librería
00:45:44en Python
00:45:45que se llama
00:45:45el
00:45:46SkitLearn
00:45:48donde nosotros
00:45:50podemos
00:45:50utilizar
00:45:51estos algoritmos
00:45:52que les he mencionado
00:45:53de Machine Learning
00:45:53Supervisional.
00:45:55Ya.
00:45:56Y también
00:45:56tenemos
00:45:56otros
00:45:57eh
00:45:58otros
00:46:00otras
00:46:01bibliotecas
00:46:02que tienen
00:46:03la misma
00:46:05el mismo
00:46:05objetivo
00:46:06pero
00:46:06sus funciones
00:46:07son específicas
00:46:08para
00:46:08alguna
00:46:10categoría.
00:46:11¿No?
00:46:11Por ejemplo
00:46:11el
00:46:11NLTK
00:46:13específicamente
00:46:15para procesamiento
00:46:16de lenguaje
00:46:16natural.
00:46:17¿No?
00:46:18Por ejemplo
00:46:19el TensorFlow
00:46:20para
00:46:21algoritmos
00:46:22de Deep
00:46:23Learn.
00:46:23¿No?
00:46:24y así
00:46:24por delante
00:46:26nosotros
00:46:27vamos a utilizar
00:46:28este de aquí
00:46:29y por eso
00:46:30he empezado
00:46:31dándoles
00:46:32una introducción
00:46:33a esta librería
00:46:34y a la próxima
00:46:35vamos a
00:46:36analizar un poco
00:46:38de esto
00:46:38y yo les recomiendo
00:46:39que
00:46:39vayan estudiando
00:46:41ya que el tiempo
00:46:42no nos ha dado
00:46:43para
00:46:44poder hacer
00:46:45este ejemplo
00:46:46el día de hoy.
00:46:47¿Ya?
00:46:48Entonces
00:46:48a la siguiente
00:46:49clase
00:46:49hacemos eso
00:46:50y
00:46:51un ejemplo
00:46:52quizá más
00:46:56si nos da tiempo
00:46:57damos secuencia
00:46:59a los otros
00:47:00ejercicios.
00:47:02¿Si tienen alguna
00:47:03pregunta?
00:47:04¿Sí Marco?
00:47:06Sí doctora
00:47:07un favor
00:47:08lo que pasa
00:47:09que
00:47:09como le decía
00:47:10hace unos momentos
00:47:12nos hemos unido
00:47:13con mi grupo
00:47:14queremos avanzar
00:47:15el trabajo
00:47:15pero creo que
00:47:17bueno
00:47:17al menos
00:47:18yo no sé
00:47:19si las demás compañeras
00:47:19también han entendido
00:47:20exactamente
00:47:20cuáles son los pasos
00:47:23o sea ya tenemos
00:47:23el dataset
00:47:24y dice que son
00:47:24cuatro mil
00:47:25ya lo tenemos
00:47:26pero
00:47:26¿qué hacemos
00:47:27con esos cuatro mil?
00:47:28¿lo limpiamos?
00:47:29¿generamos un
00:47:30un tabló?
00:47:31¿generamos un código
00:47:32en Python?
00:47:33Quisiéramos saber
00:47:34que nos digan
00:47:35exactamente
00:47:35qué hacer
00:47:36porque
00:47:36como
00:47:37necesitamos avanzar
00:47:39pues seguramente
00:47:40en los últimos días
00:47:40no va a haber mucho tiempo
00:47:41quisiéramos saber
00:47:43qué es lo que hay que hacer
00:47:44exactamente
00:47:45con el
00:47:45con el
00:47:46con el dataset
00:47:47para que podamos ir
00:47:49al menos dividirnos
00:47:50con los trabajos
00:47:50con los chicos
00:47:51o ir conversando
00:47:53y un poco
00:47:53cocinar
00:47:55a ver
00:47:56vamos a ver aquí
00:47:57las diapositivas anteriores
00:47:59les voy a mostrar
00:48:01las diapositivas anteriores
00:48:02en las diapositivas anteriores
00:48:07están todos los pasos
00:48:09ya
00:48:12pero para esto
00:48:13y ustedes tienen
00:48:14el dataset
00:48:14entonces tienen que hacer
00:48:15el análisis
00:48:16exploratorio de datos
00:48:17como les dije aquí
00:48:19en esta diapositiva
00:48:22ustedes vean
00:48:25las otras diapositivas
00:48:26anteriores
00:48:27las diapositivas
00:48:28de análisis
00:48:28exploratorio de datos
00:48:29ahí está más completo
00:48:32ya
00:48:33entonces ustedes
00:48:34están aquí
00:48:35entonces les falta
00:48:35hacer ese análisis
00:48:36exploratorio de datos
00:48:37van a
00:48:40sí María
00:48:43sí justamente
00:48:45profesora
00:48:46era un poquito
00:48:47la preocupación
00:48:47entendiendo que
00:48:49bueno
00:48:50personalmente
00:48:51no soy del área
00:48:52y me es difícil
00:48:53poder
00:48:54entrar
00:48:55sobre todo
00:48:56con los términos
00:48:57entonces
00:48:57le pediríamos
00:48:59de repente
00:48:59así como una guía
00:49:01sé que hoy día
00:49:03sí ha sido
00:49:04le he entendido
00:49:05ya mucho mejor
00:49:06con esa diapositiva
00:49:07de la base de datos
00:49:09todo eso
00:49:09pero sería bueno
00:49:11precisar bien
00:49:12cuáles son los productos
00:49:13que usted va a calificar
00:49:16tal producto
00:49:18de tal manera
00:49:19que nosotros
00:49:19de verdad
00:49:20queremos hacer el trabajo
00:49:22lo mejor posible
00:49:23para que usted también
00:49:24pueda revisarlo
00:49:26no ha sido fácil
00:49:27conseguir la data
00:49:28ya la hemos conseguido
00:49:29y ahora sí
00:49:31queremos poner en práctica
00:49:32todo lo que usted nos ha indicado
00:49:34gracias maestra
00:49:35está bien
00:49:36vean la sesión 3
00:49:38y la sesión 4
00:49:39la sesión 3
00:49:41está el análisis
00:49:42exploratorio de datos
00:49:43y la sesión 4
00:49:44la gestión de datos
00:49:47¿no?
00:49:47en el análisis exploratorio de datos
00:49:50está todos los pasos
00:49:52que ustedes deben hacer
00:49:53¿no?
00:49:54disculpe
00:49:54disculpe doctora
00:49:56buenas noches
00:49:58en el mismo caso
00:49:59también
00:50:00
00:50:00o sea
00:50:01sí tenemos las diapositivas
00:50:02pero yo creo que este curso
00:50:04es un poco más práctico
00:50:05¿no?
00:50:05porque usted
00:50:06no lo hemos
00:50:07no lo hemos visto
00:50:08haciendo el ejemplo
00:50:11con un dataset
00:50:11¿no?
00:50:12y eso es lo que más pediríamos
00:50:14yo
00:50:14yo por mi parte
00:50:16y al igual que algunos compañeros
00:50:18como le digo
00:50:19la mayoría también
00:50:20yo no soy de ingeniería de sistemas
00:50:22yo soy administrador
00:50:23y
00:50:24la situación es que
00:50:26yo tampoco
00:50:27no conozco
00:50:27cómo tengo que trabajar
00:50:29y
00:50:30he visto
00:50:31a los
00:50:31a los anteriores doctores
00:50:32que ellos
00:50:34nos demostraban
00:50:35de cómo
00:50:36teníamos que utilizar
00:50:37las
00:50:38este
00:50:38la
00:50:39lo de python
00:50:41claro
00:50:42conocemos un poco
00:50:43lo que es colap
00:50:44¿no?
00:50:44pero no podemos utilizar
00:50:46algunos datos
00:50:47que usted tal vez
00:50:48nos ha mostrado
00:50:49por ejemplo
00:50:50yo he visto
00:50:50de que usted tenía
00:50:52en sus
00:50:53en sus diapositivas
00:50:54en lo que nos estaba presentando
00:50:56de
00:50:56o sea
00:50:58que ya estaba programado
00:50:59¿no?
00:50:59usted ponía
00:51:00digamos
00:51:00una cantidad
00:51:02o variaba alguna cantidad
00:51:03y le aparecía un producto
00:51:05y nosotros
00:51:06no hemos aprendido eso
00:51:07y
00:51:08o sea
00:51:08ya
00:51:11ya
00:51:11ya
00:51:11les voy a pasar
00:51:14ya
00:51:14les voy a pasar
00:51:15un ejemplo
00:51:16para que ustedes
00:51:18con ese ejemplo
00:51:19puedan ir haciendo
00:51:20ya
00:51:20tengo
00:51:20ahorita no tengo
00:51:21de hecho les muestro ahorita
00:51:23ahora mismo
00:51:23si
00:51:25si tienen
00:51:25diez minutos más
00:51:26o prefieren
00:51:28el día
00:51:29sí doctora
00:51:30sí doctora
00:51:31por favor
00:51:32diez minutos más
00:51:34nos pasamos diez minutos
00:51:36esta vez
00:51:36vamos a hacer el esfuerzo
00:51:38de hacer diez minutos más
00:51:39solo porque ustedes
00:51:41lo están solicitando
00:51:42¿no?
00:51:43y
00:51:43gracias
00:51:44gracias
00:51:44sí doctora
00:51:46muchas gracias
00:51:47más bien
00:51:47ya a ver
00:51:48vamos a
00:51:49les voy a mostrar aquí
00:51:50voy a
00:51:53mostrarles aquí
00:51:54el análisis
00:51:55cuadratario de datos
00:51:56lo voy a buscar aquí
00:52:12primero porque
00:52:12tengo muchos
00:52:14muchos notebooks
00:52:17y voy a ver
00:52:18cuál sería el más
00:52:19adecuado para
00:52:19para ahora
00:52:22para pasárselos ahora
00:52:24como la anterior clase
00:52:40fue más
00:52:40teórico también
00:52:43¿no?
00:52:43para que ustedes puedan entender
00:52:44la importancia de análisis
00:52:45exploratorio
00:52:47no se hizo un notebook
00:52:49pero en este caso
00:52:51ya se vio la necesidad
00:52:52de hacer un notebook
00:52:53¿no?
00:52:53entonces ya
00:52:54por eso vamos a
00:52:56vamos a ver aquí
00:52:58eh
00:52:59no sé
00:53:01vamos
00:53:02el
00:53:05diplomado
00:53:06pero vamos a ver
00:53:08cuál es
00:53:09esta creo que es
00:53:10esta
00:53:11¿no?
00:53:23un momento
00:53:24aquí
00:53:38análisis exploratorio
00:53:40de datos
00:53:40pero a ver
00:53:43vamos a ver
00:53:43cómo
00:53:43voy a subirlo
00:53:46al
00:53:46al
00:53:48drive
00:53:49solo que
00:53:52este de aquí
00:53:53es un ejemplo
00:53:54no sé
00:53:56de
00:53:56de qué
00:53:57ejemplo
00:53:57es
00:53:57pero
00:53:57lo voy a abrir
00:53:58y ahí lo voy a ir
00:53:59modificando ya
00:54:00delante de ustedes
00:54:01ya
00:54:10voy a subir aquí
00:54:12ah
00:54:20porque
00:54:20estoy con otra cuenta
00:54:23tengo que ir a mi cuenta
00:54:24aquí
00:54:26nuevo
00:54:33subir archivo
00:54:34subir archivo
00:54:38y ya
00:54:48vamos a
00:54:49este de aquí
00:54:50este de aquí
00:54:52es un
00:54:52es un notebook
00:54:55que lo he utilizado
00:54:56en
00:54:57en otro
00:54:59diplomado
00:55:00pero era
00:55:00específico
00:55:01del
00:55:01de
00:55:03para ingenieros
00:55:04¿no?
00:55:04del área
00:55:05entonces como era del área
00:55:06entonces se les dio
00:55:07directamente
00:55:10¿no?
00:55:11vamos a colocar aquí
00:55:12era la sesión
00:55:14sesión
00:55:16tres
00:55:18¿no?
00:55:18en nuestro caso
00:55:19era sesión tres
00:55:20ya voy a colocar aquí
00:55:22ese notebook
00:55:23conceptos de análisis
00:55:25exploratorio
00:55:25y vamos a ir viendo aquí
00:55:27a ver
00:55:29que
00:55:30tengo otros ejemplos
00:55:34también
00:55:34¿ya?
00:55:35a la siguiente semana
00:55:36les puedo
00:55:37esto por ejemplo
00:55:39es del año
00:55:402023
00:55:40¿no?
00:55:42a ver
00:55:43ya
00:55:47ya
00:55:53por ejemplo
00:55:54todo lo que hemos
00:55:56hecho en las
00:55:57diapositivas
00:55:58está aquí
00:55:59en este notebook
00:56:00ustedes pueden
00:56:01ejecutar
00:56:02ya
00:56:03pero aquí
00:56:08lo que veo
00:56:08está lo básico
00:56:09para la siguiente
00:56:11se los voy a traer
00:56:12un poco más
00:56:12completo
00:56:13pero
00:56:13pero vayan
00:56:14probando
00:56:14con este notebook
00:56:16para
00:56:17para que vayan
00:56:20viendo
00:56:20¿ya?
00:56:21todo lo que hemos
00:56:22hecho
00:56:22allá
00:56:23está aquí
00:56:23la data
00:56:24la data
00:56:24también
00:56:25está ahí
00:56:25¿verdad?
00:56:26la data
00:56:27miren
00:56:27vean aquí
00:56:28dice
00:56:28people
00:56:28analytics
00:56:29excel
00:56:30¿se acuerdan
00:56:30que nosotros
00:56:31hemos utilizado
00:56:31una data
00:56:32que es de
00:56:32github?
00:56:34github
00:56:35hemos utilizado
00:56:36una data
00:56:37que se llamaba
00:56:38déjenme ver
00:56:39que se llamaba
00:56:40en español
00:56:41yo lo había traducido
00:56:42¿se acuerdan?
00:56:43y estaba aquí
00:56:44esta de aquí
00:56:45data c
00:56:46ah no
00:56:47esta no es
00:56:47no
00:56:47es esta
00:56:48no la he traducido
00:56:49ah
00:56:50es esta
00:56:50es
00:56:50people
00:56:51analytics
00:56:52excel
00:56:53español
00:56:54¿no?
00:56:55es esta
00:56:56¿ya?
00:56:58eh
00:56:59entonces
00:57:00lo que
00:57:00hacemos
00:57:01es
00:57:02aquí
00:57:03copiar
00:57:04copiar
00:57:05dirección
00:57:06del link
00:57:07y colocamos
00:57:08aquí
00:57:09directamente
00:57:11¿no?
00:57:13eh
00:57:14ustedes
00:57:14lo que tendrían
00:57:16que hacer
00:57:17es
00:57:17mmm
00:57:19colocar
00:57:20su dataset
00:57:20en
00:57:22en el
00:57:23drive
00:57:23o en todo
00:57:24caso
00:57:25eh
00:57:26colocar su dataset
00:57:28en un
00:57:29github
00:57:29en algún
00:57:30lugar
00:57:30¿no?
00:57:31en el caso
00:57:32de que sea
00:57:32en su drive
00:57:33por ejemplo
00:57:34aquí ¿no?
00:57:34lo va a guardar
00:57:35en el drive
00:57:36está montando
00:57:37el drive
00:57:37este código
00:57:38ya lo hace
00:57:38¿no?
00:57:39ya
00:57:48aquí
00:57:49estoy haciendo
00:57:50el ejemplo
00:57:51directamente
00:57:51a través
00:57:52de un link
00:57:53que ya
00:57:53está
00:57:53publicado
00:57:55aquí en internet
00:57:55¿ya?
00:57:56pero de ustedes
00:57:57no está publicado
00:57:58suponiendo
00:57:59¿no?
00:57:59está en un drive
00:58:00digamos que está
00:58:02aquí mismo
00:58:02¿no?
00:58:03voy a crear
00:58:04aquí
00:58:05un
00:58:05una carpeta
00:58:07que diga
00:58:07dataset
00:58:08y suben
00:58:11aquí
00:58:12su dataset
00:58:12¿no?
00:58:14vamos a subir
00:58:15aquí
00:58:15el dataset
00:58:16archivo
00:58:20subimos
00:58:20el dataset
00:58:21ejercicio
00:58:28este de aquí
00:58:29¿no?
00:58:30pero este de aquí
00:58:31no está
00:58:31en
00:58:32en español
00:58:33ya vamos a subir
00:58:35ese que está
00:58:35en inglés
00:58:36en todo caso
00:58:39tendrían que bajar
00:58:40esta
00:58:40este archivo
00:58:42que está
00:58:43en español
00:58:43ya
00:58:45entonces
00:58:47en este caso
00:58:48aquí
00:58:48hay un error
00:58:50¿no?
00:58:52vamos a
00:58:53ver aquí
00:58:56vamos a hacer
00:59:05unos pasos
00:59:06así
00:59:06más
00:59:06interesante
00:59:07vamos a hacerlo
00:59:09bien organizadito
00:59:10ya
00:59:10primero
00:59:11vamos a
00:59:13vamos a
00:59:17conectar
00:59:19montar
00:59:21mejor dicho
00:59:22vamos a
00:59:23montar
00:59:24el drive
00:59:25vamos a
00:59:29montar
00:59:29el google drive
00:59:29¿ya?
00:59:31y aquí
00:59:31ponemos el código
00:59:32para montar
00:59:33el google drive
00:59:33vamos a
00:59:35aquí
00:59:37ya lo tengo
00:59:37listo
00:59:38para no estar
00:59:38escribiendo
00:59:39uno por uno
00:59:39ya
00:59:46aquí
00:59:49vamos
00:59:50ya
00:59:53voy a montar
01:00:08aquí
01:00:09está abriendo
01:00:09el notebook
01:00:11aquí
01:00:11voy a copiar
01:00:13y pegar
01:00:14así
01:00:14paso a paso
01:00:15a ver
01:00:17ay no
01:00:17ya se me está
01:00:18llena la hora
01:00:19ya
01:00:32este
01:00:34este
01:00:34este
01:00:34este
01:00:34este
01:00:34este
01:00:34este
01:00:34es el código
01:00:35general
01:00:36que
01:00:36no necesita
01:00:37modificar
01:00:38nada
01:00:38esta
01:00:40librería
01:00:41de
01:00:41google
01:00:42colab
01:00:42ya
01:00:43te
01:00:44monta
01:00:44todo
01:00:46tu
01:00:46carpeta
01:00:46drive
01:00:47todo
01:00:47tu drive
01:00:47de tu
01:00:48de tu
01:00:49google
01:00:49drive
01:00:50ya
01:00:50entonces
01:00:50solamente
01:00:50ejecutar
01:00:51esto
01:00:51y ya
01:00:53te lo
01:00:53monta
01:00:53listo
01:00:54ya
01:00:55una vez
01:00:56montado
01:00:57nosotros
01:00:59esto
01:01:00lo
01:01:00borramos
01:01:01aquí
01:01:02leemos
01:01:05los datos
01:01:05ya lo
01:01:08ha montado
01:01:09cuando lo
01:01:09monta
01:01:10vamos aquí
01:01:11a esta
01:01:11carpeta
01:01:12a este
01:01:13este botón
01:01:14de aquí
01:01:14y ahí
01:01:16vamos a ver
01:01:17dónde está
01:01:18ubicado
01:01:18nuestro
01:01:19dataset
01:01:20por ejemplo
01:01:21mi dataset
01:01:22debe estar
01:01:23aquí
01:01:23en
01:01:24my drive
01:01:24y
01:01:26recuerden
01:01:27que
01:01:27estamos
01:01:28en
01:01:29a ver
01:01:36cuál
01:01:37era
01:01:38slide
01:01:42diplomado
01:01:43vamos
01:01:44aquí
01:01:45slide
01:01:45diplomado
01:01:46en mi
01:01:47caso
01:01:48en su
01:01:48caso
01:01:48no sé
01:01:49cómo
01:01:49será
01:01:49ustedes
01:01:49tienen
01:01:50que
01:01:50verificar
01:01:51en qué
01:01:51dirección
01:01:54ya
01:02:05está
01:02:06demorando
01:02:06ahora
01:02:07
01:02:08no
01:02:08slide
01:02:08aquí
01:02:10en esta
01:02:10carpeta
01:02:11y en la
01:02:11carpeta
01:02:12dataset
01:02:12en la
01:02:14carpeta
01:02:14dataset
01:02:14aquí
01:02:15tenemos
01:02:15el
01:02:16archivo
01:02:16mi
01:02:16dataset
01:02:16entonces
01:02:17aquí
01:02:18hago
01:02:18copiar
01:02:18path
01:02:19o sea
01:02:20copiar
01:02:20el camino
01:02:21y
01:02:22coloco
01:02:22aquí
01:02:22mi
01:02:27dataset
01:02:27ya
01:02:28esto
01:02:30es en el
01:02:31caso
01:02:31de que
01:02:32sea
01:02:32mi
01:02:32archivo
01:02:33en
01:02:33excel
01:02:33ya
01:02:34porque
01:02:35aquí
01:02:36está
01:02:36utilizando
01:02:37la
01:02:37librería
01:02:37pandas
01:02:38y para
01:02:39leer
01:02:40un
01:02:40archivo
01:02:40en
01:02:40excel
01:02:41en el
01:02:41caso
01:02:41de que
01:02:41sea
01:02:42csv
01:02:43entonces
01:02:43tendrían
01:02:44que
01:02:44colocar
01:02:44aquí
01:02:44read
01:02:45csv
01:02:46o
01:02:46si
01:02:46no
01:02:47dígan
01:02:47leer
01:02:47al
01:02:47chat
01:02:47ypt
01:02:48cambiar
01:02:50este
01:02:51código
01:02:51para
01:02:51leer
01:02:52archivo
01:02:52csv
01:02:53y les
01:02:54va a
01:02:54mostrar
01:02:55el
01:02:55código
01:02:55ya
01:02:56cualquier
01:02:57paso
01:02:57cualquier
01:02:58cosa
01:02:58h.ypt
01:02:59él les
01:03:00va
01:03:00ya
01:03:01ya lo
01:03:01leyó
01:03:01como sé
01:03:02que lo
01:03:02leyó
01:03:02vamos
01:03:03a este
01:03:03data frame
01:03:04datos
01:03:04voy a
01:03:06adicionar
01:03:06más un
01:03:07código
01:03:07solo
01:03:07para
01:03:08ver
01:03:08ya
01:03:08datos
01:03:10y aquí
01:03:10ya
01:03:12leyó
01:03:12todos
01:03:12mis
01:03:12datos
01:03:13no
01:03:14ahí
01:03:16están
01:03:16mis
01:03:16datos
01:03:16son
01:03:1730
01:03:17yo
01:03:19puedo
01:03:19decir
01:03:19también
01:03:20que
01:03:20solamente
01:03:20se
01:03:20visualice
01:03:22los
01:03:22cinco
01:03:23los
01:03:24cinco
01:03:24primeros
01:03:25o los
01:03:25tres
01:03:26primeros
01:03:27los tres
01:03:27primeros
01:03:28registros
01:03:28uno
01:03:29dos
01:03:29tres
01:03:30para que
01:03:30esté
01:03:30más
01:03:31cortito
01:03:31ya
01:03:32yo
01:03:33puedo
01:03:34decir
01:03:34de acuerdo
01:03:38a lo que yo
01:03:39quiera
01:03:39yo puedo
01:03:39hacer
01:03:40con este
01:03:40data frame
01:03:41el data frame
01:03:43en este
01:03:43caso sería
01:03:44la variable
01:03:45datos
01:03:45ya
01:03:46porque
01:03:46en datos
01:03:48he guardado
01:03:51mis datos
01:03:54del
01:03:54exe
01:03:54entonces
01:03:55todo a partir
01:03:56de ahora
01:03:56voy a
01:03:57voy a trabajar
01:03:57con esta variable
01:03:58de datos
01:03:59entonces
01:04:00ese nombre
01:04:00también
01:04:01ustedes colocan
01:04:03de la
01:04:04de la manera
01:04:05que ustedes
01:04:05entiendan
01:04:06mejor
01:04:06entonces
01:04:08aquí puedo
01:04:08colocar
01:04:09no sé
01:04:09lo que yo
01:04:13quisiera
01:04:13saber
01:04:13por ejemplo
01:04:14cuáles son
01:04:15las columnas
01:04:16veo que
01:04:17aquí
01:04:18datos
01:04:18tiene
01:04:18n
01:04:19estado
01:04:19civil
01:04:20grado
01:04:20de instrucción
01:04:21número
01:04:21de hijos
01:04:22salario
01:04:22y así
01:04:23por delante
01:04:24después
01:04:26aquí
01:04:28hay un código
01:04:29que calcula
01:04:32las frecuencias
01:04:33lo que les había mostrado
01:04:36ustedes pueden ir
01:04:37al
01:04:39al
01:04:40chayepet
01:04:41y decirle
01:04:43bueno
01:04:43créame
01:04:47mejorame
01:04:47este código
01:04:48se pueden decir
01:04:51los que no saben
01:04:51programar
01:04:52les recomiendo
01:04:54que usen
01:04:54el chayepet
01:04:55para programar
01:04:57ya
01:04:57vamos a ver
01:05:04organizar
01:05:05organizar
01:05:05este código
01:05:06visualizar
01:05:08el
01:05:09visualizar
01:05:10el resultado
01:05:13mejor
01:05:15a ver
01:05:16cómo lo va a mejorar
01:05:17pendiente
01:05:21código
01:05:21el otro código
01:05:23estaba hecho
01:05:23sin
01:05:24chayepet
01:05:25porque
01:05:25en esas
01:05:27veces
01:05:28todavía no había
01:05:29chayepet
01:05:30pero ahora
01:05:31ustedes pueden
01:05:32mejorar el código
01:05:33este código
01:05:34de aquí
01:05:35era
01:05:35básico
01:05:36ahora
01:05:38ustedes
01:05:38lo mismo
01:05:39pueden mejorar
01:05:40pueden hacer
01:05:41que sea
01:05:41interactivo
01:05:42aquí
01:05:43crea
01:05:43una
01:05:44ya
01:05:47a ver
01:05:48qué dice
01:05:49José Luis
01:05:49hay
01:05:50formulación
01:05:51de la actividad
01:05:51final
01:05:52dice
01:05:52buena
01:05:54pregunta
01:05:54
01:05:56
01:05:56
01:05:56
01:05:57ya
01:06:02vamos a ver
01:06:03cómo lo ha mejorado
01:06:04con el
01:06:05chayepet
01:06:06yo tengo el
01:06:09ejemplo
01:06:09y tengo el
01:06:09mejorado
01:06:10por el
01:06:10chayepet
01:06:11lo ha hecho
01:06:12lo mismo
01:06:12es lo mismo
01:06:14ha votado
01:06:15lo mismo
01:06:16yo podría
01:06:18decirle que me
01:06:19voté
01:06:20el resultado
01:06:21en un
01:06:21data frame
01:06:22resultado
01:06:27en
01:06:27data frame
01:06:29para
01:06:30visualizar
01:06:32datos
01:06:33el
01:06:39trabajo
01:06:40les voy a
01:06:41pedir que
01:06:41ustedes
01:06:42presenten
01:06:43todos los
01:06:44pasos que
01:06:44estamos
01:06:45haciendo
01:06:45y hasta
01:06:47los
01:06:47resultados
01:06:48que ustedes
01:06:49van a
01:06:49obtener
01:06:49todo
01:06:50en un
01:06:50formato
01:06:51de
01:06:51póster
01:06:52ya
01:06:54póster
01:06:56póster
01:06:59un
01:07:02póster
01:07:02es así
01:07:03póster
01:07:09académico
01:07:09de esta
01:07:10manera
01:07:11ya
01:07:12generalmente
01:07:12los
01:07:13trabajos
01:07:13de
01:07:13investigación
01:07:14muchas
01:07:15veces
01:07:16lo presentamos
01:07:17de esta
01:07:17manera
01:07:17como
01:07:19nuestro
01:07:19caso
01:07:19es como
01:07:20un
01:07:20trabajo
01:07:20de
01:07:20investigación
01:07:21entonces
01:07:21yo les
01:07:22recomendaría
01:07:23les voy a
01:07:24pedir que
01:07:25ustedes
01:07:25hagan
01:07:25un
01:07:26póster
01:07:26para su
01:07:27trabajo
01:07:27final
01:07:27donde
01:07:29básicamente
01:07:29en el
01:07:30póster
01:07:30tiene
01:07:32lo que
01:07:32es
01:07:32introducción
01:07:33objetivo
01:07:34título
01:07:34todo
01:07:35algo así
01:07:36ya
01:07:38el título
01:07:40los autores
01:07:41tiene una
01:07:42primera parte
01:07:43donde está
01:07:43la
01:07:43el resumen
01:07:45tiene una
01:07:46parte que
01:07:47tiene la
01:07:47introducción
01:07:48todo bien
01:07:49resumidito
01:07:49los objetivos
01:07:51el método
01:07:52que han
01:07:52utilizado
01:07:53el método
01:07:55o la
01:07:55metodología
01:07:56aquí
01:07:58los resultados
01:07:58conclusiones
01:08:02y
01:08:02referencias
01:08:03ya
01:08:04entonces
01:08:04este va a ser
01:08:06el formato
01:08:07de presentación
01:08:08de cada uno
01:08:09de ustedes
01:08:09entonces al momento
01:08:10de exponer
01:08:11ustedes solo
01:08:11van a sacar
01:08:12su póster
01:08:12y van a
01:08:13presentar
01:08:14eso sería
01:08:18el
01:08:18el
01:08:19la formulación
01:08:21José Luis
01:08:22ya
01:08:22lo voy a
01:08:23colocar
01:08:24en
01:08:24medral
01:08:25de manera
01:08:26más formal
01:08:26para que
01:08:28todos lo puedan
01:08:28ver
01:08:29ya
01:08:32doctora
01:08:33entonces
01:08:33este es un
01:08:33trabajo grupal
01:08:34no es así
01:08:34ese póster
01:08:35es todo el
01:08:36grupo
01:08:36presenta
01:08:36un solo
01:08:37con nuestro
01:08:39dataset
01:08:39no es así
01:08:40
01:08:41ya
01:08:43entonces
01:08:43vean este
01:08:45notebook
01:08:45que es un
01:08:48notebook
01:08:48inicial
01:08:48voy a buscar
01:08:50los otros
01:08:50notebooks que tengo
01:08:51también como
01:08:52ejemplo
01:08:53por ejemplo
01:08:53para limpieza
01:08:54de datos
01:08:55vacíos
01:08:56y que les va
01:08:58a servir
01:08:59solo eso
01:09:02no sé si hay
01:09:03otra pregunta
01:09:04doctora
01:09:07disculpe
01:09:08como última
01:09:10situación
01:09:10te quisiera pedir
01:09:12de que usted
01:09:12tal vez nos pueda
01:09:13digamos
01:09:14enseñar
01:09:15de un
01:09:16ahorita no
01:09:17ya nos ha mostrado
01:09:17de un dataset
01:09:18claro
01:09:19pero sería bueno
01:09:20de que nos muestre
01:09:22de cómo lo vamos a ir
01:09:23desarrollando
01:09:24todo parte por parte
01:09:25digamos
01:09:26he visto también
01:09:29unas partes
01:09:30donde usted
01:09:30estaba programando
01:09:32y tal vez
01:09:32nos podría mostrar
01:09:33esas partes
01:09:34porque no conocemos
01:09:35porque
01:09:36me gustaría
01:09:38y me encantaría
01:09:39porque yo lo he visto
01:09:40y ha sido
01:09:41bien bonito
01:09:42lo que usted
01:09:43o sea
01:09:43programación de datos
01:09:44usted programaba
01:09:45un dato
01:09:46y ya le salía
01:09:47ya al final
01:09:48un resultado
01:09:49y tal vez
01:09:51nosotros
01:09:51quisiéramos
01:09:52hacer algo así
01:09:52algo predictivo
01:09:53con nuestro dataset
01:09:55o la mayoría
01:09:57de los compañeros
01:09:58quisieran aprender
01:09:59algunas cosas
01:10:00que tal vez
01:10:00no conocemos
01:10:01pero que usted
01:10:02nos enseñe
01:10:03desde lo más simple
01:10:04hasta lo más complejo
01:10:06yo sé que
01:10:07a este tiempo
01:10:09no tenemos
01:10:10mucho tiempo
01:10:11tal vez
01:10:11podríamos
01:10:12podríamos
01:10:13correr
01:10:15pero
01:10:16digamos
01:10:17usted
01:10:17demostrándonos
01:10:18los pasos
01:10:20que debemos
01:10:21seguir
01:10:21para llegar
01:10:22al punto
01:10:22que queremos
01:10:23llegar
01:10:23porque como usted
01:10:24dice
01:10:25es big data
01:10:26y la big data
01:10:27abarca bastante
01:10:28pero
01:10:29hasta ahorita
01:10:30lo que hemos visto
01:10:31usted nos ha mostrado
01:10:32diapositivas
01:10:33y como nosotros
01:10:34no conocemos
01:10:35no somos
01:10:36de ingeniería
01:10:36de sistemas
01:10:37tal vez
01:10:37no podemos
01:10:38realizar eso
01:10:39tal vez
01:10:40estamos con la duda
01:10:41y no podemos
01:10:42llegar al punto
01:10:43al que usted
01:10:43ha llegado
01:10:44¿no doctora?
01:10:44esa sería
01:10:45mi duda
01:10:46más que todo
01:10:47y la duda
01:10:48también
01:10:48de algunos compañeros
01:10:49porque yo sé
01:10:50de que
01:10:50no soy el único
01:10:52¿no?
01:10:52y además
01:10:53hay algunas personas
01:10:54que no se familiarizan
01:10:55mucho con estos temas
01:10:56sí, sí, sí
01:10:58excelente
01:10:59buena
01:10:59buena acotación
01:11:00yo sé
01:11:00ya
01:11:01el día
01:11:02miércoles
01:11:03que es nuestra próxima clase
01:11:04hacemos
01:11:04con el mismo dataset
01:11:06desde el principio
01:11:07hasta el final
01:11:08y con código
01:11:09así como ahora
01:11:11pero hacemos
01:11:12del principio
01:11:12hasta el final
01:11:13o sea
01:11:13desde el análisis
01:11:14exploratorio
01:11:15hasta aquí
01:11:17vamos a hacer
01:11:18con este mismo
01:11:19ejemplo de aquí
01:11:19vamos a llegar
01:11:20hasta aquí
01:11:21pero haciendo
01:11:22también
01:11:22adicionalmente
01:11:24el análisis
01:11:24exploratorio
01:11:25¿ya?
01:11:26sí doctora
01:11:27muchas gracias
01:11:27eso sería todo
01:11:28entonces el miércoles
01:11:29hacemos eso
01:11:30nos vemos
01:11:32el miércoles
01:11:33muchas gracias
01:11:34para el miércoles
01:11:35entonces estudien
01:11:36la parte de análisis
01:11:37exploratorio
01:11:37para acelerar esto
01:11:39chao
01:11:40ya
01:11:40muchas gracias
01:11:42hasta el miércoles
01:11:44ya
01:11:45chao
01:11:47chao
01:11:47chao
01:11:48chao
01:12:09chao
01:12:10chao
01:12:10chao
01:12:11chao
01:12:11chao
01:12:11chao
01:12:12Gracias.
Be the first to comment
Add your comment

Recommended