Fundamentos para el machine learning no supervisado en Ciencias S

Fundamentos para el machine learning no supervisado en Ciencias Sociales

Curso dirigido a estudiantes de posgrado (maestría o doctorado), estudiantes avanzados, graduados/as de licenciaturas, docentes e investigadores de disciplinas de las Ciencias Sociales y Humanidades. Se requieren conocimientos básicos de estadística. Es deseable aunque no excluyente tener conocimientos básicos de programación en R y/o Python.

Docentes: Dra. Anabella Abarzú a Cutroni, responsable del curso (Investigadora asistente, INCIHUSA, CONICET ) y Lic. Micaela Lisboa (CPA, INCIHUSA, CONICET).

Modalidad: virtual

Fecha de realización: del 16 al 26 de junio de 2026

Fecha de pre-inscripción: hasta el 11 de junio de 2026

Horarios: de lunes a viernes de 8 a 13h

Duración: 75hs

Arancel: $ 63.200 (pesos Arg.), u$s 120 (dólares)

Formulario de pre-inscripción

Resumen

El presente curso pretende sintetizar conocimientos estadísticos y habilidades propias de la investigación en Ciencias Sociales como fundamento imprescindible para la aplicación de modelos de machine learning no supervisados. En este sentido es sobre todo un curso metodológico que propone un camino riguroso aunque iterativo para la aplicación de estos modelos. Los contenidos del curso están estructurados en torno a problemas de clasificación con ejemplos propios de las Ciencias Sociales y privilegian conocer los fundamentos de las técnicas para la aplicación parsimoniosa de las mismas y la adquisición de capacidades analíticas de parte de los/las estudiantes. Se busca alcanzar de manera integral una formación tanto teórica como práctica. El curso está dividido en 5 módulos y cuenta con bibliografía específica para el desarrollo de cada uno de los mismos. Durante el dictado del mismo será n proporcionados notebooks con el código necesario para las actividades prácticas.

Objetivos
General: Adquirir fundamentos teóricos y estadísticos para la introducción al machine learning no supervisado para la Ciencias Sociales.
Específicos:

1) Converger formas de análisis estadístico y de trabajo de investigación propios de las ciencias sociales con conceptos y formas de trabajo propios del campo del machine learning;

2) Aprender técnicas
estadísticas orientadas a problemas de clasificación;

3) Aprender técnicas de reducción de la dimensionalidad para el modelado de datos multidimensionales;

4) Incorporar a las rutinas de trabajo de investigación la utilización de lenguaje de programación orientado a las Ciencias Sociales Computacionales (R y Python).

Programa

Módulo 1: El problema de la clasificación social. Aproximaciones contemporáneas de las ciencias sociales. La datificación de las sociedades. Cómo trabajar con datos: recaudos científicos y limitaciones materiales. Metadatos. La ciencia de datos, el machine learning y las ciencias sociales computacionales como campos de estudio.
Docente: Dra. Anabella Abarzúa Cutroni

Módulo 2: Primera aproximación a los datos. Análisis descriptivo univariado, bivariado. Limpieza y validación de bases de datos. Introducción al análisis
multivariado: análisis descriptivo multivariado, distribución multivariada, vectores de observaciones y variables. Matrices de varianza y covarianza. Medidas de distancia. Datos centrados y estandarizados. Definición y efectos de los datos atípicos.
Docente: Lic. Micaela Lisboa

Módulo 3: Introducción al machine learning. Machine learning e Inteligencia artificial, conceptos básicos. Machine learning no supervisado. Problemas
de clasificación. Método de trabajo aplicado a problemas de ciencias sociales.
Docente: Dra. Anabella Abarzúa Cutroni

Módulo 4: Clasificación en el machine learning no supervisado. Modelos de clasificación en el machine learning no supervisado: métodos jerárquicos y métodos de partición. Criterios formales para la determinación del número óptimo de clusters.
Docente: Dra. Anabella Abarzúa Cutroni
Validación del modelo. Homogeneidad intra-cluster, hetorogeneidad entre clusters.
Docente: Lic. Micaela Lisboa

Módulo 5: Reducción de la dimensionalidad. Técnicas de reducción de la dimensionalidad. Análisis de componentes principales (PCA): fundamentos,
valores propios y vectores propios, proporción de variabilidad explicada, métricas de evaluación e interpretación, visualización de componentes.
Docente: Lic. Micaela Lisboa
Aná lisis de correspondencias (AC) y análisis de correspondencias múltiples (ACM): fundamentos, métricas de evaluación e interpretación, nube de individuos y nube de categorías.
Docente: Dra. Anabella Abarzúa Cutroni

Modo de evaluación:

El curso se evaluará en su conjunto mediante: 1) La elaboración de un cuestionario individual global final sobre los contenidos del curso y 2) la elaboración de un trabajo final en grupo donde se desarrollará de manera práctica el modelado de un problema de clasificación utilizando R o Phyton. La nota final será el promedio de estas dos instancias de evaluación, para aprobar el curso es necesario alcanzar al menos una nota de 6 (60 %).