Fundamentos para el machine learning no supervisado en Ciencias Sociales

Curso dirigido a estudiantes de posgrado (maestría o doctorado), estudiantes avanzados, graduados/as de licenciaturas, docentes e investigadores de disciplinas de las Ciencias Sociales y Humanidades. Se requieren conocimientos básicos de estadística. Es deseable aunque no excluyente tener conocimientos básicos de programación en R y/o Python.

Docentes: Dra. Anabella Abarzú a Cutroni, responsable del curso (Investigadora asistente, INCIHUSA, CONICET ) y Lic. Micaela Lisboa (CPA, INCIHUSA, CONICET).

Modalidad: presencial

Fecha de realización: del 1 al 11 de junio de 2026

Fecha de pre-inscripción: a confirmar

Duración: 75hs

Arancel: a confirmar

Resumen

El presente curso pretende sintetizar conocimientos estadísticos y habilidades propias de la investigación en Ciencias Sociales como fundamento imprescindible para la aplicación de modelos de machine learning no supervisados. En este sentido es sobre todo un curso metodológico que propone un camino riguroso aunque iterativo para la aplicación de estos modelos. Los contenidos del curso están estructurados en torno a problemas de clasificación con ejemplos propios de las Ciencias Sociales y privilegian conocer los fundamentos de las técnicas para la aplicación parsimoniosa de las mismas y la adquisición de capacidades analíticas de parte de los/las estudiantes. Se busca alcanzar de manera integral una formación tanto teórica como práctica. El curso está dividido en 5 módulos y cuenta con bibliografía específica para el desarrollo de cada uno de los mismos. Durante el dictado del mismo será n proporcionados notebooks con el código necesario para las actividades prácticas.

Objetivos 
General: Adquirir fundamentos teóricos y estadísticos para la introducción al machine learning no supervisado para la Ciencias Sociales.
Específicos:

1) Converger formas de análisis estadístico y de trabajo de investigación propios de las ciencias sociales con conceptos y formas de trabajo propios del campo del machine learning;

2) Aprender técnicas
estadísticas orientadas a problemas de clasificación;

3) Aprender técnicas de reducción de la dimensionalidad para el modelado de datos multidimensionales;

4) Incorporar a las rutinas de trabajo de investigación la utilización de lenguaje de programación orientado a las Ciencias Sociales Computacionales (R y Python).

Programa

Módulo 1: El problema de la clasificación social. Aproximaciones contemporáneas de las ciencias sociales. La datificación de las sociedades. Cómo trabajar con datos: recaudos científicos y limitaciones materiales. Metadatos. La ciencia de datos, el machine learning y las ciencias sociales computacionales como campos de estudio.
Docente: Dra. Anabella Abarzúa Cutroni

Módulo 2: Primera aproximación a los datos. Análisis descriptivo univariado, bivariado. Limpieza y validación de bases de datos. Introducción al análisis
multivariado: análisis descriptivo multivariado, distribución multivariada, vectores de observaciones y variables. Matrices de varianza y covarianza. Medidas de distancia. Datos centrados y estandarizados. Definición y efectos de los datos atípicos.
Docente: Lic. Micaela Lisboa

Módulo 3: Introducción al machine learning. Machine learning e Inteligencia artificial, conceptos básicos. Machine learning no supervisado. Problemas
de clasificación. Método de trabajo aplicado a problemas de ciencias sociales.
Docente: Dra. Anabella Abarzúa Cutroni

Módulo 4: Clasificación en el machine learning no supervisado. Modelos de clasificación en el machine learning no supervisado: métodos jerárquicos y métodos de partición. Criterios formales para la determinación del número óptimo de clusters.
Docente: Dra. Anabella Abarzúa Cutroni
Validación del modelo. Homogeneidad intra-cluster, hetorogeneidad entre clusters.
Docente: Lic. Micaela Lisboa

Módulo 5: Reducción de la dimensionalidad. Técnicas de reducción de la dimensionalidad. Análisis de componentes principales (PCA): fundamentos,
valores propios y vectores propios, proporción de variabilidad explicada, métricas de evaluación e interpretación, visualización de componentes.
Docente: Lic. Micaela Lisboa
Aná lisis de correspondencias (AC) y análisis de correspondencias múltiples (ACM): fundamentos, métricas de evaluación e interpretación, nube de individuos y nube de categorías.
Docente: Dra. Anabella Abarzúa Cutroni

Modo de evaluación:

El curso se evaluará en su conjunto mediante: 1) La elaboración de un cuestionario individual global final sobre los contenidos del curso y 2) la elaboración de un trabajo final en grupo donde se desarrollará de manera práctica el modelado de un problema de clasificación utilizando R o Phyton. La nota final será el promedio de estas dos instancias de evaluación, para aprobar el curso es necesario alcanzar al menos una nota de 6 (60 %).