Fundamentos para el machine learning no supervisado en Ciencias Sociales
Curso dirigido a estudiantes de posgrado (maestría o doctorado), estudiantes avanzados, graduados/as de licenciaturas, docentes e investigadores de disciplinas de las Ciencias Sociales y Humanidades. Se requieren conocimientos básicos de estadística. Es deseable aunque no excluyente tener conocimientos básicos de programación en R y/o Python.
Docentes: Dra. Anabella Abarzú a Cutroni, responsable del curso (Investigadora asistente, INCIHUSA, CONICET ) y Lic. Micaela Lisboa (CPA, INCIHUSA, CONICET).
Modalidad: presencial
Fecha de realización: del 1 al 11 de junio de 2026
Fecha de pre-inscripción: a confirmar
Duración: 75hs
Arancel: a confirmar
Resumen
El presente curso pretende sintetizar conocimientos estadísticos y habilidades propias de la investigación en Ciencias Sociales como fundamento imprescindible para la aplicación de modelos de machine learning no supervisados. En este sentido es sobre todo un curso metodológico que propone un camino riguroso aunque iterativo para la aplicación de estos modelos. Los contenidos del curso están estructurados en torno a problemas de clasificación con ejemplos propios de las Ciencias Sociales y privilegian conocer los fundamentos de las técnicas para la aplicación parsimoniosa de las mismas y la adquisición de capacidades analíticas de parte de los/las estudiantes. Se busca alcanzar de manera integral una formación tanto teórica como práctica. El curso está dividido en 5 módulos y cuenta con bibliografía específica para el desarrollo de cada uno de los mismos. Durante el dictado del mismo será n proporcionados notebooks con el código necesario para las actividades prácticas.
Objetivos
General: Adquirir fundamentos teóricos y estadísticos para la introducción al machine learning no supervisado para la Ciencias Sociales.
Específicos:
1) Converger formas de análisis estadístico y de trabajo de investigación propios de las ciencias sociales con conceptos y formas de trabajo propios del campo del machine learning;
2) Aprender técnicas
estadísticas orientadas a problemas de clasificación;
3) Aprender técnicas de reducción de la dimensionalidad para el modelado de datos multidimensionales;
4) Incorporar a las rutinas de trabajo de investigación la utilización de lenguaje de programación orientado a las Ciencias Sociales Computacionales (R y Python).
Programa
Módulo 1: El problema de la clasificación social. Aproximaciones contemporáneas de las ciencias sociales. La datificación de las sociedades. Cómo trabajar con datos: recaudos científicos y limitaciones materiales. Metadatos. La ciencia de datos, el machine learning y las ciencias sociales computacionales como campos de estudio.
Docente: Dra. Anabella Abarzúa Cutroni
Módulo 2: Primera aproximación a los datos. Análisis descriptivo univariado, bivariado. Limpieza y validación de bases de datos. Introducción al análisis
multivariado: análisis descriptivo multivariado, distribución multivariada, vectores de observaciones y variables. Matrices de varianza y covarianza. Medidas de distancia. Datos centrados y estandarizados. Definición y efectos de los datos atípicos.
Docente: Lic. Micaela Lisboa
Módulo 3: Introducción al machine learning. Machine learning e Inteligencia artificial, conceptos básicos. Machine learning no supervisado. Problemas
de clasificación. Método de trabajo aplicado a problemas de ciencias sociales.
Docente: Dra. Anabella Abarzúa Cutroni
Módulo 4: Clasificación en el machine learning no supervisado. Modelos de clasificación en el machine learning no supervisado: métodos jerárquicos y métodos de partición. Criterios formales para la determinación del número óptimo de clusters.
Docente: Dra. Anabella Abarzúa Cutroni
Validación del modelo. Homogeneidad intra-cluster, hetorogeneidad entre clusters.
Docente: Lic. Micaela Lisboa
Módulo 5: Reducción de la dimensionalidad. Técnicas de reducción de la dimensionalidad. Análisis de componentes principales (PCA): fundamentos,
valores propios y vectores propios, proporción de variabilidad explicada, métricas de evaluación e interpretación, visualización de componentes.
Docente: Lic. Micaela Lisboa
Aná lisis de correspondencias (AC) y análisis de correspondencias múltiples (ACM): fundamentos, métricas de evaluación e interpretación, nube de individuos y nube de categorías.
Docente: Dra. Anabella Abarzúa Cutroni
Modo de evaluación:
El curso se evaluará en su conjunto mediante: 1) La elaboración de un cuestionario individual global final sobre los contenidos del curso y 2) la elaboración de un trabajo final en grupo donde se desarrollará de manera práctica el modelado de un problema de clasificación utilizando R o Phyton. La nota final será el promedio de estas dos instancias de evaluación, para aprobar el curso es necesario alcanzar al menos una nota de 6 (60 %).