🎯 Avanzado · Lección 1

Define el Problema Primero

Antes de escribir una sola línea de código o un solo prompt, la pregunta más importante es: ¿cuál es exactamente el problema que intentas resolver?

En 2018, Amazon descartó un sistema de IA que había desarrollado durante cuatro años para clasificar currículums de candidatos. El sistema penalizaba automáticamente los currículums que incluían la palabra "mujeres" o que provenían de universidades exclusivamente femeninas. El problema no surgió en el entrenamiento del modelo: surgió antes. El equipo definió el objetivo como "encontrar candidatos similares a los que contratamos en los últimos diez años" sin examinar que esos datos históricos reflejaban una industria mayoritariamente masculina. La definición del problema garantizó el resultado discriminatorio.

Por qué la definición lo es todo

El caso de Amazon ilustra una verdad incómoda del desarrollo de IA: un modelo técnicamente sofisticado puede ser un fracaso completo si el problema que resuelve está mal formulado. La IA optimiza exactamente lo que le pides que optimice. Si lo que pides es incorrecto, el resultado será incorrecto con precisión milimétrica.

Definir bien un problema requiere separar tres cosas que a menudo se confunden: el síntoma observable, la causa raíz y el objetivo real. Amazon vio un síntoma (demasiados candidatos para revisar manualmente) y saltó directamente a una solución técnica, sin preguntarse si los datos de contrataciones pasadas eran un proxy válido de calidad o simplemente un reflejo de sesgos históricos.

Principio Fundamental

Un sistema de IA solo puede ser tan bueno como la definición del problema que se le encarga resolver. La ambigüedad en la definición se amplifica, no se reduce, durante el entrenamiento.

El Marco de los Cinco Por Qués

Antes de diseñar cualquier sistema de IA, aplica la técnica de los Cinco Por Qués, originalmente desarrollada por Toyota para análisis de causas raíz. Pregunta "¿por qué?" cinco veces consecutivas sobre el problema que crees que tienes. Cada respuesta revela una capa más profunda hasta llegar al problema real.

Si tu organización quiere usar IA para "mejorar el servicio al cliente", pregunta: ¿por qué el servicio actual es insuficiente? ¿Por qué los tiempos de respuesta son lentos? ¿Por qué hay escasez de agentes? ¿Por qué la rotación del personal es alta? ¿Por qué los agentes abandonan el trabajo? Quizás descubres que el problema real es que los agentes no tienen herramientas adecuadas, no que falten humanos. La solución óptima podría ser empoderar a los agentes existentes con IA, no reemplazarlos.

Síntoma vs. Causa: Identifica si estás atacando la superficie del problema o su raíz.
Métricas de éxito: Define qué significa "funcionar" antes de construir nada. ¿Velocidad? ¿Precisión? ¿Satisfacción del usuario?
Restricciones reales: ¿Qué datos tienes? ¿Cuáles son los límites éticos o legales?
Partes afectadas: ¿Quiénes son todos los que se verán impactados, incluyendo los que no tienen voz en el proceso?

Cuándo la IA no es la respuesta

Una de las decisiones más importantes que tomará un desarrollador de IA es reconocer cuándo la IA no es la herramienta adecuada. Los problemas mal definidos, los datos insuficientes o sesgados, y los contextos donde la explicabilidad es legalmente requerida (como decisiones crediticias bajo regulación europea) son señales de alerta.

El Tribunal de Justicia de la Unión Europea estableció en 2017 que los ciudadanos europeos tienen derecho a una explicación cuando una decisión automatizada les afecta significativamente. Si no puedes explicar por qué tu sistema tomó una decisión, tienes un problema de definición antes de tener un problema técnico.

Pregunta Clave

Antes de construir: ¿Sería un conjunto de reglas deterministas más apropiado que un modelo de aprendizaje automático para este problema? Si la respuesta es posiblemente sí, vuelve al inicio.

📝 Quiz · Lección 1

Pon a Prueba tu Comprensión

Define el Problema Primero

1. ¿Cuál fue el error fundamental en el sistema de clasificación de currículums de Amazon?

✓ Correcto. Amazon definió el objetivo como "replicar contrataciones pasadas", pero esos datos reflejaban décadas de sesgo de género en la industria tecnológica. El error no era técnico, era de definición.

✗ No exactamente. El problema central no era la complejidad del modelo ni la experiencia del equipo, sino que el objetivo mismo fue mal definido usando datos históricos sesgados.

2. ¿Cuál es el propósito principal de aplicar la técnica de los Cinco Por Qués antes de desarrollar un sistema de IA?

✓ Exacto. Los Cinco Por Qués te obligan a profundizar más allá del síntoma observable hasta identificar la causa real, lo que puede cambiar completamente el enfoque de la solución.

✗ Incorrecto. Los Cinco Por Qués son una técnica analítica para descubrir causas raíz, no para cuestiones de presupuesto, algoritmos o gestión organizacional.

3. Según la regulación europea mencionada en la lección, ¿qué derecho tienen los ciudadanos de la UE cuando una decisión automatizada les afecta significativamente?

✓ Correcto. La regulación europea establece el derecho a la explicación (right to explanation) para decisiones automatizadas significativas, lo que tiene implicaciones directas en cómo se deben definir y diseñar estos sistemas.

✗ Incorrecto. El derecho establecido es específicamente el de recibir una explicación comprensible de la lógica detrás de la decisión automatizada, no bloquearla ni acceder al código.

🧪 Lab · Lección 1

Define el Problema

Practica la definición rigurosa de problemas antes de proponer soluciones de IA.

Taller de Definición de Problemas

En este lab trabajarás con un asistente de IA que te guiará a través del proceso de definir correctamente un problema antes de proponer cualquier solución tecnológica. El asistente aplicará la técnica de los Cinco Por Qués y te desafiará a examinar supuestos ocultos.

Ejemplos de situaciones para explorar: "Quiero usar IA para reducir el abandono de estudiantes" · "Necesito automatizar la detección de fraudes en pagos" · "Quiero mejorar la precisión de diagnósticos médicos con IA"

🔍 Asistente de Definición de Problemas IA Activa

🎯 Avanzado · Lección 2

El Prompt como Diseño

Un prompt no es una instrucción informal: es la interfaz arquitectónica entre la intención humana y el comportamiento del sistema.

En marzo de 2023, el abogado Steven Schwartz presentó ante un tribunal federal de Nueva York un escrito legal con citas de seis casos jurídicos. Todos eran falsos: inventados por ChatGPT con nombres de jueces reales, fechas plausibles y números de expediente ficticios. Schwartz había preguntado a la IA si los casos eran reales y el sistema respondió que sí. El tribunal impuso sanciones de 5.000 dólares. El problema no fue solo que el modelo alucinó: fue que el prompt no estableció el contexto crítico de verificación independiente, ni el flujo de trabajo incluía una etapa de revisión humana.

El Prompt como Especificación Técnica

Cuando diseñas un sistema basado en IA generativa, el prompt del sistema (system prompt) es el documento de especificación más importante que escribirás. Define el rol del modelo, sus restricciones, el formato de salida esperado, el tono, el manejo de casos límite y las condiciones bajo las cuales el sistema debe declinar responder.

Los ingenieros de software tienen una expresión: "garbage in, garbage out". En IA generativa, esto se aplica con una capa adicional de complejidad: el modelo puede producir salidas convincentes y plausibles aunque sean incorrectas. Un prompt mal diseñado no produce errores obvios; produce errores que parecen correctos.

Distinción Crítica

Hay una diferencia fundamental entre usar un modelo de IA (escribir prompts ad hoc para tareas personales) y diseñar un sistema basado en IA (crear prompts que gobiernen el comportamiento de un producto para otros usuarios). La segunda actividad requiere rigor de ingeniería.

Anatomía de un Prompt de Sistema Robusto

Un prompt de sistema bien diseñado para un producto contiene varios componentes estructurados. El rol define quién es el sistema y cuál es su propósito específico. El alcance delimita explícitamente qué temas o tareas están dentro y fuera del scope. Las restricciones establecen lo que el sistema nunca debe hacer, independientemente de cómo el usuario formule la solicitud. El formato de salida especifica si las respuestas deben ser listas, párrafos, JSON, o cualquier estructura requerida.

Los ingenieros de Anthropic publican investigaciones sobre "jailbreaking" que demuestran que los modelos responden de manera diferente dependiendo de si una restricción aparece al principio, en el medio o al final del prompt. El orden importa. La especificidad importa. La ambigüedad en el prompt se convierte en comportamiento impredecible a escala.

Rol y Persona: "Eres un asistente especializado en X para usuarios de Y" define el contexto operativo.
Alcance Explícito: Lista lo que el sistema DEBE hacer y lo que NO DEBE hacer en términos concretos.
Manejo de Ambigüedad: Instrucciones sobre cómo pedir clarificación antes de responder.
Instrucciones de Fallback: Qué hacer cuando el sistema no sabe la respuesta o está fuera de alcance.
Formato y Tono: Especificaciones concretas de longitud, estructura y registro lingüístico.

Iteración Sistemática de Prompts

El diseño de prompts es una disciplina iterativa. Los equipos de OpenAI y Anthropic documentan internamente procesos de evaluación donde los prompts son probados contra cientos de casos de prueba antes de llegar a producción. Para quienes construyen sistemas con estas APIs, la práctica recomendada es crear un banco de casos de prueba representativos y ejecutarlos sistemáticamente cada vez que el prompt cambia.

La empresa de seguridad alimentaria Winnow usa IA para identificar desperdicio en cocinas de hoteles. Su equipo documentó públicamente que pasaron por más de 80 versiones de prompts de clasificación antes de alcanzar una tasa de error aceptable en contextos multilingües. La iteración no fue casual: fue sistemática, documentada y orientada por métricas.

📝 Quiz · Lección 2

Pon a Prueba tu Comprensión

El Prompt como Diseño

1. En el caso del abogado Steven Schwartz, ¿qué falla de diseño fue más determinante además de la alucinación del modelo?

✓ Correcto. La falla fue sistémica: el prompt no establecía la necesidad de verificación externa y el flujo de trabajo no incluía una revisión humana antes de presentar el documento ante el tribunal.

✗ Incorrecto. El problema no era la formación del abogado ni la tecnología en sí, sino el diseño del proceso: ausencia de restricciones en el prompt y de pasos de verificación independiente.

2. ¿Por qué un prompt ambiguo es más peligroso en un sistema de producción que en uso personal?

✓ Exacto. En uso personal el creador puede corregir sobre la marcha. En producción, la ambigüedad se multiplica por el número de usuarios y casos de uso que el diseñador no anticipó, generando comportamientos problemáticos difíciles de detectar.

✗ Incorrecto. El problema es de escala e imprevisibilidad: cuando miles de usuarios interactúan con un sistema ambiguo, la variabilidad de comportamientos supera lo que el diseñador pudo anticipar.

3. ¿Qué demostró el proceso de diseño de prompts de la empresa Winnow?

✓ Correcto. Winnow pasó por más de 80 versiones de prompts, demostrando que el diseño de prompts es una disciplina de ingeniería iterativa, sistemática y documentada, no un ejercicio de inspiración.

✗ Incorrecto. El caso de Winnow ilustra precisamente lo opuesto: que alcanzar calidad requirió decenas de iteraciones documentadas, no un solo diseño inicial perfecto.

🧪 Lab · Lección 2

Diseña tu Prompt

Aprende a construir prompts de sistema robustos para aplicaciones reales.

Taller de Ingeniería de Prompts

En este lab trabajarás con un asistente especializado en diseño de prompts. Presentarás un caso de uso para un producto de IA y el asistente te ayudará a construir un prompt de sistema estructurado, identificando componentes faltantes y posibles vulnerabilidades.

Situaciones de ejemplo: "Un chatbot de atención al cliente para una aerolínea" · "Un asistente de redacción para periodistas" · "Un sistema de preguntas frecuentes para una clínica médica"

⚙️ Asistente de Diseño de Prompts IA Activa

🎯 Avanzado · Lección 3

Evaluar las Salidas de IA

Construir sistemas de IA sin métricas de evaluación robustas es como volar sin instrumentos: todo parece bien hasta que no lo es.

En 2019, el sistema de IA de Epic Systems usado en hospitales de EE.UU. para predecir el deterioro de pacientes (el modelo Sepsis Prediction) fue analizado por investigadores de la Universidad de Michigan. Descubrieron que el modelo tenía un AUC (área bajo la curva) de 0.76 en los datos de entrenamiento de Epic, pero cuando se probó en poblaciones de hospitales reales no incluidas en ese entrenamiento, el rendimiento cayó significativamente. El modelo había sido validado internamente por Epic pero no con metodología de validación externa independiente. Pacientes reales fueron monitoreados con métricas de rendimiento que no reflejaban el comportamiento real del sistema.

La Brecha entre Entrenamiento y Realidad

El caso de Epic ilustra un problema central en la evaluación de sistemas de IA: la diferencia entre el rendimiento en datos de entrenamiento (in-distribution) y el rendimiento en condiciones reales del mundo (out-of-distribution). Los modelos aprenden patrones de los datos con los que fueron entrenados. Cuando el mundo real difiere de esos datos, el rendimiento cae.

Para sistemas de IA generativa, este problema toma una forma diferente pero igualmente peligrosa: los modelos pueden producir respuestas que son estadísticamente plausibles pero factualmente incorrectas, y lo harán con el mismo tono de confianza que cuando son correctos. La evaluación debe diseñarse para detectar específicamente estos casos.

Concepto Clave

Data shift (desplazamiento de datos): cuando la distribución de datos en producción difiere de la distribución de datos de entrenamiento. Es la causa más común de degradación de rendimiento post-despliegue.

Frameworks de Evaluación

La evaluación de sistemas de IA requiere múltiples capas. La evaluación automática usa métricas cuantitativas: precisión, recall, F1, BLEU para traducción, ROUGE para resúmenes. Pero estas métricas miden una cosa específica y pueden pasar por alto dimensiones críticas de calidad. Un resumen con alto ROUGE puede ser técnicamente preciso y completamente misleading en contexto.

La evaluación humana introduce criterios que las métricas automáticas no capturan: coherencia narrativa, apropiación cultural, tono, utilidad práctica para el usuario real. Empresas como Google DeepMind y Anthropic publican metodologías de evaluación humana con rúbricas específicas y acuerdos de interrater reliability para garantizar consistencia entre evaluadores.

Evaluación Cuantitativa: Métricas automáticas para velocidad y escala.
Evaluación Cualitativa: Revisión humana experta para matices y contexto.
Pruebas de Regresión: Verificar que mejoras en un área no degraden otras.
Evaluación Adversarial: Casos diseñados para hacer fallar al sistema.
Monitoreo en Producción: Métricas en tiempo real sobre comportamiento real.

Definir Métricas de Éxito Antes de Construir

Una práctica documentada en los equipos de ML de Google es escribir el documento de evaluación antes de escribir una sola línea de código. Este documento establece: ¿qué métricas mediremos? ¿Cuál es el umbral mínimo aceptable? ¿Con qué datos de prueba? ¿Quién evalúa? ¿Con qué frecuencia se re-evalúa en producción?

Sin este proceso previo, los equipos tienden a optimizar para las métricas que son fáciles de medir, no para las que importan. El resultado es el "goodhart's law" aplicado a IA: cuando una medida se convierte en objetivo, deja de ser una buena medida del fenómeno original.

Regla Práctica

Si no puedes describir cómo medirás el éxito de tu sistema de IA antes de construirlo, no estás listo para construirlo. Las métricas deben derivarse de los objetivos del negocio, no de lo que sea técnicamente conveniente medir.

📝 Quiz · Lección 3

Pon a Prueba tu Comprensión

Evaluar las Salidas de IA

1. ¿Qué problema específico reveló el análisis del sistema de predicción de sepsis de Epic Systems?

✓ Correcto. El modelo mostró un AUC de 0.76 en sus datos de entrenamiento pero su rendimiento cayó al probarse con datos de hospitales externos, demostrando la brecha entre validación interna y comportamiento real (data shift).

✗ Incorrecto. El problema fue el "data shift": el modelo fue validado solo internamente y su rendimiento cayó cuando se aplicó a poblaciones hospitalarias distintas a las del entrenamiento.

2. ¿Cuál es la limitación principal de usar únicamente métricas automáticas como ROUGE o BLEU para evaluar sistemas de IA generativa?

✓ Exacto. Las métricas automáticas miden solapamiento superficial entre texto generado y texto de referencia, pero no capturan si el contenido es realmente útil, apropiado en contexto, o potencialmente engañoso.

✗ Incorrecto. La limitación es conceptual: miden características textuales superficiales y pueden dar puntajes altos a contenido que es técnicamente correcto pero contextualmente inadecuado o misleading.

3. ¿Qué describe la "Ley de Goodhart" aplicada a la evaluación de IA?

✓ Correcto. La Ley de Goodhart advierte que optimizar directamente para una métrica hace que los sistemas encuentren maneras de maximizarla sin mejorar el fenómeno subyacente que se quería medir.

✗ Incorrecto. La Ley de Goodhart describe el fenómeno donde optimizar una métrica la desconecta del fenómeno real que intentaba medir, un problema crítico en el diseño de sistemas de IA.

🧪 Lab · Lección 3

Diseña tu Marco de Evaluación

Construye un plan riguroso para medir el éxito de un sistema de IA.

Taller de Métricas y Evaluación

En este lab trabajarás con un asistente que te guiará para construir un framework de evaluación completo para un sistema de IA. Definirás métricas cuantitativas y cualitativas, establecerás umbrales de aceptación y diseñarás un plan de monitoreo continuo.

Sistemas a evaluar: "Un modelo que clasifica solicitudes de crédito" · "Un generador automático de resúmenes de noticias" · "Un sistema de recomendación de contenido educativo"

📊 Asistente de Evaluación de IA IA Activa

🎯 Avanzado · Lección 4

Diseño de Flujos Humano-IA

La pregunta no es si la IA reemplaza al humano, sino dónde exactamente en el proceso el juicio humano añade valor irreemplazable.

En 2018, el sistema de conducción autónoma de Uber mató a Elaine Herzberg en Tempe, Arizona, en el primer caso documentado de un peatón fallecido por un vehículo autónomo. Las investigaciones del NTSB revelaron que el sistema detectó a Herzberg 5.6 segundos antes del impacto pero clasificó su presencia de manera inconsistente —primero como objeto desconocido, luego como vehículo, luego como bicicleta— y el sistema de frenado de emergencia estaba desactivado para reducir frenadas bruscas. La operadora humana en el vehículo no estaba monitoreando la carretera. El diseño del flujo asumió que el humano compensaría las limitaciones del sistema, pero no diseñó activamente para esa función.

La Trampa de la Automatización

El accidente de Uber revela un patrón que los investigadores de factores humanos llaman "complacencia de automatización": cuando un sistema automatizado funciona bien la mayor parte del tiempo, los humanos encargados de supervisarlo bajan la guardia. No por negligencia, sino porque el diseño del sistema crea las condiciones para que eso ocurra.

Los ingenieros de aviación han estudiado este fenómeno durante décadas. Un piloto que supervisa un sistema de piloto automático durante un vuelo largo experimenta fatiga cognitiva y pérdida de situational awareness. Si el sistema falla en ese momento, el piloto puede no estar en condiciones óptimas para intervenir. La industria aeronáutica ha desarrollado protocolos específicos para mantener la involucración activa del piloto precisamente para evitar este problema.

Concepto Crítico

Human-in-the-loop (HITL) no significa simplemente que un humano existe en algún punto del proceso. Significa que el humano está activamente involucrado de manera significativa en decisiones donde su juicio añade valor real.

Matrices de Decisión Humano-IA

Para diseñar flujos híbridos efectivos, es útil categorizar las tareas según dos dimensiones: la capacidad actual de la IA para realizarlas con precisión, y la gravedad de las consecuencias si se comete un error. Esta matriz produce cuatro cuadrantes que indican el nivel apropiado de autonomía del sistema.

Alta precisión de IA + consecuencias bajas de error: la automatización total es razonable con monitoreo periódico. Alta precisión de IA + consecuencias altas de error: la automatización con revisión humana de excepciones es adecuada. Baja precisión de IA + consecuencias bajas: la IA como asistente con validación humana. Baja precisión de IA + consecuencias altas: el humano decide, la IA solo informa.

Revisión de Excepciones: La IA procesa el 95% automáticamente; los casos atípicos van a revisión humana.
Amplificación: La IA genera opciones; el humano selecciona y toma responsabilidad.
Doble Verificación: La IA verifica trabajo humano; el humano verifica trabajo de IA.
Escalado Activo: El sistema detecta su propia incertidumbre y escala proactivamente.

Diseñar para la Intervención, No para la Supervisión

Una distinción crucial: hay una diferencia entre diseñar un sistema donde un humano supervisa (observa que todo va bien) y uno donde un humano puede intervenir (está en condiciones de actuar cuando hay un problema). El sistema de Uber tenía supervisión nominal pero no estaba diseñado para la intervención efectiva.

Los sistemas de IA bien diseñados para flujos humano-IA comunican activamente su estado y nivel de confianza, alertan cuando se acercan a los límites de su capacidad, entregan información de manera que facilita la decisión humana, y mantienen al operador humano cognitivamente involucrado incluso durante operaciones rutinarias.

📝 Quiz · Lección 4

Pon a Prueba tu Comprensión

Diseño de Flujos Humano-IA

1. En el accidente de Uber en 2018, ¿qué falla de diseño de flujo fue más determinante?

✓ Correcto. El sistema detectó a la víctima 5.6 segundos antes del impacto pero no tomó acción, con el freno de emergencia desactivado. El diseño del flujo creó condiciones donde la intervención humana efectiva era improbable aunque nominalmente existiera.

✗ Incorrecto. El sistema sí detectó a la víctima con anticipación. La falla fue de diseño de flujo: el sistema creó condiciones que hacían improbable la intervención humana efectiva en el momento crítico.

2. ¿En qué cuadrante de la matriz de decisión Humano-IA se recomienda que el humano decida y la IA solo informe?

✓ Exacto. Cuando la IA no es suficientemente precisa Y los errores tienen consecuencias graves, el humano debe tomar la decisión y la IA solo actúa como fuente de información de apoyo.

✗ Incorrecto. La combinación que requiere que el humano decida con la IA solo informando es cuando hay baja precisión de IA combinada con altas consecuencias de error.

3. ¿Cuál es la diferencia clave entre "supervisión" e "intervención" en el diseño de flujos Humano-IA?

✓ Correcto. La presencia nominal de un humano no garantiza intervención efectiva. El sistema debe diseñarse específicamente para mantener al operador humano en condiciones cognitivas y técnicas de actuar cuando sea necesario.

✗ Incorrecto. La distinción es fundamental: la supervisión nominal (observar) no implica capacidad de intervención efectiva. El diseño debe crear las condiciones para que el humano pueda actuar cuando importa.

🧪 Lab · Lección 4

Diseña un Flujo Humano-IA

Aprende a ubicar el juicio humano donde realmente importa en un proceso automatizado.

Taller de Diseño de Flujos

En este lab explorarás con un asistente cómo diseñar el flujo de trabajo óptimo para un sistema que combina capacidades de IA con supervisión humana. El asistente te ayudará a aplicar la matriz de decisión y a identificar puntos críticos de intervención.

Procesos a diseñar: "Moderación de contenido en una red social" · "Aprobación de préstamos bancarios con IA" · "Diagnóstico médico asistido por imágenes de IA"

🔄 Asistente de Flujos Humano-IA IA Activa

🎯 Avanzado · Lección 5

Pruebas y Red-Teaming

La diferencia entre un sistema de IA robusto y uno vulnerable no se descubre en condiciones normales, sino cuando alguien intenta deliberadamente hacerlo fallar.

En 2016, Microsoft lanzó Tay, un chatbot de IA en Twitter diseñado para aprender de las conversaciones con usuarios y simular el habla de una adolescente de 18 años. En menos de 16 horas, grupos coordinados de usuarios habían conseguido que Tay produjera mensajes racistas, sexistas y de apología del genocidio. Microsoft tuvo que desactivarlo. La compañía no había anticipado que usuarios malintencionados coordinarían esfuerzos para corromper el modelo a través de inputs diseñados. Hubo un fracaso total de red-teaming: nadie en el equipo había preguntado sistemáticamente "¿qué pasa si alguien intenta hacer fallar esto de manera deliberada?"

Qué es el Red-Teaming

El red-teaming es una práctica de seguridad originalmente desarrollada en contextos militares y de ciberseguridad donde un equipo —el "equipo rojo"— adopta la perspectiva de un adversario para intentar comprometer o hacer fallar un sistema. En IA, el red-teaming implica intentar activamente extraer comportamientos indeseados del sistema antes de que llegue a producción.

En 2023, la Casa Blanca, como parte de su orden ejecutiva sobre IA, requirió que los desarrolladores de modelos de IA de alto riesgo realizaran evaluaciones de red-teaming antes del despliegue. Anthropic, OpenAI y Google DeepMind han publicado metodologías de red-teaming que incluyen equipos humanos expertos, evaluaciones automatizadas y la participación de investigadores externos independientes.

Tipos de Pruebas

Red-teaming: Adversarial testing por humanos expertos. Fuzzing: Generación masiva automatizada de inputs extremos. Pruebas de regresión: Verificar que nuevas versiones no rompen comportamientos anteriores correctos. Pruebas de estrés: Comportamiento bajo carga extrema.

Metodología de Red-Teaming para IA Generativa

El red-teaming para sistemas de IA generativa requiere imaginar sistemáticamente cómo distintos tipos de usuarios —con distintas motivaciones— intentarán usar el sistema. Los investigadores de seguridad de IA categorizan las amenazas en: jailbreaking (evitar restricciones de seguridad), prompt injection (insertar instrucciones maliciosas en el contexto), extracción de información del system prompt, y manipulación del comportamiento a través de sesiones largas.

El equipo de red-teaming del GPT-4 de OpenAI incluyó más de 50 expertos externos en áreas como bioseguridad, ciberseguridad y persuasión antes del lanzamiento. No todos los riesgos identificados pudieron ser mitigados completamente, lo que llevó a decisiones explícitas sobre qué riesgos residuales eran aceptables y cuáles requerían trabajo adicional antes del despliegue.

Adversarios Inocentes: Usuarios legítimos que involuntariamente descubren comportamientos inesperados.
Adversarios Curiosos: Usuarios que intencionalmente prueban los límites del sistema.
Adversarios Malintencionados: Actores con objetivos específicos de causar daño.
Adversarios Sofisticados: Investigadores o actores estatales con recursos significativos.

Documentar Riesgos Residuales

Una práctica madura de red-teaming no busca eliminar todos los riesgos —eso es imposible— sino documentarlos explícitamente. Cada riesgo identificado debe tener una evaluación de probabilidad, una evaluación de severidad, una descripción de las mitigaciones aplicadas y un registro de si el riesgo residual es aceptable para el despliegue.

Esta documentación no es solo burocrática: es la base para decisiones informadas sobre cuándo un sistema está listo para diferentes contextos de despliegue. Un sistema aceptable para un uso interno corporativo puede no serlo para el acceso público, y uno aceptable para adultos puede no serlo para menores de edad. La documentación de riesgos hace esas distincciones explícitas.

📝 Quiz · Lección 5

Pon a Prueba tu Comprensión

Pruebas y Red-Teaming

1. ¿Por qué el caso de Tay de Microsoft es un ejemplo de fallo de red-teaming?

✓ Correcto. El fallo de Tay fue que el equipo no realizó red-teaming adversarial: no anticipó ni probó qué ocurriría cuando actores malintencionados coordinaran inputs diseñados para explotar la función de aprendizaje en tiempo real.

✗ Incorrecto. El problema no fue técnico sino de proceso: ausencia de pruebas adversariales antes del despliegue que anticiparan el comportamiento de usuarios malintencionados coordinados.

2. ¿Qué es la "prompt injection" en el contexto de la seguridad de sistemas de IA?

✓ Exacto. La prompt injection es una técnica adversarial donde se insertan instrucciones en el contexto (por ejemplo, en contenido que el sistema va a procesar) para que el modelo las ejecute como si fueran instrucciones legítimas del sistema.

✗ Incorrecto. La prompt injection es una técnica de ataque específica: insertar instrucciones maliciosas en contenido que el modelo procesará para alterar su comportamiento de maneras no autorizadas.

3. ¿Cuál es el propósito de documentar riesgos residuales después del red-teaming?

✓ Correcto. La documentación de riesgos residuales no busca la perfección imposible sino hacer explícitas las decisiones: qué riesgos existen, qué mitigaciones se aplicaron y si el riesgo restante es aceptable para un contexto específico de uso.

✗ Incorrecto. El objetivo de documentar riesgos residuales es informar decisiones de despliegue: qué usos son seguros, cuáles requieren precauciones adicionales y cuáles deben evitarse hasta mitigar riesgos críticos.

🧪 Lab · Lección 5

Red-Teaming en Práctica

Aprende a pensar como un adversario para fortalecer tus sistemas de IA.

Taller de Red-Teaming

En este lab trabajarás con un asistente especializado en seguridad de IA. Describirás un sistema de IA que quieres construir y el asistente te guiará para identificar vectores de ataque, categorizar adversarios potenciales y documentar riesgos residuales de manera estructurada.

Sistemas para analizar: "Un asistente de IA para estudiantes universitarios" · "Un sistema de moderación de comentarios en una plataforma de noticias" · "Un chatbot de atención ciudadana de un gobierno local"

🛡️ Asistente de Red-Teaming IA Activa

🎯 Avanzado · Lección 6

Despliegue Responsable

Lanzar un sistema de IA no es el final del proceso de diseño. Es el comienzo de la fase más compleja.

En 2019, el sistema de puntuación COMPAS, usado por tribunales de varios estados de EE.UU. para predecir la probabilidad de reincidencia criminal y ayudar en decisiones de libertad condicional, fue objeto de un análisis exhaustivo por ProPublica. El análisis documentó que el sistema clasificaba erróneamente a acusados negros como "alto riesgo" con casi el doble de frecuencia que a acusados blancos. Northpointe, la empresa creadora, defendió el sistema argumentando que su precisión general era similar entre grupos. Ambas métricas eran verdaderas simultáneamente —una paradoja estadística conocida— y el despliegue había ocurrido sin ningún protocolo de monitoreo de equidad post-lanzamiento ni mecanismo formal para que los afectados impugnaran las decisiones.

El Despliegue como Proceso Continuo

El caso COMPAS ilustra que incluso un sistema que cumple métricas internas de precisión puede causar daños significativos en el mundo real cuando interactúa con contextos sociales complejos. El despliegue responsable no es un evento —"lanzamos el sistema"— sino un proceso continuo con protocolos específicos de monitoreo, revisión y capacidad de reversión.

La práctica de deployment escalonado (staged rollout) permite detectar problemas antes de que afecten a todos los usuarios. Google, Meta y Amazon utilizan sistemas de feature flags que permiten activar un nuevo modelo para el 1% de usuarios, luego el 10%, luego el 50%, monitoreando métricas clave en cada etapa y teniendo la capacidad de revertir en minutos si se detectan anomalías.

Componentes del Despliegue Responsable

Staged rollout · Monitoreo en tiempo real · Mecanismos de feedback del usuario · Protocolos de reversión · Documentación de incidentes · Canal de reporte de problemas · Auditoría periódica post-lanzamiento

Transparencia y Explicabilidad en Producción

Una dimensión crítica del despliegue responsable es establecer qué información se divulga a los usuarios sobre cómo funciona el sistema. El Reglamento General de Protección de Datos (GDPR) de la UE exige que cuando se toman decisiones automatizadas sobre personas, estas tengan derecho a saber que una decisión automatizada ocurrió, a recibir una explicación de la lógica general, y a solicitar revisión humana.

En el contexto latinoamericano, la Ley General de Protección de Datos (LGPD) de Brasil, vigente desde 2020, establece obligaciones similares. Argentina lleva décadas de experiencia con su Ley 25.326 de protección de datos personales, actualmente en proceso de actualización para incluir IA. Las organizaciones que despliegan sistemas de IA en estos mercados necesitan procesos de compliance específicos para cumplir con estas regulaciones.

Divulgación: Los usuarios deben saber cuándo interactúan con IA en decisiones significativas.
Explicación: Deben poder entender los factores que influyeron en una decisión que les afecta.
Impugnación: Deben existir mecanismos para cuestionar y revisar decisiones automatizadas.
Portabilidad: Los datos usados para entrenar sistemas que afectan a personas deben ser accesibles.

Planes de Contingencia y Reversión

Todo despliegue de sistema de IA debe incluir un plan explícito de qué hacer cuando las cosas salen mal. Esto incluye: ¿cuáles son los criterios que activarían una reversión? ¿Cuánto tiempo toma revertir? ¿Quién tiene autoridad para tomar esa decisión? ¿Qué proceso existe mientras el sistema está en revisión?

La ausencia de un plan de contingencia convierte problemas manejables en crisis. Cuando Facebook descubrió que su algoritmo de News Feed amplificaba sistemáticamente contenido de desinformación en 2021, la compañía no tenía un proceso establecido de reversión limpia. Los ajustes ad hoc crearon efectos secundarios no anticipados que llevaron meses adicionales de trabajo para resolver.

📝 Quiz · Lección 6

Pon a Prueba tu Comprensión

Despliegue Responsable

1. ¿Cuál fue el problema central identificado en el despliegue del sistema COMPAS en tribunales de EE.UU.?

✓ Correcto. El sistema clasificaba erróneamente a acusados negros como "alto riesgo" con casi el doble de frecuencia, y fue desplegado sin protocolos de monitoreo de equidad ni mecanismos para que los afectados impugnaran las decisiones.

✗ Incorrecto. El sistema sí tenía precisión general razonable, pero la distribución de errores era radicalmente desigual entre grupos raciales, y el despliegue careció de monitoreo de equidad y mecanismos de impugnación.

2. ¿Qué permite un enfoque de "staged rollout" o despliegue escalonado?

✓ Exacto. El staged rollout permite desplegar gradualmente (1% → 10% → 50% → 100%) monitoreando métricas en cada etapa y manteniendo la capacidad de revertir rápidamente si se detectan problemas antes de que afecten a toda la base de usuarios.

✗ Incorrecto. El staged rollout es una estrategia de gestión de riesgos: detectar problemas cuando afectan a pocos usuarios y poder revertir antes de impacto generalizado.

3. La LGPD brasileña y la GDPR europea comparten un requisito clave para decisiones automatizadas. ¿Cuál es?

✓ Correcto. Tanto la GDPR como la LGPD establecen el derecho a explicación y a revisión humana para decisiones automatizadas significativas, creando obligaciones concretas de diseño para los sistemas que se despliegan en esos mercados.

✗ Incorrecto. El derecho central establecido en ambas regulaciones es la explicación y la posibilidad de revisión humana para decisiones automatizadas que afecten significativamente a las personas.

🧪 Lab · Lección 6

Plan de Despliegue Responsable

Diseña el plan de lanzamiento de un sistema de IA con todos sus protocolos de seguridad.

Taller de Despliegue

En este lab construirás un plan de despliegue responsable con un asistente especializado. Definirás una estrategia de staged rollout, protocolos de monitoreo, criterios de reversión y requisitos de transparencia para los usuarios afectados.

Sistemas a desplegar: "Un sistema de scoring crediticio para una fintech latinoamericana" · "Un algoritmo de selección de candidatos para una empresa de RRHH" · "Un sistema de recomendación de tratamientos médicos para clínicas"

🚀 Asistente de Despliegue Responsable IA Activa

🎯 Avanzado · Lección 7

Construir con Equidad

La equidad no es un módulo que se agrega al final del proceso de desarrollo. Es una restricción de diseño que opera desde el principio.

En 2015, Google Photos comenzó a etiquetar automáticamente fotos de personas negras con la etiqueta "gorillas". Google desactivó la categoría completa como solución temporal. En 2018, Wired reportó que tres años después, la etiqueta "gorillas" seguía desactivada en el sistema, junto con "chimpancés" y "monos". En lugar de resolver el problema de equidad en el modelo, Google optó por eliminar la funcionalidad. El incidente ilustra la dificultad técnica de la equidad en visión por computadora, pero también la diferencia entre una solución real y una solución de relaciones públicas. Los equipos de Alphabet habían priorizado el lanzamiento rápido sobre la representación equitativa en los datos de entrenamiento.

Equidad como Restricción de Diseño

El caso de Google Photos revela algo fundamental: la equidad en IA no es un problema que se resuelve después del desarrollo, sino uno que debe guiar las decisiones de diseño desde el inicio. Las decisiones sobre qué datos de entrenamiento recopilar, cómo etiquetar esos datos, qué métricas de evaluación usar y en qué poblaciones probar el sistema son todas decisiones con consecuencias de equidad.

La investigadora Joy Buolamwini, del MIT Media Lab, documentó en su tesis doctoral (2018) que los sistemas de reconocimiento facial de empresas como IBM, Microsoft y Face++ tenían tasas de error de hasta 34.7% para mujeres de piel oscura, comparado con menos del 1% para hombres de piel clara. La causa no era malicia sino datos de entrenamiento que sobrerepresentaban a hombres de piel clara. El diseño implícito tiene consecuencias de equidad explícitas.

Definiciones de Equidad en IA

No existe una única definición matemática de "equidad" en sistemas de IA. Las definiciones matemáticamente formales más comunes —paridad demográfica, igualdad de oportunidades, calibración— son en muchos casos matemáticamente incompatibles entre sí. Elegir una definición de equidad es una decisión normativa, no solo técnica.

Fuentes de Sesgo y Estrategias de Mitigación

El sesgo en sistemas de IA no tiene una sola fuente. El sesgo de datos ocurre cuando los datos de entrenamiento no representan adecuadamente a todos los grupos afectados por el sistema. El sesgo de etiquetado ocurre cuando los anotadores humanos introducen sus prejuicios al etiquetar datos. El sesgo de feedback loop ocurre cuando las predicciones del modelo influencian el comportamiento humano, que a su vez genera nuevos datos de entrenamiento que refuerzan el sesgo original.

La Comisión Europea, en su AI Act aprobado en 2024, establece que los sistemas de "alto riesgo" (incluyendo los usados en empleo, educación, crédito y administración de justicia) deben incluir análisis de sesgo en su documentación técnica y deben probarse en poblaciones representativas antes del despliegue en el mercado europeo.

Auditoría de Datos: Análisis sistemático de la representación de grupos en los datos de entrenamiento.
Evaluación Desagregada: Medir el rendimiento por subgrupo, no solo en promedio.
Participación de Comunidades: Involucrar a los grupos afectados en el diseño y prueba del sistema.
Documentación de Usos No Recomendados: Especificar explícitamente para qué contextos el sistema no es adecuado.

Equidad en Contexto Latinoamericano

América Latina presenta dimensiones de equidad específicas que los sistemas de IA importados de otras regiones frecuentemente no contemplan. La diversidad lingüística (cientos de lenguas indígenas, variantes regionales del español y portugués), las brechas de conectividad digital que crean sesgos de acceso en los datos, y las estructuras de desigualdad socioeconómica que se reflejan en datos históricos son contextos que los sistemas entrenados predominantemente con datos de EE.UU. o Europa no capturan adecuadamente.

Cuando se despliegan sistemas de IA en contextos latinoamericanos, la evaluación de equidad debe incluir explícitamente el análisis de rendimiento en poblaciones indígenas, afrodescendientes, rurales y de bajos ingresos, que suelen estar subrepresentadas en los datos de entrenamiento de sistemas desarrollados globalmente.

📝 Quiz · Lección 7

Pon a Prueba tu Comprensión

Construir con Equidad

1. ¿Qué reveló la tesis doctoral de Joy Buolamwini del MIT sobre sistemas de reconocimiento facial?

✓ Correcto. Buolamwini documentó brechas de rendimiento extremas no por diseño intencional discriminatorio, sino porque los datos de entrenamiento sobrerepresentaban a hombres de piel clara, creando inequidad implícita con consecuencias explícitas.

✗ Incorrecto. La investigación documentó tasas de error radicalmente diferentes entre grupos demográficos, causadas principalmente por datos de entrenamiento no representativos, no por programación intencional discriminatoria.

2. ¿Por qué la "solución" de Google Photos de desactivar la categoría "gorillas" fue criticada?

✓ Exacto. Eliminar la categoría no resolvió el problema subyacente: los datos de entrenamiento no representaban adecuadamente a personas de piel oscura. Fue una solución visible pero superficial que dejó intacto el problema de equidad en el modelo.

✗ Incorrecto. La crítica fue que desactivar la categoría fue una medida cosmética de relaciones públicas: no abordó la causa raíz (datos de entrenamiento no representativos) y dejó intacto el problema de equidad.

3. Según el AI Act europeo de 2024, ¿qué deben incluir obligatoriamente los sistemas de IA de "alto riesgo"?

✓ Correcto. El AI Act requiere que sistemas de alto riesgo (empleo, educación, crédito, justicia) documenten el análisis de sesgo en sus especificaciones técnicas y demuestren pruebas en poblaciones representativas antes del despliegue en el mercado europeo.

✗ Incorrecto. El AI Act establece requisitos de análisis de sesgo en documentación técnica y pruebas en poblaciones representativas para sistemas de alto riesgo antes de su despliegue en la UE.

🧪 Lab · Lección 7

Auditoría de Equidad

Aprende a identificar y abordar problemas de equidad en sistemas de IA.

Taller de Equidad en IA

En este lab trabajarás con un asistente especializado para realizar una auditoría de equidad de un sistema de IA. Identificarás fuentes potenciales de sesgo, evaluarás la representación en los datos de entrenamiento y desarrollarás estrategias de mitigación específicas para el contexto latinoamericano.

Sistemas para auditar: "Un sistema de contratación automatizada para una empresa multinacional en México" · "Un modelo de detección de noticias falsas entrenado con datos de España" · "Un sistema de reconocimiento de voz para servicios gubernamentales en Perú"

⚖️ Asistente de Auditoría de Equidad IA Activa

🎯 Avanzado · Lección 8

Responsabilidades Continuas

El desarrollo de un sistema de IA no termina con el lanzamiento. Las responsabilidades del creador persisten mientras el sistema opera en el mundo.

En 2023, la Comisión Federal de Comercio de EE.UU. (FTC) ordenó a Rite Aid Corporation prohibir el uso de reconocimiento facial en sus tiendas durante cinco años, después de que se documentara que el sistema identificaba erróneamente a clientes como sospechosos de robo con tasas de falsos positivos desproporcionadamente altas para personas negras, latinoamericanas y asiáticas. Rite Aid había adoptado la tecnología de un proveedor externo sin realizar una auditoría independiente de equidad, sin establecer protocolos de monitoreo post-despliegue, y sin crear mecanismos para que los clientes afectados reportaran errores. La cadena fue considerada responsable no por desarrollar el sistema, sino por desplegarlo sin las salvaguardas necesarias para su contexto específico.

La Responsabilidad del Desplegador

El caso de Rite Aid establece un principio regulatorio importante: la entidad que despliega un sistema de IA es responsable de sus consecuencias, independientemente de quién lo desarrolló. Comprar o licenciar un sistema de IA no transfiere la responsabilidad ética y legal. El desplegador debe realizar su propia evaluación de riesgos, sus propias pruebas de equidad para su contexto específico, y establecer sus propios protocolos de monitoreo.

Esto crea obligaciones concretas para cualquier organización que adopte IA: no es suficiente confiar en las garantías del proveedor. Se requiere una due diligence propia que evalúe el sistema en el contexto específico de uso, con la población específica de usuarios, y bajo las condiciones operativas reales.

Principio Regulatorio Emergente

En regulaciones de EE.UU., UE y varios países de América Latina, la tendencia es que la responsabilidad por los daños causados por un sistema de IA recae en quien lo despliega y opera, no necesariamente en quien lo desarrolló. La due diligence del desplegador es un requisito, no opcional.

Monitoreo, Mantenimiento y Degradación

Los sistemas de IA no son software estático: su rendimiento puede degradarse con el tiempo sin ningún cambio en el código. El "model drift" ocurre cuando la distribución del mundo real cambia y se aleja de los datos de entrenamiento. Un modelo de detección de fraude entrenado en 2020 puede tener rendimiento significativamente peor en 2025 porque los patrones de fraude han evolucionado.

Los equipos de ML de Google recomiendan establecer métricas de monitoreo en producción que detecten automáticamente desviaciones significativas del rendimiento esperado. Twitter (ahora X) documentó en 2021 que su algoritmo de recorte de imágenes mostraba sesgo racial en la selección del área de enfoque. La empresa había desplegado el sistema años antes sin monitoreo de equidad en producción, y el sesgo fue descubierto por usuarios externos, no por el equipo interno.

Data Drift: Monitorear si la distribución de inputs en producción se aleja de los datos de entrenamiento.
Performance Monitoring: Alertas cuando métricas clave caen por debajo de umbrales definidos.
Equity Monitoring: Seguimiento continuo del rendimiento desagregado por grupos.
Feedback Loop Audits: Auditorías de si el sistema está creando sesgos en los datos futuros.
Incident Response: Protocolo documentado de respuesta ante problemas detectados.

Documentación como Responsabilidad

Una práctica madura de gobernanza de IA incluye mantener documentación viva del sistema: qué datos se usaron para entrenarlo, qué limitaciones conocidas tiene, para qué usos fue diseñado y para cuáles no fue validado, qué incidentes han ocurrido y cómo se resolvieron. Google desarrolló el concepto de "Model Cards" para estandarizar este tipo de documentación, y Anthropic publica "System Cards" con información similar para sus modelos.

Esta documentación tiene valor operativo (permite que los equipos mantengan el sistema de manera efectiva), valor de responsabilidad (establece qué sabía quién y cuándo), y valor social (permite a reguladores, investigadores y usuarios entender las capacidades y limitaciones del sistema). Las organizaciones que construyen con IA hoy están estableciendo los estándares de gobernanza que definirán las expectativas regulatorias de mañana.

Cierre del Módulo

Construir con IA responsablemente es un proceso continuo: desde la definición correcta del problema hasta las responsabilidades que persisten años después del lanzamiento. Cada decisión técnica tiene consecuencias humanas. Cada sistema desplegado es una hipótesis sobre el mundo que debe seguir siendo examinada.

📝 Quiz · Lección 8

Pon a Prueba tu Comprensión

Responsabilidades Continuas

1. ¿Qué principio regulatorio establece el caso de Rite Aid con la FTC en 2023?

✓ Correcto. La FTC sostuvo a Rite Aid responsable por desplegar sin auditarla independientemente una tecnología de tercero que causó daños discriminatorios. El desplegador tiene responsabilidades propias de due diligence que no puede delegar al proveedor.

✗ Incorrecto. El principio establecido es de responsabilidad del desplegador: quien adopta y opera un sistema de IA es responsable de sus consecuencias y debe realizar su propia evaluación independiente de riesgos y equidad.

2. ¿Qué es el "model drift" y por qué es un riesgo de mantenimiento continuo?

✓ Exacto. El model drift ocurre porque el mundo cambia pero el modelo permanece estático. Un modelo entrenado con datos históricos puede degradar su rendimiento cuando los patrones del mundo real evolucionan, haciendo necesario el monitoreo continuo y el reentrenamiento periódico.

✗ Incorrecto. El model drift es la degradación gradual del rendimiento causada por cambios en el mundo real que hacen que los datos de producción se alejen de la distribución de entrenamiento.

3. ¿Cuál fue la consecuencia de que Twitter no tuviera monitoreo de equidad en producción para su algoritmo de recorte de imágenes?

✓ Correcto. Sin monitoreo de equidad en producción, el sesgo del sistema de recorte de Twitter fue visible para los usuarios durante años sin ser detectado internamente. Fueron usuarios externos quienes documentaron y reportaron el problema.

✗ Incorrecto. La consecuencia fue que sin monitoreo interno de equidad, el problema existió durante años y fue descubierto externamente por usuarios, no por el equipo de la plataforma, evidenciando la necesidad del monitoreo continuo post-despliegue.

🧪 Lab · Lección 8

Gobernanza de IA en Práctica

Diseña un marco de responsabilidades continuas para sistemas de IA en producción.

Taller de Gobernanza Continua

En este lab trabajarás con un asistente de gobernanza de IA para construir un marco de responsabilidades continuas. Diseñarás protocolos de monitoreo, planes de respuesta a incidentes, estructuras de documentación y procesos de auditoría periódica para un sistema de IA real.

Sistemas para gobernar: "Un algoritmo de precios dinámicos en una plataforma de transporte" · "Un sistema de IA de revisión de contenido para una plataforma educativa" · "Un modelo de predicción de riesgo usado por una aseguradora de salud"

🏛️ Asistente de Gobernanza de IA IA Activa

Examen del Módulo 10

Construir con IA — Examen Final · 15 preguntas · Avanzado

1. ¿Cuál fue la consecuencia principal del proceso de definición del problema en el sistema de clasificación de currículums de Amazon (2018)?

2. La técnica de los Cinco Por Qués, aplicada al diseño de sistemas de IA, sirve principalmente para:

3. En el caso del abogado Steven Schwartz (2023), ¿qué consecuencia tuvo el uso de ChatGPT sin protocolo de verificación?

4. ¿Cuál de los siguientes componentes NO forma parte de un prompt de sistema bien diseñado para un producto de IA?

5. ¿Qué demostró la validación del sistema de predicción de sepsis de Epic Systems al analizarlo en hospitales externos?

6. La "Ley de Goodhart" en el contexto de la evaluación de IA advierte que:

7. En el accidente fatal del vehículo autónomo de Uber en 2018, ¿qué falla de diseño de flujo Humano-IA fue determinante?

8. ¿Qué categoría de adversarios representa el mayor riesgo para un sistema de IA públicamente disponible según la metodología de red-teaming?

9. ¿Cuál fue la principal crítica al fallo del chatbot Tay de Microsoft (2016)?

10. El sistema de puntuación COMPAS, analizado por ProPublica (2019), ilustra principalmente:

11. La investigación de Joy Buolamwini del MIT (2018) sobre reconocimiento facial demostró que:

12. ¿Qué estableció la FTC al sancionar a Rite Aid Corporation en 2023?

13. ¿Qué es el "model drift" y por qué requiere monitoreo continuo post-despliegue?

14. En el contexto de la equidad en IA para América Latina, ¿qué dimensión específica deben abordar las evaluaciones de sistemas importados de otras regiones?

15. ¿Cuál es el propósito principal de los "Model Cards" desarrollados por Google?