Fotos de niños son usadas para entrenar la IA sin que sus padres sepan

Según una investigación de Human Rights Watch, ha revelado que un conocido conjunto de datos utilizado para entrenar modelos de IA, contiene imágenes de menores que violan gravemente su privacidad

Tecnología Sala de redacción

Inteligencia Artificial - IA - niños - privacidad

Vídeo: DW Español

Human Rights Watch (HRW) ha lanzado una dura advertencia sobre un nuevo problema relacionado con la inteligencia artificial (IA) y sus implicaciones sobre los derechos y libertades de los niños. Una investigación ha puesto de manifiesto que el conjunto de datos LAION-5B, ampliamente utilizado para el entrenamiento de modelos de IA, contiene imágenes de menores que violan gravemente su privacidad.

A principios de año, Hye Jung Han, investigadora de HRW reportó a Wired, que identificó que el conjunto de datos LAION-5B incluía 170 fotos de niños brasileños. Las imágenes fueron obtenidas principalmente de blogs personales, redes sociales y videos con escasa visibilidad en YouTube.

Esto es de suma gravedad porque los términos de servicio de YouTube prohíben la recopilación de datos personales sin el consentimiento adecuado, lo que evidencia un ataque directo a estas políticas.

Qué imágenes de niños son usadas para entrenar modelos de IA

En un hallazgo aún más reciente, se encontró otras 190 imágenes de niños australianos, incluidas fotos de recién nacidos y niñas en bañador durante un carnaval. Estas imágenes fueron compartidas originalmente bajo estrictas medidas de privacidad, en blogs personales o en redes sociales con acceso limitado.

Algunas incluso provenían de fotógrafos profesionales contratados por familias o instituciones educativas para eventos específicos. La presencia de estas fotos en el conjunto de datos plantea serias preocupaciones sobre la falta de control y autorización en la recopilación de datos personales.

Asimismo, una de las preocupaciones más graves destacadas por HRW es que, las URLs de estas imágenes a menudo contienen información sensible, como nombres y ubicaciones específicas.

Por ejemplo, una imagen etiquetada con detalles precisos permitió a los investigadores obtener los nombres completos y la guardería frecuentada por dos niños en Perth, Australia. Esta capacidad para extraer información privada de imágenes supuestamente seguras reflejan la vulnerabilidad a la que están expuestos los menores en la era digital.

Qué tan difícil es buscar imágenes de niños en línea

Estas imágenes son extremadamente difíciles de localizar mediante búsquedas en línea regulares, lo que indica que los padres y cuidadores han tomado medidas deliberadas para proteger la privacidad de los niños.

Sin embargo, las herramientas y técnicas utilizadas para crear conjuntos de datos masivos como LAION-5B han ignorado estas medidas, exponiendo la privacidad de los menores a un riesgo considerable.

HRW ha señalado que su equipo solo pudo revisar una fracción mínima del conjunto de datos, menos del 0,0001 % de sus 5.850 millones de imágenes. Los investigadores se sorprendieron por la cantidad de fotos personales de niños que encontró incluso en una muestra aleatoria.

Se esperaría encontrar en su lugar una mayor proporción de imágenes más comunes en la web, como fotos de animales o paisajes, lo que resalta aún más el carácter invasivo de este conjunto específico de datos.

Qué responden los modelos de IA

En defensa de sus prácticas, LAION, una ONG detrás del conjunto de datos, hizo declaraciones a Ars Technica que mantienen una política de “tolerancia cero con el contenido ilegal”.

No obstante, reconoció que eliminar estas imágenes comprometedoras es un proceso lento y complejo. Además, una vez que los modelos de IA han sido entrenados con estos datos, es imposible “olvidar” la información absorbida, lo que implica que el daño potencial ya está hecho.

Por el momento, esta alerta pone de relieve la urgente necesidad de establecer regulaciones más estrictas y controles más robustos en la recopilación y uso de datos para el entrenamiento de IA.

La precisión y eficacia de estos modelos no deben lograrse a expensas de la privacidad y los derechos de los individuos, especialmente de los niños, que son un grupo particularmente vulnerable.

No solo se pone en peligro la privacidad de los menores, sino que también, se cuestiona la ética y la legalidad de las prácticas de recopilación de datos de muchos de los modelos de IA actuales.

Con información de Infobae

Te puede interesar

Una página de ChatGPT, chatbot de la empresa OpenAI|Foto: EFE/Ballesteros

Críticas al nuevo modelo de ChatGPT por fallas, menos empatía y reacción negativa

Agencias

Tecnología

El debut de GPT-5 causa revuelo: fallos, tono distante y la eliminación de GPT-4o desatan críticas entre usuarios e inversores

¿Puede la humanidad sobrevivir a una IA superinteligente?: Experto revela la única vía posible

Agencias

Tecnología

El pionero de la IA Geoffrey Hinton alerta sobre su potencial destructivo y sugiere crear modelos con instintos maternales para proteger a la humanidad

¿El fin de las contraseñas?: el futuro de la seguridad digital y las llaves de acceso

Agencias

Tecnología

Expertos y gigantes tecnológicos como Microsoft anuncian el fin de las contraseñas. Descubre por qué son vulnerables y cómo la autenticación biométrica y las llaves de acceso están redefiniendo la seguridad digital

Lo más visto

Combo de imágenes de Cristiano Ronaldo y Georgina Rodríguez|Foto: Hola.com/@georginagio

Cristiano Ronaldo y Georgina Rodríguez anuncian su boda tras nueve años de relación y cinco hijos

Sala de redacción

Actualidad

Cristiano Ronaldo y Georgina Rodríguez se comprometen tras nueve años de relación. El anillo, la familia y los valores marcan esta nueva etapa

Posibles restos de "La Fortuna" en Carolina del Norte (EE.UU.)|Foto: EFE/ Programa de Estudios Marítimos de ECU.

Hallazgo arqueológico en Carolina del Norte: descubren posibles restos de un navío corsario español

Yusmary Coccia

Cultura y Ocio

Un equipo de investigadores de la Universidad de Carolina del Este localizó cuatro naufragios históricos, incluyendo uno que podría corresponder a "La Fortuna" un buque del siglo XVIII vinculado a la guerra colonial entre potencias europeas

Estrenos de cine agosto 2025: 'Materialistas'|Foto: EFE/Killer Films y 2AM

Estrenos de cine agosto 2025: tiburones, romance y acción en la cartelera internacional

Agencias

Cultura y Ocio

Descubre los estrenos más esperados de agosto: desde el thriller 'Dangerous Animals' hasta la comedia romántica 'Materialistas' con Pedro Pascal

Netflix entra en la carrera por el Oscar con la película animada “KPop Demon Hunters”

Yusmary Coccia

Cultura y Ocio

La Academia de Hollywood abrió oficialmente su temporada de premios con la llegada de los primeros títulos al Academy Screening Room, la plataforma privada donde se decide el futuro de los Oscar

Alumnos en un aula de la universidad|Foto: EFE/Marcial Guillén

36 universidades españolas se mantienen en el Ranking de Shanghái 2025

Agencias

Noticias

España conserva 36 universidades en el ARWU 2025. La Universidad de Barcelona lidera el ranking nacional, aunque ninguna entra en el top 100 mundial

Críticas al nuevo modelo de ChatGPT por fallas, menos empatía y reacción negativa

Agencias

Tecnología

El debut de GPT-5 causa revuelo: fallos, tono distante y la eliminación de GPT-4o desatan críticas entre usuarios e inversores

Microsoft examina si su tecnología fue utilizada por Israel para vigilancia masiva en Gaza

Agencias

Noticias

Microsoft revisa si su plataforma Azure fue utilizada por Israel para vigilancia masiva en Gaza. La empresa asegura que este uso violaría sus políticas de IA responsable

El presidente ruso Vladímir Putin. EFE/EPA/Mikhail Tereshchenko/SPUTNIK/Kremlin

¿Paz condicionada?: Putin plantea cesar ataques si Ucrania cede el Donbás

Agencias

Internacionales

Vladimir Putin propone detener la ofensiva rusa en Ucrania si Kiev entrega el control total del Donbás. La oferta fue presentada durante la cumbre con Donald Trump en Alaska, como parte de un posible acuerdo de paz

Newsletter