La compañía de la manzana presenta Apple Intelligence, una herramienta impulsada por inteligencia artificial que estará disponible para sus últimos modelos de iPhone, iPad y Mac
Fotos de niños son usadas para entrenar la IA sin que sus padres sepan
Según una investigación de Human Rights Watch, ha revelado que un conocido conjunto de datos utilizado para entrenar modelos de IA, contiene imágenes de menores que violan gravemente su privacidad
Tecnología Sala de redacciónVídeo: DW Español
Human Rights Watch (HRW) ha lanzado una dura advertencia sobre un nuevo problema relacionado con la inteligencia artificial (IA) y sus implicaciones sobre los derechos y libertades de los niños. Una investigación ha puesto de manifiesto que el conjunto de datos LAION-5B, ampliamente utilizado para el entrenamiento de modelos de IA, contiene imágenes de menores que violan gravemente su privacidad.
A principios de año, Hye Jung Han, investigadora de HRW reportó a Wired, que identificó que el conjunto de datos LAION-5B incluía 170 fotos de niños brasileños. Las imágenes fueron obtenidas principalmente de blogs personales, redes sociales y videos con escasa visibilidad en YouTube.
Esto es de suma gravedad porque los términos de servicio de YouTube prohíben la recopilación de datos personales sin el consentimiento adecuado, lo que evidencia un ataque directo a estas políticas.
Qué imágenes de niños son usadas para entrenar modelos de IA
En un hallazgo aún más reciente, se encontró otras 190 imágenes de niños australianos, incluidas fotos de recién nacidos y niñas en bañador durante un carnaval. Estas imágenes fueron compartidas originalmente bajo estrictas medidas de privacidad, en blogs personales o en redes sociales con acceso limitado.
Algunas incluso provenían de fotógrafos profesionales contratados por familias o instituciones educativas para eventos específicos. La presencia de estas fotos en el conjunto de datos plantea serias preocupaciones sobre la falta de control y autorización en la recopilación de datos personales.
Asimismo, una de las preocupaciones más graves destacadas por HRW es que, las URLs de estas imágenes a menudo contienen información sensible, como nombres y ubicaciones específicas.
Por ejemplo, una imagen etiquetada con detalles precisos permitió a los investigadores obtener los nombres completos y la guardería frecuentada por dos niños en Perth, Australia. Esta capacidad para extraer información privada de imágenes supuestamente seguras reflejan la vulnerabilidad a la que están expuestos los menores en la era digital.
Qué tan difícil es buscar imágenes de niños en línea
Estas imágenes son extremadamente difíciles de localizar mediante búsquedas en línea regulares, lo que indica que los padres y cuidadores han tomado medidas deliberadas para proteger la privacidad de los niños.
Sin embargo, las herramientas y técnicas utilizadas para crear conjuntos de datos masivos como LAION-5B han ignorado estas medidas, exponiendo la privacidad de los menores a un riesgo considerable.
HRW ha señalado que su equipo solo pudo revisar una fracción mínima del conjunto de datos, menos del 0,0001 % de sus 5.850 millones de imágenes. Los investigadores se sorprendieron por la cantidad de fotos personales de niños que encontró incluso en una muestra aleatoria.
Se esperaría encontrar en su lugar una mayor proporción de imágenes más comunes en la web, como fotos de animales o paisajes, lo que resalta aún más el carácter invasivo de este conjunto específico de datos.
Qué responden los modelos de IA
En defensa de sus prácticas, LAION, una ONG detrás del conjunto de datos, hizo declaraciones a Ars Technica que mantienen una política de “tolerancia cero con el contenido ilegal”.
No obstante, reconoció que eliminar estas imágenes comprometedoras es un proceso lento y complejo. Además, una vez que los modelos de IA han sido entrenados con estos datos, es imposible “olvidar” la información absorbida, lo que implica que el daño potencial ya está hecho.
Por el momento, esta alerta pone de relieve la urgente necesidad de establecer regulaciones más estrictas y controles más robustos en la recopilación y uso de datos para el entrenamiento de IA.
La precisión y eficacia de estos modelos no deben lograrse a expensas de la privacidad y los derechos de los individuos, especialmente de los niños, que son un grupo particularmente vulnerable.
No solo se pone en peligro la privacidad de los menores, sino que también, se cuestiona la ética y la legalidad de las prácticas de recopilación de datos de muchos de los modelos de IA actuales.
Con información de Infobae
Piratería digital en España: ascendió 5% y alcanzó casi 34 millones de euros al año
Según el estudio 'Observatorio de la piratería y hábitos de consumo de contenidos digitales 2023', la piratería digital en España ha alcanzado cifras de 5.079 millones de contenidos ilícitos
Tesla ha presentado, en su evento 'We, Robot', sus novedades futuristas. Además del robotaxi, también mostró un autobús autónomo y un robot humanoide
La compañía de la manzana presenta Apple Intelligence, una herramienta impulsada por inteligencia artificial que estará disponible para sus últimos modelos de iPhone, iPad y Mac
Piratería digital en España: ascendió 5% y alcanzó casi 34 millones de euros al año
Según el estudio 'Observatorio de la piratería y hábitos de consumo de contenidos digitales 2023', la piratería digital en España ha alcanzado cifras de 5.079 millones de contenidos ilícitos
Un nuevo informe de Eurostat revela cuáles son los países más desiguales de Europa
Según las últimas cifras de Eurostat sobre las condiciones de vida, en la UE hay 94,6 millones de personas en riesgo de pobreza o exclusión social
Juez Peinado imputa a Begoña Gómez por apropiación indebida del software de la Complutense y la cita el 18 de noviembre
Pedro Sánchez para que comparezca en sede judicial el próximo día 18 de noviembre, a las 13:30 horas
La DANA golpea con dureza el sur y el este de la península: siete desaparecidos, un AVE descarrilado y daños materiales
El fuerte temporal deja un reguero de incidencias: riadas, cortes de tráfico, cultivos destrozados, vuelos cancelados, suspensión del tráfico ferroviario de la línea de alta velocidad Madrid-Valencia e incluso el descarrilamiento de un convoy del AVE Málaga-Madrid
En la cuenta corriente de Íñigo Errejón figuran 149.118,91 euros frente a los 52.589,59 euros que contaba en 2018, según la declaración de bienes y rentas del 2023 presentada cuando recogió su acta de la XV Legislatura
España normaliza relaciones con Argentina y nombra embajador a Joaquín María de Arístegui
En un comunicado conjunto de los gobiernos de España y Argentina se pone de relieve que son “pueblos hermanos, unidos por profundos lazos humanos y sociales”
Ábalos comunicó a Delcy Rodríguez a través de Aldama que el CNI vigilaba a Leopoldo López en España
Delcy Rodríguez estaba muy interesada en conocer qué pasos daba el Ejecutivo de Sánchez en su acercamiento hacia Leopoldo López, y le escribía a De Aldama que no debían "apoyar en nada al psicópata"