De "crucial" a "esencial": Estas son las palabras que revelan que un texto está escrito con IA

Muchos programas antiplagio y anti-IA utilizado por Universidades han demostrado no ser eficientes del todo. Los textos generados por los grandes modelos de lenguaje cuentan con patrones que, a puro de usarlos, tienden a ser repetitivos

Tecnología Sala de redacción
Inteligencia artificial
Inteligencia artificial

Desde que ChatGPT hizo que la inteligencia artificial generativa se abriera a todo aquel que quisiera, ha existido el debate. ¿Hasta qué punto son detectables los textos generados con inteligencia artificial?

La respuesta es complicada. Muchos programas antiplagio y anti-IA utilizado por Universidades han demostrado no ser eficientes del todo, pero también está claro que los textos generados por los grandes modelos de lenguaje cuentan con unos patrones que, a puro de usarlos, tienden a ser repetitivos.

"En resumen", como diría ChatGPT

Inicios anodinos con frases como "en el contexto" actual, su afán por adjetivar todo lo posible, y párrafos que cierran con coletillas como "en resumen" o "en conclusión" eran algunos de los más evidentes

En Estados Unidos, un análisis había probado que la palabra 'delve' (ahondar o sumergirse) había disparado su presencia en papers académicos desde la llegada de la IAG. Pero ahora, el analista y consultor SEO español Natzir Turrado ha extraído qué palabras son también las que más se repiten en español.

Para el análisis, publicado en Twitter, Turrado ha comparado las bases de datos de algunos de los modelos más populares con un corpus de textos escritos por humanos.

En concreto, se basó en los modelos Llama3-8b-8192, Llama-3-sonar-small-32k-chat, Gemma-7b-It, GPT3.5 Turbo, GPT4, GPT4o. Pero mayoría del corpus con modelos GPT. El tamaño total para el análisis fue de 360.337.739 tokens generados con IA.

 Inteligencia Artificial -IA- Conoce la lista de empleos que se verán más impactados por la inteligencia artificial

El resultado es que a la IA le gustan mucho palabras como "crucial", que es 6.413 veces más frecuente en texto generados con IA que en textos naturales; "desafíos", o "exploraremos", ambas unas 2.000 veces más frecuentes.

"En este artículo exploraremos…"

En su análisis también ha extraído los trigramas, construcciones de tres palabras más frecuentes, donde aparecen por ejemplo "este artículo exploraremos", "consideraciones éticas" o "comenzando a desempeñar".

App para hablar con muertos/EFEAplicaciones de inteligencia artificial para “hablar” con los muertos

Los trigramas indican una estructura estándar y predecible en los textos de IA, lo cual es útil para mantener la coherencia en los resultados, pero también hace que muchas veces carezcan de fluidez.

La pregunta que queda por responder es: ¿hasta qué punto podrán las IAs cerrar esta brecha en el futuro?

Formación en IA

Si quieres transformar tu productividad y potenciar tu carrera a través de la IA, la escuela The Valley junto a elEconomista.es, ofrece un curso semipresencial diseñado para perfiles que buscan incorporar las últimas herramientas y técnicas de inteligencia artificial en su trabajo diario.

Aprende de expertos del sector y adquiere habilidades prácticas que te diferenciarán en el competitivo mercado laboral, accediendo a puestos mejor remunerados y con mayores oportunidades de trabajo. Además, por ser lector de eleconomista.es, obtendrás un 10% de descuento en la inscripción. No dejes pasar esta ocasión de avanzar en tu desarrollo profesional y apúntate aquí.

Con información de elEconomista

Te puede interesar
Lo más visto

Suscríbete al newsletter para recibir periódicamente las novedades en tu email