En los últimos cinco años la inteligencia artificial ha pasado de las universidades a nuestros móviles sin solución de continuidad. De ser una tecnología arcana a convertirse en un fenómeno cultural pop. Pasa porque ha “aprendido” a escribir y todo el mundo escribe. Las técnicas de aprendizaje automático han permitido a los ordenadores destilar los mecanismos de los lenguajes humanos y de programación. Hoy, las máquinas pueden reproducir correos electrónicos, informes corporativos, interacciones en redes sociales y programas en Python por que han procesado millones de correos electrónicos, informes corporativos, interacciones en redes sociales y programas en Python que hemos escrito los humanos.
Y nos funciona tan bien que lo utilizamos constantemente cuando tenemos que redactar textos, que acabamos compartiendo en la red. Un estudio de Amazon Web Services demuestra que un 57% de todo el texto de la web, o bien ha sido generado por IA o traducido por un algoritmo de IA, generalmente del inglés. El consumo de estos textos influye de forma inexorable en la forma en que escribimos y hablamos. Al interactuar constantemente con textos generados por IA, los usuarios adoptamos inconscientemente sus patrones lingüísticos. Y eso que de por sí no debería importarnos mucho –al fin y al cabo han aprendido de cómo escribimos nosotros– puede comportar una uniformización del lenguaje y una reducción de la diversidad expresiva. En lugar de que la IA hable como nosotros, que seamos nosotros quienes hablemos como ella.
Un proceso que los expertos llaman “allanamiento del lenguaje” y que ya hemos vivido con la adopción de tecnologías como el libro, la radio, la tele o la propia web, que podría estar en peligro por el exceso de contenido generado. El allanamiento es ya lo bastante manifiesto como para que sus efectos sean medibles. Andrew Gray, bibliotecario del University College de Londres estudió la aparición de determinadas palabras en estudios científicos del año 2023 y lo comparó con estudios publicados previos a la aparición de ChatGPT, en 2022. Detectó un incremento del 137% en el uso de “meticulosamente”, un 117% en el de “intrincado” y un 117% en el de “encomiable” en sus originales en inglés. Algunos de estos términos se han convertido en marcas estilísticas que delatan los textos generados por IA.
El caso más paradigmático es quizás la popularización en el último año del término profundizar, delve en inglés. Un análisis meticuloso nos lleva por un intrincado camino hasta el trabajo más encomiable de la IA: el de los anotadores. Profundicemos en el tema. Jeremy Nguyen, de la Universidad de Tecnología de Swinburne, en Melbourne, se dio cuenta de la tendencia de ChatGPT a generar el término “profundizar” en sus respuestas. Comprobó cómo su uso se había multiplicado por 100 en 2024 en textos científicos publicados en PubMed. También les pasaba a “apalancamiento” y “tapicería”. ¿Por qué esos términos y no otros?
Pues resulta que a pesar de la naturaleza estadística de los algoritmos predictivos de la IA generativa, este fenómeno no tiene nada de aleatorio: delve , al igual que leverage o tapestry , son más utilizadas en algunas variedades dialectales del inglés global que en el inglés británico o estadounidense. Las palabras que nos ocupan son utilizadas particularmente en el inglés empresarial africano. Es muy probable que su uso se haya filtrado a los sistemas a través de miles de horas de trabajo de moderación y entrenamiento subcontratadas en países como Kenia o Nigeria. Hoy, estos términos ya forman parte del inglés científico y de los trabajos de todos los estudiantes del mundo que deben entregar un texto en inglés. Si la arquitectura física condiciona nuestro carácter, como dijo Churchill, la arquitectura de la IA, condiciona nuestra mente.
Puede pensar que cambiar un término por otro no tiene la mayor trascendencia y que incluso tiene un punto romántico que la comunidad científica global acabe utilizando la terminología de los más débiles (recordemos que los anotadores de países pobres que moderan las respuestas de los LLM, cobran uno o dos dólares la hora). Pero esto llevado al extremo es letal, en sentido virtualmente literal.
La IA podría estar suicidándose y matando la web al mismo tiempo. Si la mayor parte del contenido que encontramos en internet son textos generados por IA, el sistema entra en un bucle de autorreferencia al utilizarlos como fuente de aprendizaje. Este fenómeno, conocido como colapso del modelo, conduce inevitablemente a una progresiva degradación de los resultados generados. Si la IA bebe cada vez más de sí misma y menos de fuentes humanas genuinas, deja de ser útil.
Esta retroalimentación tóxica no sólo empobrece a la diversidad lingüística, sino que pone en peligro el futuro mismo de la comunicación digital. Las lenguas minoritarias son especialmente vulnerables a este proceso aunque todas están expuestas, también el inglés. Si la generación automática no refleja las variantes culturales, sino sólo una versión reducida y normativizada, quien dictará el futuro de la lengua no seremos sus usuarios, ni el IEC, en el caso del catalán, sino que lo hará ChatGPT. La hegemonía algorítmica puede convertir un corpus digital rico y plural en una pobre cotorra estocástica.
No está todo perdido. Si nosotros con nuestros textos, te quiero tortilla, somos los que hemos hecho la IA, también somos los que la podemos deshacer –o al menos enriquecer–. El humorista británico Ken Cheng demuestra, por reducción al absurdo, que la IA nunca podrá, entre monos en la cara, escribir como él. En su LinkedIn publica un texto donde dice que lo mejor, tengo una bestia dentro de mí, contra el allanamiento del lenguaje es precisamente la imprevisibilidad humana. Si la IA aprende de lo que escribimos, podemos, hombres y mujeres de cabeza erguida, resistir su estandarización: sembrando ruido, poesía, contradicción, disparate. Cheng lo hace intercalando absurdidades en su texto, eau de toilette. Una forma de sabotaje sutil y de autodefensa cultural.
Ceder el control del lenguaje nunca ha terminado bien para los cagamiques. Deberíamos tenerlo presente sino es que queramos acabar siendo nosotros quienes un día hablamos como máquinas en un sunny day. - Josep Maria Ganyet.