Skip to main content

Les paraules que construïm

Quan les paraules manquen

Siguis petit o gran, arriba un moment en què vols parlar i et manquen les paraules. De vegades, perquè no les coneixes; en altres moments, perquè vols descriure coses que ningú coneix. I, així, paraules que ja existeixen adopten un altre significat. D’aquest procés semàntic se’n diu extensió de significat.

Per exemple, una cellŭla era en llatí una habitació petita. En Robert Hooke, al segle XVII, va observar una làmina de suro al microscopi i va descriure unes cèl·lules que li recordaven els petits compartiments o habitacions d’un rusc, i que ara entenem com una unitat estructural i funcional dels éssers vius. I, amb el temps, també parlem de cèl·lules terroristes per descriure una estructura base en organitzacions criminals.

La investigadora ICREA Gemma Boleda de la Universitat Pompeu Fabra (UPF) i els seus col·laboradors han estudiat si totes les llengües comparteixen formes similars de crear noves paraules d’aquesta manera. I el que han observat, mitjançant models computacionals i dades de 1.400 llengües, és que les extensions de significat (errònies) que fan els nens quan estan aprenent el llenguatge són de fet molt semblants a les extensions de significat que s’observen en l’evolució de paraules al llarg de la història d’una llengua. De fet, el que han vist és que quan entrenen un model computacional amb dades històriques poden predir amb prou precisió què passa durant el desenvolupament lingüístic dels nens. I a l’inrevés, si entrenen el model amb dades de com els nens usen les paraules quan les estan aprenent, poden predir com evoluciona el significat de les paraules al llarg del temps.

Quan les paraules ens fan diferents

Malgrat aquesta creativitat compartida, no hi ha dues persones que sàpiguen exactament les mateixes paraules, ni que les facin servir de la mateixa manera. Per això, entenem que parlem una mateixa llengua quan compartim un conjunt de paraules que de mitjana usem de certa manera.

Tot i que, recentment, l’investigador ICREA Dan Dediu de la Universitat de Barcelona (UB) i els seus col·laboradors han descobert que aquesta llengua compartida no és el resultat mitjà d’una majoria, sinó que també recull la diversitat de les minories parlants. Dit d’altra manera, quan parlem de llengua, la “tirania de les masses” no sempre guanya.

Per demostrar-ho van crear un joc amb diferents microsocietats, cadascuna de quatre persones. Inicialment, tots els participants van aprendre els noms d’unes criatures desconegudes en un llenguatge senzill i artificial. I després van haver de parlar entre ells tot sobre aquestes criatures.

En l’experiment, la comunicació es feia sempre per escrit, amb teclats en què, en alguns casos, un dels participants tenia restringides les tecles “a” i “k”, tot i que la resta de la microsocietat no n’era conscient.

En les microsocietats amb una persona amb capacitats comunicatives diferents (tecles restringides), el llenguatge comú va evolucionar de manera diferent: amb més elements innovadors, però també amb més dificultats de comunicació. I el que és encara més interessant, els investigadors van observar una adaptació de tota la microsocietat per a integrar la manera d’expressar-se del participant minoritari. Ara bé, en comparar l’adaptació de les diferents microsocietats de l’experiment, els autors identifiquen diferències en funció de la flexibilitat cognitiva del grup, inclosa la capacitat de flexibilitzar les normes lingüístiques per a incloure les minories.

Quan no sabem del que parlem

I si parlar de petits extraterrestres inofensius és complicat, imagineu què passa quan parlem d’emocions! Doncs que és tan complex que ni tan sols tenim un tipus de paraules per a parlar-ne.

La investigadora ICREA Martina Wiltschko a la Universitat Pompeu Fabra (UPF) ha estat la primera a preguntar-se per què no existeixen categories gramaticals concretes per a codificar les emocions, com sí que passa quan parlem del temps o de l’aspecte. La Martina argumenta que si les emocions fossin primitives, és a dir, reflexos innats i universals, seria esperable trobar-ne reflexos gramaticals també universals, ja que hi ha una forta interdependència entre llenguatge i emoció: en l’evolució, en el desenvolupament biològic, en la neurociència… Per això, el fet que no hi hagi una categoria gramatical per a parlar de les emocions suggereix que les emocions són construïdes.

De fet, les emocions s’expressen a tots els nivells gramaticals, però sempre a partir de recursos ja existents. Quan s’introdueixen elements que identifiquem com a característics d’una emoció —exclamatius, afectius… —, aquests no codifiquen una emoció plena, sinó que afegeixen una nova dimensió a una realitat: l’anticipació d’un esdeveniment, l’avaluació d’un resultat, la resposta davant un fet que no esperàvem…

I és per això que la Martina proposa la hipòtesi de l’espina dorsal emocional, en la que postula que els mecanismes de construcció d’expressions lingüístiques complexes són els mateixos que els responsables de la construcció de les emocions. És a dir, que la capacitat innata per al llenguatge i la nostra capacitat d’emocionar-nos són el resultat d’una mateixa estructura cognitiva, cosa que hauria de tenir-se en compte en qualsevol model avançat de cognició humana.

Quan la intel·ligència artificial no ens entén

I arribats aquí, s’obre una nova qüestió: els models de llenguatge grans —LLM per les seves sigles en anglès— que s’usen en intel·ligència artificial són bons models de la nostra cognició? Realment ens entenen quan preguntem alguna cosa?

Per a respondre aquesta pregunta, la investigadora ICREA Evelina Leivada de la Universitat Autònoma de Barcelona i un equip de col·laboradors internacionals van avaluar set LLMs d’última generació —com ara ChatGPT o Gemini—, en tasques de comprensió lectora que són simples per a la majoria de les persones. En tots els casos, van fer preguntes de comprensió sobre frases curtes amb estructures senzilles i verbs d’alta freqüència, evitant la negació i els pronoms per reduir al mínim la complexitat. A més, cada pregunta la van fer 3 vegades. I van comparar les respostes d’aquests LLMs amb les que van donar un grup de 400 persones.

Els resultats són sorprenents, i potser també il·lusionadors, perquè els humans van superar amb escreix els LLMs, amb respostes majoritàriament exactes i estables. Per altra banda, els LLMs no només erraven sovint, sinó que també eren menys consistents.

L’Evelina i els seus col·laboradors suggereixen que això demostra que els models d’IA de fet no entenen el llenguatge de la mateixa manera que els humans. Les seves respostes revelen una comprensió superficial i la manca de mecanismes equiparables a les capacitats lingüístiques humanes. Els LLMs  són, senzillament, aproximacions estadístiques superficials de la cognició humana.

Així doncs, ara com ara, no hi ha dubte que les paraules encara ens diferencien de les màquines.