6.4. Modelos de reconocimiento de palabras

Un modelo pretende ser una construcción teórica que representa cierta realidad de difícil manejo u observación directa con cierta visión unificadora y de carácter predictivo.

Además, un modelo sigue el principio de falsabilidad, es decir, debe ser refutable por los datos. Según Popper, cada buena teoría científica es realmente una prohibición, así, cuantas más prohibiciones mejor será la teoría y más específicas serán sus predicciones.

Muchos modelos científicos se basan en una analogía como sucede con el modelo de Maxwell cuando el autor concibió las fuerzas electromagnéticas como análogas a los fluidos.

Actualmente, muchos autores apuntan hacia la analogía del propio cerebro.

En el campo específico de la psicolingüística, la analogía del diccionario mental ha tenido gran influencia.

De esta forma, los modelos del acceso léxico se dividen fundamentalmente entre los que defienden un acceso directo al léxico mental y los que consideran la existencia de algún tipo de mecanismo de búsqueda serial.

Modelo cohorte

En los años setenta y siguientes, John Morton planteó un modelo sobre el reconocimiento de las palabras en el que cada palabra estaría representada en la memoria por un dispositivo denominado logogén.

El logogén es un mecanismo que acumula evidencia o activación respecto a una palabra. Así, los logogenes compiten entre sí en la identificación de las palabras y, mientras no están activos, mantienen un cierto nivel de activación basal o de reposo. Se trata de un modelo de acceso directo porque la búsqueda léxica no ocurre de forma serial, sino que desde el principio toda la información es accesible al sistema completo de logogenes y éstos reciben activación en paralelo.

Al sistema de logogenes llega información en paralelo desde tres fuentes distintas:

  1. representaciones ortográficas obtenidas por el análisis visual de las palabras escritas,
  2. representaciones auditivas de las palabras habladas, y
  3. representaciones semánticas procedentes del sistema cognitivo.

No obstante, el sistema de logogenes no hace distinción entre las fuentes, y para él las tres son externas.

De este modo, Morton explica el efecto del contexto, en la medida en que los logogenes disponen de mayor información procedente del sistema cognitivo, necesitará menos información sobre el estímulo (de abajo-arriba) para la identificación de las palabras.

Este modelo interactivo explica la mayor parte de los fenómenos empíricos conocidos en el momento de su formulación:

  • Priming de repetición. Después de que un logogén ha sido activado al identificar una palabra, su activación desciende al nivel de reposo, pero esto no ocurre de forma instantánea, sino que lleva cierto tiempo. Las palabras recién activadas retendrán una activación residual superior a la de reposo durante un corto período de tiempo.
  • Efecto de la frecuencia léxica. Cada logogén tiene un umbral de disparo distinto. Las palabras de alta frecuencia, que son familiares al sistema de logogenes porque se han presentado muchas veces a lo largo de la vida del sujeto, cuentan con logogenes con un umbral más bajo, activándose antes que las palabras poco frecuentes, que tienen umbrales más altos y necesitan mayor cantidad de activación antes de alcanzarlo.
  • Efecto del priming semántico. Los logogenes están conectados entre sí de manera que se comunican la activación, y ésta se extiende entre los logogenes cercanos.

Por otra parte, Coltheart, Davelaar, Jonasson y Besner, sugirieron la existencia de un tiempo límite para reconocer las palabras en el sistema de logogenes. Una vez agotado este plazo sin que se haya disparado ningún logogén, se rechaza el estímulo como no-palabra.

De esta forma, si éste guarda cierto parecido superficial con algunas palabras, se tardará más en el rechazo porque habrá activación parcial de sus logogenes.

Sin embargo, el modelo opera únicamente con unidades léxicas, por lo que no está claro cómo se procesan las unidades subléxicas, como las sílabas y otras.

Además, el modelo predice que debería existir una facilitación clara entre modalidades sensoriales distintas, o priming transmodal de repetición, que no es confirmada por los datos.

Winnick y Daniel demostraron que la lectura en voz alta de una palabra facilitaba su reconocimiento taquistoscópico posterior, pero nombrar una palabra ante un dibujo, o producirla en respuesta a una definición, no influía.

Por esta razón, plantearon una nueva versión del modelo, considerando ahora tres sistemas distintos de logogenes, uno por cada modalidad sensorial o canal de entrada (visual frente a auditiva), más un tercer sistema de salida.

De este modo, los sistemas se mantienen separados sin influencias entre modalidades.

Más tarde, la evidencia experimental posterior sugirió la necesidad de considerar cuatro sistemas: uno para leer, otro para escribir, otro para escuchar y otro para hablar.

Modelo de Forster

Los modelos de búsqueda serial conciben mecanismos semejantes al de identificar una palabra en un diccionario convencional. El modelo de Forster plantea una búsqueda en dos etapas; la primera se llevaría a cabo a través de ficheros de acceso (específicos de una modalidad de información; ortográfica, acústica, fonológica, sintáctica y semántica), y la segunda en un gran archivo maestro o principal.

De esta forma, cuando una palabra se presenta visual o auditivamente, el estímulo de entrada es convertido en una representación perceptiva y enviada al archivo de acceso apropiado para su análisis.

Los ficheros de acceso están divididos en compartimentos ( bins ) separados, donde los ítems están ordenados por la frecuencia de uso, con las unidades más frecuentes al principio, explicando así el efecto de la frecuencia de las palabras en la velocidad de reconocimiento.

Se trata de un modelo de tipo modular porque la información de los niveles lingüísticos superiores (oracional y supraoracional) no incide directamente en el proceso de acceso o localización de las palabras y el único efecto de contexto que puede darse es a través de las referencias cruzadas dentro del fichero maestro, explicando así el priming semántico.

El priming de repetición ocurre porque puede haber un cambio temporal en el orden de los ítems dentro de cada bin, debido a su uso. Las no-palabras se rechazan una vez que ha habido una búsqueda exhaustiva en el bin correspondiente.

Una versión más reciente asume diferentes niveles de actividad para las entradas en los ficheros de acceso, para explicar el priming basado en las similitudes ortográficas entre los estímulos.

En los últimos años, Forster ha incorporado un rasgo de paralelismo sugiriendo que, dentro de cada fichero de acceso, se produce una búsqueda simultánea en todos sus bins.

Otro modelo de búsqueda serial que intentan superar algunas de sus limitaciones es el modelo de verificación de Becker, que pretende dar una explicación más sofisticada del priming semántico y del diccionario de bolsillo, planteando que existen dos diccionarios mentales: uno que contiene información de todas las palabras, y otro que contiene información sólo de las palabras muy comunes, de alta frecuencia, a modo de una especie de diccionario de bolsillo.

Modelo de cohorte

El modelo de Marslen-Wilson supone una solución mixta entre los modelos de acceso directo y los de búsqueda serial, que postula una secuencia ordenada de etapas que se activan paralela y simultáneamente varios elementos léxicos.

Se trata de un modelo concebido únicamente para las palabras habladas que plantea que mientras una persona está escuchando una palabra, desde el principio se activan en paralelo un conjunto finito, o «cohorte», de palabras congruentes con los sonidos iniciales, y todas ellas serían inicialmente candidatos léxicos del estímulo.

Wilson empleó la técnica experimental del sombreado (shadowing) de frases y otros estímulos lingüísticos observando que la percepción de una palabra se basa en un continuo estrechamiento del abanico de candidatos posibles hasta alcanzar el punto de unicidad, momento en que se produciría la identificación léxica.

Sin embargo, este modelo tiene una serie de inconvenientes y es que compartir la posición inicial de las palabras no es una condición indispensable para que se activen los competidores. Además, no explica bien el efecto de la frecuencia léxica como por qué se identifica antes la palabra más frecuente que la menos frecuente.

Modelo TRACE

McClelland y Elman proponen un modelo altamente interactivo para el reconocimiento de las palabras habladas, derivado de un modelo anterior sobre las palabras escritas, formado por múltiples unidades simples conectadas entre sí.

Estas unidades están organizadas en tres niveles de procesamiento:

  1. Unidades de entrada (analizar el input o estímulo entrante, en sus rasgos fonológicos elementales, como sonidos sordos, sonoros).
  2. Fonemas
  3. Palabras

La información fluye desde abajo hacia arriba, pero, al mismo tiempo, los niveles superiores influyen sobre los inferiores, facilitándoles la tarea (Procesamiento top-down). Dentro de cada nivel, las unidades que lo componen están conectadas lateralmente entre sí por conexiones inhibidoras, mientras que por el contrario, las conexiones entre niveles distintos son excitatorias y bidireccionales.

Este modelo puede ser implementado matemáticamente en computadores para llevar a cabo simulaciones. El modelo explica bastante bien los efectos del contexto léxico y fenómenos asociados, como la restauración fonémica y la coarticulación, localizando apropiadamente los límites entre las palabras dentro de una cadena hablada y funciona correctamente con estímulos ruidosos, semejantes a los que se dan en condiciones naturales.

No obstante, uno de sus inconvenientes reside en su propia flexibilidad, además, la manera en que trata el tiempo en el estímulo de entrada, segmentando en cortes iguales, no es muy realista.