Las consonantes son producidas por movimientos o gestos articulatorios rápidos, un estrechamiento o restricción en la cavidad bucal, organizados en unidades silábicas, cuyo núcleo es la vocal. En las consonantes se produce l muy importante, a veces completa, como en las oclusivas.
De hecho, no es posible pronunciar algunas consonantes de forma aislada, sin la ayuda de una vocal.
Una vocal presenta una apariencia estable, más o menos plana en dirección horizontal que al ser precedida o seguida de una consonante su trayectoria formántica se ve alterada hacia arriba o hacia abajo por influencia de esa consonante.
Liberman, Harris, Hoffman y Griffith sintetizaron una serie de 14 estímulos formados por representaciones esquemáticas de F1 y F2 escuchados por el Pattern Playback.
Se comprobó que todos los estímulos eran iguales excepto en la transición de F2, que variaba de forma gradual desde un inicio bajo hasta un inicio alto.
Los experimentos que estudian la percepción categórica utilizan dos tipos de tareas, cuyos resultados se comparan entre sí:
- En la tarea de identificación se presenta un único estímulo en cada ensayo y el oyente debe identificarlo indicando la etiqueta o nombre del estímulo; en este caso, de qué consonante se trata.
- En las tareas de discriminación los estímulos se comparan entre sí. Hay varios paradigmas experimentales posibles. Así, en el paradigma AX se presenta un estímulo y a continuación otro, que puede ser el mismo estímulo repetido u otro distinto, en la que el oyente responde igual o diferente, mientras que en un diseño más complejo, ABX, se presentan dos estímulos sucesivos que siempre son distintos y, a continuación se presenta un tercer estímulo que siempre es uno de los dos anteriores, de forma que el oyente debe decidir cuál de los dos es este tercer estímulo.
Ambas tareas pueden resultar más fácil o difícil manipulando ciertas variables, entre ellas el tiempo que media entre los estímulos. Cuando la percepción es de tipo categórico, la identificación es constante dentro de una categoría y al cambiar de categoría, la etiqueta cambia también bruscamente, mientras que dentro de una misma categoría los estímulos son difícilmente discriminables entre sí y las respuestas rozan el nivel de azar (50%).
Prácticamente todas las lenguas del mundo tienen consonantes oclusivas, aunque su distribución varía de unas a otras. En el castellano existe una secuencia de los siguientes movimientos articulatorios:
- Movimiento 1: oclusión o interrupción completa, durante varias decenas de milisegundos, de la salida de aire de la boca y, por lo tanto, de la energía acústica, que se realiza con los labios en las consonantes labiales /b/ y /p/, con la lengua contra los dientes en las dentales castellanas /t/ y /d/ o con la parte posterior de la lengua contra el velo del paladar en las velares /g/ y /k/.
- Movimiento 2: liberación del aire.
- Movimiento 3: comienzo de vibración de las cuerdas vocales para el inicio de la vocal que sigue a la oclusiva.
Labiales | Dentales | Velares | |
Sordas | / p / | / t / | / k / |
Sonoras | / b / | / d / | / g / |
Los estudios demuestran que existe una sincronización temporal muy fina, de milisegundos, entre estos tres movimientos a pesar de que pertenecen a grupos musculares y nervios craneales distintos del que es responsable el área de Broca de la corteza cerebral.
El parámetro estrella en la investigación psicolingüística sobre percepción del lenguaje es el voice onset time o VOT. El VOT es la distancia temporal entre los movimientos 2 y 3. Las oclusivas sordas (/p/, /t/, /k/) se diferencian de las sonoras (/b/, /d/, /g/) en que tienen un VOT más largo que éstas.
La percepción categórica confiere al oyente la ventaja de centrarse en los aspectos de la señal que son importantes para identificar los fonemas e ignorar variaciones no esenciales dentro de la categoría fonética. No obstante, existen ciertos factores que dificultan la percepción del habla:
- Ruido ambiental
- Diferencias individuales
- Superposición de hablas
- Rapidez en la producción del habla
- Rapidez desvanecimiento del habla
- Continuidad (no segmentación en palabras)
- Ausencia de invarianza (no correspondencia exacta entre los estímulos acústicos y los segmentos fonéticos)