La noción de rasgo. El caso de las consonantes oclusivas del español

Hernán Emilio Pérez

(Publicado en Onomazein 6, 2001, pp. 327-336)

[Resumen - Abstract]

En su búsqueda interminable del Grial, los Caballeros de la Mesa Redonda nos recuerdan a los fonetistas de hoy: no sabían lo que era el Grial, pero nunca renunciaron a la esperanza de encontrarlo. Era el misterio del Grial el que los obsesionaba, como es el misterio de los rasgos distintivos que hoy nos fascina.

Pierre Delattre

1. Antecedentes

Uno de los problemas teóricos más importantes en fonología clásica ha sido determinar las unidades mínimas para la descripción fonológica. Si se considera al fonema como una unidad indivisible, cada fonema debe ser tratado como absolutamente diferente de los otros. En consecuencia, la descripción fonológica consistirá en una lista de símbolos representando los fonemas de una lengua, una lista de las alternancias morfofonológicas de cada uno de ellos y una lista de alófonos con sus correspondientes contextos de realización. Sin embargo, la desventaja de este tipo de descripciones es el gran número de aserciones innecesarias en que debe incurrir y su bajo grado de generalización.

Para resolver este problema se han propuesto dos alternativas: agrupar los fonemas en clases o dividirlos en rasgos. En la actualidad, la opción preponderante es considerar al rasgo como la auténtica unidad básica, debido a que existe una relación simétrica entre rasgos y clases, de modo que cada rasgo define dos clases, la que lo posee y la que no lo posee, aun cuando, se reconoce la importancia del fonema como unidad analítica y estructural.

Desde los comienzos de los estudios en fonética, los fonetistas han clasificado los segmentos conforme a sus propiedades articulatorias. De este modo, las consonantes han sido caracterizadas principalmente por el lugar en el que se ubica el órgano activo al momento de producir el sonido (punto de articulación), la manera como fluye el aire (modo de articulación) y el estatus de la glotis (función de las cuerdas vocales), además de algunos otros factores como la posición del velo, la aspiración, etc. Las vocales, por su parte, han sido caracterizadas de acuerdo con el punto en que la lengua se eleva (anterior, central o posterior), cuánto ésta se eleva (alta, media, baja) y si hay o no redondeamiento labial. Esta es la manera más tradicional, pero también es posible caracterizar los segmentos de acuerdo con sus propiedades acústicas. Un rasgo fonético puede ser definido, también, basándose en las características de la señal acústica que resulta de la articulación de un sonido. En otras palabras, dos segmentos pueden ser o no similares de acuerdo con la manera como son producidos o la manera como suenan.

2. El proceso de producción y percepción de los sonidos del habla: dimensiones y campos de análisis y descripción

La fonología ha utilizado los rasgos fonéticos para describir los contrastes fonológicos en las lenguas, de modo que un rasgo fonético puede ser llamado también rasgo distintivo. Un segmento debe ser caracterizado dando cuenta de todas sus propiedades articulatorias y acústicas (rasgo fonético), mientras que un fonema debe ser caracterizado por un número mínimo de rasgos fonéticos necesarios para distinguirlo de los otros fonemas de una lengua (rasgo distintivo).

Sin embargo, el proceso de producción y percepción de los sonidos lingüísticos involucra al menos tres dimensiones: una fisiológica, una física y una perceptual. Cuando un sonido es caracterizado en términos articulatorios, se está haciendo referencia a la dimensión fisiológica. Cuando un sonido es caracterizado en términos acústicos, se está haciendo referencia a la dimensión física. Cuando un sonido es caracterizado mediante la sensación que éste produce en los oyentes, se está haciendo referencia a la dimensión perceptual. En consecuencia, los estudios fonéticos involucran tres campos de análisis y descripción. Si el estudio se centra en el complejo mecanismo que se activa al momento de producir un sonido, se está trabajando al nivel de la fonética articulatoria. Si el análisis considera las propiedades físicas que definen un sonido lingüístico, entonces se está trabajando al nivel de la fonética acústica. Si el estudio considera la sensación que un sonido lingüístico produce en los oyentes, se está trabajando al nivel de la fonética perceptual.

Fig . 1. El proceso de producción y percepción de los sonidos del habla:
dimensiones y campos de análisis y descripción

Si se define un sonido lingüístico:

Se está haciendo referencia a la dimensión:

Si el estudio se centra en:

Se está trabajando al nivel de la:

En términos articulatorios

Fisiológica

El complejo mecanismo fisiológico que se activa al momento de producir un sonido

Fonética articulatoria

En términos acústicos

Física

Las propiedades físicas que definen un sonido lingüístico

Fonética acústica

Por medio de la sensación que produce en el oyente

Perceptual

La sensación que un sonido lingüístico produce en el oyente

Fonética perceptual

Uno de los problemas fundamentales y aún en discusión es cuál es o debe ser la naturaleza del rasgo distintivo. Si lo que se pretende es que los rasgos distintivos tengan correspondencia con la realidad fonética, entonces surge un problema al caracterizar los fonemas, debido que no existe sólo una realidad fonética, sino que por lo menos tres. Aun cuando se debe consignar que algunos fonólogos valoran al rasgo considerando sólo su capacidad para establecer oposiciones, independientemente de las realidades fonéticas a que éste aluda.

No existe acuerdo acerca de si los rasgos deben ser definidos en términos articulatorios, acústicos o perceptuales. Todo depende de la orientación y del énfasis que se le quiera dar a cada uno de estos aspectos. Si se hace una clasificación de los distintos puntos de vista con que se ha abordado el problema se puede decir que existen cuatro perspectivas, las cuales, muchas veces, se traslapan: a) Una perspectiva puramente teórica, en la que no interesan, sino de manera meramente operativa, los correlatos articulatorios, acústicos y perceptuales de los rasgos; lo que realmente importa es la coherencia de la descripción y la clasificación, es decir, la sustentación del sistema. b) Una perspectiva articulatoria, la más difundida y la que históricamente ha dado origen a la fonética como disciplina, en la cual se intenta clasificar los rasgos desde un punto de vista puramente articulatorio. c) Una perspectiva acústica en la que se intenta encontrar el correlato acústico de los rasgos definidos articulatoriamente, para clasificarlos de esta manera. d) Una perspectiva perceptual en la que se intenta encontrar o etiquetar de alguna manera los correlatos perceptuales de los rasgos definidos a la manera de las tres perspectivas anteriormente mencionadas.

Fig. 2. Puntos de vista con que se ha abordado el problema

Teórico

Lo que importa es la coherencia de la descripción y la clasificación, la sustentación del sistema

Articulatorio

Los rasgos se clasifican en términos articulatorios

Acústico

Se intenta encontrar el correlato acústico de los rasgos definidosarticulatoriamente, para clasificarlos de esta manera

Perceptual

Se describe la sensación que los sonidos del habla producen en el oyente.

Luego se le asigna un nombre al correlato perceptual del rasgo definido teórica, articulatoria o acústicamente.

Sin embargo, abordar el problema desde una de estas perspectivas, solamente, resulta difícil debido a que lo que podamos observar desde cada una de ellas corresponde a distintos correlatos de un mismo fenómeno. De hecho los autores muchas veces mezclan o confunden las dimensiones articulatoria, acústica y perceptual, aun cuando su intención sea observar el fenómeno desde una sola de ellas. Pero esto no resulta extraño si se considera que entre estímulo y respuesta subjetiva hay una relación tan íntima que se suele confundir el estímulo con su sensación correspondiente. En rigor, si queremos profundizar en una de las dimensiones del fenómeno, se debería distinguir lo físico de lo psíquico o lo objetivo de lo subjetivo, pero no siempre es fácil hacerlo.

3. El caso de las consonantes oclusivas del español

En el nivel fonológico, el español presenta una correlación entre dos series de fonemas: las consonantes oclusivas áfonas y las consonantes oclusivas sonoras: /p–t–k/ y /b–d–g/. Es decir, hay al menos un rasgo que permite distinguir estas dos series. Tradicionalmente, la sonoridad ha sido considerada el rasgo fonético que opone /p/ de /b/, /t/ de /d/ y /k/ de /g/. Gili Gaya (1958: 69) define articulatoriamente la sonoridad como "una vibración de cuerdas vocales", mientras que Jakobson y Halle (1980: 59) señalan que acústicamente corresponde a "una onda regular que se manifiesta en los espectrogramas como una banda de bajas frecuencias". Aun cuando se debe consignar que las etiquetas sonoro y áfono aluden a la dimensión perceptual, ya que, en estricto rigor, sonoridad es el nombre que le damos a la sensación que la vibración de cuerdas vocales produce en los oyentes.

Fig 3. Correlatos del rasgo que opone /p-t-k/ de /b-d-g/

Articulatorio

"una vibración de cuerdas vocales" Gili Gaya (1958)

Acústico

"una onda regular que se manifiesta en los espectrogramas como una banda de bajas frecuencias" Jakobson & Halle (1980)

Perceptual

"Sonoridad"

Muchos autores aceptan sin discusión la pertinencia de la sonoridad como rasgo distintivo, pero algunos dudan también que los correlatos articulatorios y acústicos de la sonoridad tengan un efecto real en la discriminación entre estas dos series. Alarcos Llorach (1954), por ejemplo, señala que los rasgos sonoro/sordo oponen /p–t–k/ de /b–d–g/, pero sostiene además, que la idea sonoro sólo significa proporcionalidad de relaciones de /p/ a /b/, /t/ a /d/ y /k/ a /g/ independientemente de las realidades fonéticas que distinguen a estos pares de fonemas. Cressey (1978), respecto del sistema fonológico del español, concluye que la sonoridad distingue algunas series de consonantes. No obstante, para Cressey, la sonoridad es un rasgo meramente operativo; incluso precisa que esta distinción no constituye una solución al problema.

Por medio de diferentes procedimientos, investigaciones instrumentales han probado que, en ausencia de los correlatos acústicos y articulatorios de la sonoridad, un gran número de oyentes continúa discriminando /p/ de /b/, /t/ de /d/ y /k/ de /g/.

Martínez Celdrán (1984) llevó a cabo un experimento en el cual fueron eliminados los primeros 1000 Hz. de grabaciones naturales que contenían ambas series de fonemas y estas grabaciones modificadas fueron sometidas al juicio de oyentes. El autor observó que, de todas maneras, los oyentes continuaban discriminando ambas series. Finalmente, Martínez Celdrán concluyó que la tensión articulatoria era el rasgo fonético que permitía a los oyentes discriminar entre /p–t–k/ y /b–d–g/.

Soto-Barba (1994) llevó a cabo un experimento en el que fueron grabados enunciados en voz cuchicheada los cuales contenían los pares mínimos en cuestión y sometió las grabaciones al juicio de oyentes. El autor observó que los oyentes eran capaces de discriminar los pares mínimos, aun cuando, no hay vibración de cuerdas vocales en la voz cuchicheada. Finalmente, Soto-Barba concluyó que la duración relativa de estas consonantes era el rasgo acústico que permitía discriminar entre ambas series.

Pérez (1998) realizó de un experimento en el que, por medio de procedimientos de análisis y síntesis LPC en enunciados reales, eliminó la banda de bajas frecuencias para la serie /b–d–g/ y creó una banda de bajas frecuencias para la serie /p–t–k/, por otra parte, intercambió los valores de duración absoluta de /p–t–k/ a /b–d–g/ y viceversa. Luego, sometió a juicio de oyentes los enunciados sintetizados. Finalmente, el autor pudo observar que en ausencia o presencia de la banda de bajas frecuencias no había confusión en la discriminación entre ambas series; mientras que había una tendencia moderada, pero no regular, a confundir un fonema con su opuesto al escuchar los enunciados en que las duraciones absolutas habían sido intercambiadas.

Fig. 4. Investigaciones experimentales que han probado que en ausencia de los correlatos articulatorio y acústico de la sonoridad un gran número de oyentes continúa discriminando entre /p-t-k/ y /b-d-g/

 

Experimento

Resultados

Martínez Celdrán (1984)

Se eliminaron los primeros 1000 Hz de grabaciones de habla natural que contenían ambas series de fonemas. Los oyentes continuaban discriminando ambas series.

Soto-Barba (1994)

Se grabaron oraciones en voz cuchicheada que contenían estos pares mínimos. Los oyentes fueron capaces de discriminar ambas series, a pesar de no haber vibración de cuerdas vocales en la voz cuchicheada.

Pérez (1998)

La banda de bajas frecuencias fue eliminada para el caso de la serie /b-d-g/ y una banda de bajas frecuencias fue creada por medio de síntesis para el caso de la serie /p-t-k/ y, por otro lado, las duraciones absoluta de /p-t-k/ y /b-d-g/ fueron intercambiadas. En ausencia o presencia de la banda de bajas frecuencias no hubo confusión en la discriminación entre ambas series; mientras que había una tendencia moderada, pero no regular, a confundir un fonema con su opuesto al escuchar los enunciados en que las duraciones absolutas habían sido intercambiadas.

Con frecuencia, la tensión articulatoria ha sido señalada como un rasgo que distingue /p–t–k/ de /b–d–g/. Gili Gaya (1958), al clasificar las oclusivas del español, considera, entre otros factores, la acción de las cuerdas vocales y la tensión muscular. Con este criterio, clasifica a las sordas /p–t–k/ como más tensas que las sonoras /b–d–g/. Agrega más adelante que las denominaciones fuerte y débil (relacionadas con la fuerza de articulación) a pesar de su vaguedad expresan valores relativos que el oído percibe dentro de cada idioma, y que pueden servir también para comparar fonemas iguales de lenguas diferentes. Ya se ha mencionado a Martínez Celdrán (1984), quien después de investigar la percepción de la sonoridad de algunas consonantes del español (entre ellas las oclusivas) mediante la eliminación de los primeros 1.000 Hz en grabaciones de habla natural, concluye que en la discriminación entre las tradicionalmente llamadas sordas y sonoras, predomina como rasgo funcional la tensión por sobre la sonoridad. Canellada y Kuhlman (1987) afirman que entre una consonante sorda y una sonora existe una diferencia de tensión, es decir, las sordas son más tensas que las sonoras. Sin embargo, la tensión es un correlato del tipo perceptual, ya que es la sensación que provoca en el oyente la articulación con mayor fuerza o con mayor duración de un sonido lingüístico. La sensación de tensión o relajación de un sonido lingüístico puede corresponder al correlato perceptual de distintos rasgos fonéticos, por lo tanto, no existe un correlato acústico o articulatorio claro para este rasgo perceptual. Además, desde el punto de vista teórico, la oposición tenso vs. laxo no es privativa, sino gradual. Por lo mismo, tal oposición resulta absolutamente relativa. Se suma a esto la afirmación de Quilis (1981) quien sostiene que la división tensa–débil no tiene razón de ser en español. Según Quilis es norma constitutiva de la fonética general que las consonantes sordas sean más tensas que las sonoras; por lo tanto, nuestras oclusivas sordas serán normalmente tensas, y su correspondiente serie sonora, débil.

Lisker y Abramson (1964) han propuesto el tiempo de inicio de la sonoridad (Voice Onset Time V.O.T.) como una manifestación acústica más apropiada para clasificar las consonantes /b–d–g/ y /p–t–k/ en diferentes lenguas del mundo. Castañeda (1986) define el V.O.T. como el "tiempo que transcurre entre la explosión y el momento en que empieza la sonoridad" (Castañeda 1986:93). Castañeda estudió el V.O.T. de las oclusivas sordas y sonoras españolas y concluyó en términos generales que, al tomar como referencia los valores del V.O.T., se ve una clara diferencia entre /p–t–k/ y /b–d–g/, pues en los primeros el V.O.T. siempre presenta valores positivos mientras que en los segundos, negativos. Borzone y Gurlekian (1980) realizaron un estudio descriptivo de los rasgos acústicos de las consonantes oclusivas del español y concluyen que en la distinción de la sonoridad son responsables la duración del silencio, la intensidad del ruido y el V.O.T. El V.O.T. obviamente clasifica ambas series de consonantes de un modo objetivo y cuantificable. Sin embargo, ni la sonoridad ni el V.O.T. permiten explicar lo que ocurre en el habla cuchicheada en que no hay vibración de cuerdas vocales. Además V.O.T. es otra manera de hablar de sonoridad, pues si se afirma que una consonante tiene valores negativos de V.O.T., se está diciendo que es sonora, ya que en estricto rigor esto sólo quiere decir que hay vibración de las cuerdas vocales y que ésta ha comenzado antes de que se produzca la oclusión. Por otro lado, si se afirma que una consonante tiene un V.O.T. positivo se está diciendo que es áfona, ya que esto sólo quiere decir que entre el segmento anterior a la oclusiva y la barra de explosión de ésta ha habido un silencio y que la sonoridad ha comenzado después de la oclusión. El índice numérico que entrega el V.O.T. es en realidad la duración de la sonoridad, y en consecuencia de la consonante, para el caso de /b–d–g/; y la duración del silencio que media entre la barra de explosión y la vocal, para el caso de /p–t–k/. El V.O.T. no es un rasgo acústico propiamente tal, sino que es una unidad de medida que conjuga en un solo índice la interacción de la duración de la sonoridad previa a la barra de explosión de /b–d–g/ con el silencio posterior a la barra de explosión de /p–t–k/, sin considerar en absoluto el silencio previo ésta, es decir, dejando fuera del análisis por lo menos el 80% de la duración total de la consonante.

4. Conclusiones

Existen razones, por un lado, no sólo para cuestionar la validez de la sonoridad (entendida como presencia o ausencia de banda de bajas frecuencias) como el rasgo distintivo entre las consonantes oclusivas del español sino que, definitivamente, para descartarla como elemento dentro del análisis; y por otro lado, para considerar que la duración del segmento, ya sea relativa o absoluta, es mucho más relevante de lo que hasta ahora se ha pensado en la discriminación entre estas dos series. Resultaría posible también pensar que la interacción de ambos rasgos fonéticos sea el correlato acústico del rasgo distintivo, pero como ya se ha dicho, no existen pruebas experimentales de la más mínima relevancia de la sonoridad en la discriminación entre /p-t-k/ y /b-d-g/.

Finalmente, se puede ver que, por distintas razones, ni el V.O.T. ni la tensión pueden ser considerados como correlatos, en ninguno de los niveles de análisis, del rasgo distintivo que opone a las dos series de consonantes oclusivas del español.


Referencias

Alarcos Llorach, E. 1954. Fonología española. Madrid, Gredos.

Borzone, A. M. & J. A. Gurlekian. 1980. "Rasgos acústicos de las oclusivas españolas" en Fonoaudiológica 26 (3), pp. 326–330.

Canellada, M. J. & J. Kuhlmann. 1987. Pronunciación del español. Madrid, Castalia.

Castañeda, M. L. 1986. "El V.O.T. de las oclusivas sordas y sonoras españolas" en Estudios de fonética experimental II. Barcelona, P.P.U., pp 91–110.

Cressey, W. 1978. A generative view. Washington, Georgetown University Press.

Gili Gaya, S. 1958. Elementos de fonética general. Madrid, Gredos.

Jakobson, R. & M. Halle. 1956/1980. Fundamentos del lenguaje. Madrid, AyusoPluma

Lisker, L. & A.S. Abramson. 1964. "A cross–language study of voicing in initial stops: acoustical measurement" en Word 20, pp. 384-422

Martínez Celdrán, E. 1984. "¿Hasta qué punto es importante la sonoridad en la discriminación auditiva de las obstruyentes mates del castellano?" en Estudios de fonética experimental I. Barcelona, P.P.U., pp 243–291.

Pérez, H. E. 1998. "Incidencia de dos rasgos acústicos en la percepción de la correlación /p–t–k/ vs. /b–d–g/" en R.L.A. 36, pp. 113-126.

Quilis, A. 1981. Fonética acústica de la lengua española. Madrid, Gredos.

Soto–Barba, J. 1994. "¿Los fonemas /b/ y /p/ se diferencian por la sonoridad?" en Estudios filológicos 29, pp. 33–37.