Análisis de la voz

 

Dentro de los métodos de detección del engaño a nivel fisiológico que trate con anterioridad  en el post “Detección del engaño – métodos fisiológicos”, están el polígrafo, EEG (Electroencefalograma), seguimiento ocular (eye-traking), fmri (funtional magnetic resonance imaging), termografía del rostro, administración de drogras (pentotal sódico, …) y análisis de la voz.

Este último método se basa en el estudio de los micro-temblores de las cuerdas vocales y las variaciones que se producen en la onda fónica, perteneciendo al canal paralingüístico en el que se puede evaluar el timbre, el tono, el ritmo, los silencios, el volumen, etc.

Este método tiene la ventaja de que no es tan invasivo es decir no incomoda tanto como el polígrafo, ya que normalmente se hace un interrogatorio pautado, mientras se graba por parte de un ordenador que contiene un software de análisis (PSE-Psychological Stress Evaluator, PSA- Psychological Stress Analysis, VSA-Voice Stress Analysis, CVSA-Computerized Voice Stress Analysis, LVA-Laayred Voice Analysis, …) que ofrece resultados de forma directa y permite también el estudio posterior.

Las cuerdas vocales son músculos y como el resto se tensan ante situaciones de estrés, una de estas situaciones es la mentira, ya que el esfuerzo cognitivo que supone mentir tensiona nuestra musculatura.

Cuando narramos la verdad nuestro cerebro lo único que hace es recordar los sucesos que cuenta de forma secuencial tal como ocurrieron, esto permite que pueda dar mayor nivel de detalle y que el discurso sea fluido, pero si mentimos debemos de construir una historia creíble, es decir coherente que además no aporte la información que queremos ocultar y esto debemos hacerlo de forma rápida. El problema al mentir viene por ser un proceso cognitivo con mayor gasto energético y más complejo al tener que encajar cada elemento que introducimos, de ahí que se tienda a ser menos detallista en las explicaciones.

Al mentir tensamos las cuerdas vocales y al aumentar la tensión disminuyen los micro-temblores que normalmente oscilan entre 8-14 ciclos por segundo y que incluso pueden llegar a desaparecer, pero nuestro sistema auditivo no nos permite percibir estas variaciones de la modulación de la frecuencia que quedan fuera de nuestro umbral de sensibilidad, por lo que sólo mediante un sistema de muestreo intenso por parte de un equipo electrónico nos permitirá su análisis.

La mayoría de los indicadores funcionales del estrés se atribuyen al SNA-Sistema Nervioso Autónomo, por otro lado el temblor fisiológico como se ve en el mecanismo de voz está controlado por el SNC-Sistema Nervioso Central. En la medida que avanza una situación de estrés el SNA-Sistema Nervioso Autónomo gana dominio en la situación y los micro-temblores tienen tendencia a ser suprimidos y la modulación de la frecuencia de la voz se modera o puede también desaparecer.

Los programas más avanzados suelen distinguir diferentes situaciones emocionales (estresado, ansioso, mentiroso, etc.) con grados de probabilidad (alto, medio, bajo), para llegar a esta “precisión” se deben de probar en laboratorio los algoritmos(1) empleados que hacen evaluaciones matemáticas de muestreo estadístico que normalmente se basan en la implementación del cálculo del espectro a través de la “Transformada  de Fourier”, teniendo especial cuidado en que la entrada reúna las características de calidad del sonido en toda su amplitud, para que algún parámetro desajustado no provoque ruidos y dificulte unos resultados correctos, los cuales se representan en gráficas de dos dimensiones (frecuencias y tiempo), utilizando como tercera dimensión el color (energía).

El algoritmo(1) más famoso actualmente es el LVA que hace un análisis por capas hasta un total de 14 y tiene un coste de entre 10.000 a 30.000 dólares, en las cuales diferenciando el género y las características personales hacen múltiples análisis con respecto a la intencionalidad de lo que expresemos utilizando más de 120 parámetros emocionales, su teórica eficacia se aproxima al 90%, se utiliza en cuerpos y fuerzas de seguridad, terrorismo, aeropuertos, negociaciones, etc. Pero no tiene contrastados sus resultados, por lo que actualmente no se acepta como prueba judicial.

Este tipo de herramientas son de gran utilidad para hacer la selección de sospechosos en lugares de mucho tránsito como aeropuertos, pueden trabajar a partir de reproducciones y de comunicaciones telefónicas, por lo que son complementarias a otras técnicas como el análisis del comportamiento no verbal.

Aunque personalmente, después de leer de diferentes fuentes parece que la marca sobrevalora los resultados con respecto a su algoritmo (LVA), su eficacia sería superior al 70% y teniendo en cuenta otros métodos es un resultado razonable.

Están apareciendo las primeras aplicaciones de este estilo ligadas a los teléfonos, quizás pronto tengamos la posibilidad de poder tener un software fiable en este tipo de dispositivos que nos permita tener datos adicionales en nuestras conversaciones e incluso valoraciones o historial de nuestros interlocutores.

La voz es un instrumento emocional que bien analizado con el tiempo nos podrá aportar incluso la detección de trastornos físicos o psíquicos, pues refleja los ritmos cerebrales en los que podremos identificar e interpretar su variabilidad, el estudio de los resultados y de las nuevas investigaciones mejoraran los actuales algoritmos(1), ampliando las actuales posibilidades.

  • Conjunto ordenado de operaciones sistemáticas que permite hacer un cálculo y hallar la solución de un tipo de problemas. Actualmente ese conjunto de operaciones se codifican en ordenadores.

Ejemplo: Miro la variación de la onda sonora para evaluar su fluidez. Una vez tengo los valores recogidos por el micro de entrada, la onda sonora se convierte en datos distribuidos en el tiempo que se pueden estudiar matemáticamente.

Deja un comentario