Optimizan con IA un sistema de comunicación para personas con dificultades en el habla

Especialistas del CONICET participan en el desarrollo y optimización de sistemas de comunicación aumentativos y alternativos (SAACs)
Compartir:

Investigadores de CONICET trabajan en conjunto con la empresa Neufitech de la ciudad de Bahía Blanca, que desarrolla Sistemas de comunicación aumentativos y alternativos (SAACs) y otros productos de alta tecnología vinculados a la evaluación neuropsicológica, orientados a ofrecer soluciones a personas con dificultades para comunicarse mediante el habla. Los SAACs de alta tecnología son sistemas de comunicación basados en pictogramas y teclados virtuales, a través de los cuales, usuarios con dificultades en el habla pueden transmitir mensajes.

El proyecto fue uno de los seleccionados en la segunda edición de la convocatoria Soluciones Innovadoras para Desafíos de Software, organizada por el Ministerio de Ciencia, Tecnología e Innovación y la Fundación Sadosky en 2023, destinada a financiar iniciativas de innovación en software y servicios informáticos de empresas nacionales que brindan soluciones a demandas concretas de la sociedad.

El doctor en física Matías Núñez, y el biólogo Francis Felici, del Instituto de Investigaciones en Biodiversidad y Medioambiente (INIBIOMA, CONICET, Universidad Nacional de Comahue) y Alejandro Wainselboim, del Instituto de Ciencias Humanas, Sociales y Ambientales (INCIHUSA, CONICET) son los que llevan adelante la propuesta, Matías Nuñez es el líder del proyecto de investigación, sus líneas de trabajo están vinculadas a aplicaciones de machine learning (aprendizaje automático) en los campos de la biología evolutiva, la física cuántica y la epidemiología, explicó que trabaja en temáticas relacionadas al campo de la inteligencia artificial (IA) “estábamos colaborando con Alejandro Wainselboim, biólogo lingüista de Mendoza, y nos conectamos con Gustavo Gassaneo de Neufitech para presentarle el proyecto. El interés era incorporar machine learning con procesamiento de lenguaje natural a la interface de comunicación desarrollada por la empresa, con el objetivo concreto de hacerla más ágil y así, mejorar la calidad de vida de la gente que los usa como única forma de comunicación”.

La interfaz de comunicación desarrollada por la empresa bahiense Neufitech consiste en un detector de movimiento ocular y un software que toma esos movimientos y los traduce a la posición de un cursor en una pantalla. De esta forma, los usuarios eligen las diferentes palabras para escribir, esas palabras o conjunto de palabras están representadas por pictogramas (signos pictóricos que pueden entenderse sin texto ni explicaciones adicionales). También, es traducido a un sintetizador de voz opcional para pasar del sonido a lo escrito. El sistema basado en pictogramas se adecúa a cada persona y la idea para mejorar el enfoque inicial fue crear un predictor de pictogramas con el objetivo de acelerar este proceso, “se considera que el sistema de comunicación es aumentativo porque puede aumentar la capacidad de comunicarse a personas con discapacidad. En este caso, un detector ocular monitorea el movimiento de los ojos, así la persona puede mover un cursor en la pantalla y elegir pictogramas para escribir y comunicarse. Esto lleva un tiempo de espera que hace lenta la comunicación y nuestra tarea inicial fue acelerar este proceso para mejorar la interacción del usuario/a con la interfaz y mejorar su comunicación. Ahora apuntamos a potenciar las posibilidades de interacción y experimentación de las personas usuarias con el sistema para comunicarse y desarrollar su creatividad” explicó el Dr Núñez.

Para cumplir este objetivo, los investigadores aplican herramientas de procesamiento del lenguaje natural con machine learning, “en la primera parte del proyecto, utilizamos algo bien básico y concreto, modelos de n gramas que calculan la estadística del lenguaje y en base a eso pueden hacerse predicciones sobre las palabras que siguen a un texto dado” Lo desarrollamos adaptándolos para el uso de pictogramas, tal cual propone la interface desarrollada por la empresa. La idea en la segunda parte del proyecto es aplicar modelos de lenguaje de gran tamaño, large language models (LLM), combinado con modelos de imágenes. El ejemplo más popular de un LLM es ChatGPT, pero en nuestro caso nos enfocamos al uso de modelos de lenguaje de código abierto”, sostiene Núñez sobre sus aportes al proyecto, y destaca que en esa primera etapa participaron también Victoria Vampa, de la Facultad de Ingeniería en la Universidad Nacional de La Plata, y Federico Holik, investigador del CONICET en el Instituto de Física de La Plata (IFLP, CONICET-UNLP).

Sobre el uso del sistema, detalló que los usuarios “podrían ampliar su interacción, expresividad y lo que pueden hacer con la computadora, no sólo como predictor de pictogramas sino también como herramienta de creatividad. Para una persona inmovilizada que solo puede comunicarse a través del movimiento de sus ojos, estas nuevas funcionalidades podrían ser un gran cambio para su calidad de vida”. Así, en esta segunda etapa se agregan nuevas funcionalidades al sistema para potenciar las capacidades de expresión de las personas, “hoy cualquier persona con un teléfono puede acceder a ChatGPT, y el machine learning que es una sub rama de la IA, el avance que ha tenido hasta ahora está determinado por el desarrollo de diferentes arquitecturas para estas redes neuronales y el número de neuronas que las componen. A más cantidad de neuronas, más poder de cálculo se necesita y más poderoso es el modelo. Estos avances van a traer cambios radicales en todos los campos, estamos recién en el comienzo. Lo veo de una manera optimista porque puede, justamente, aumentar las capacidades humanas”, aseguró.

 

El desafío que propone el proyecto, es que busca conectar el sector privado con la investigación básica “es un incentivo para que los investigadores apliquen sus conocimientos y habilidades en problemáticas concretas con impacto directo en la sociedad, participaron investigadores de diversas disciplinas como la matemática, un biólogo lingüista, un biólogo matemático, dos físicos cuánticos, es decir, una interdisciplina interesante. Esto se tendría que incentivar, apoyar y que sean cada vez más”. La articulación del sistema científico tecnológico con diversos actores de la sociedad permite potenciar proyectos de innovación y desarrollo, promoviendo y brindando respuesta a las problemáticas sociales puntuales.

 

Fuente: Área de Comunicación CONICET Patagonia Norte, INIBIOMA (CONICET-UNCo).

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *