La tecnología impulsada por IA podría ayudar a las personas con discapacidades del habla a trabajar de forma remota | CNN

23 septiembre, 2024 Editor Editor

(CNN) – Probablemente hayas experimentado la frustración de que un altavoz inteligente o un asistente de inteligencia artificial no te escuchen o te entiendan bien. Para las personas con un habla no convencional, esto puede suceder en casi todas las interacciones con este tipo de tecnología. La empresa israelí Voiceitt pretende cambiar eso.

Al utilizar modelos de voz personalizados, su sistema de reconocimiento de voz impulsado por IA ayuda a las personas con problemas de habla, causados por afecciones como parálisis cerebral, Parkinson, síndrome de Down o accidente cerebrovascular, a comunicarse de manera más efectiva con personas y dispositivos digitales.

Para Sara Smolley, cofundadora de Voiceitt, facilitar el reconocimiento de voz para patrones de habla no estándar es una misión personal.

“A mi abuela le diagnosticaron la enfermedad de Parkinson de aparición temprana”, dijo. “Cuando yo nací, ella ya había perdido la mayor parte de sus capacidades motoras y su habla se vio afectada”.

Voiceitt se lanzó como aplicación en 2021 y funcionaba como un traductor vocal simple que convertía el habla no estándar en audio. La IA se entrena grabando al usuario mientras dice alrededor de 200 frases comunes.

Smolley dijo que la idea original era facilitar la comunicación en persona, pero la tecnología ahora también se ha adaptado a los trabajadores remotos.

Voiceitt ha desarrollado integraciones con WebEx y ChatGPT, junto con una extensión de Google Chrome, que convierten el habla no estándar en subtítulos que se muestran en la pantalla. La empresa también se está asociando con Zoom y Microsoft Teams.

“Una de las cosas que realmente me llamó la atención fue la importancia de la tecnología de accesibilidad en el lugar de trabajo”, señaló Smolley. “Lo que una rampa (para sillas de ruedas) era para el edificio de oficinas de ayer, Voiceitt es para el lugar de trabajo remoto de hoy”, dijo.

El software se vende como licencia por minuto o por usuario, con precios que van desde los 20 a los 50 dólares. Las licencias se pueden comprar en grandes cantidades para lugares de trabajo e instituciones de salud o educación.

“La gente usa Voiceitt no solo para videoconferencias, sino también para escribir documentos, correos electrónicos, publicar en LinkedIn y acceder a navegadores web mediante la voz”, explicó Smolley. “Esto ha abierto el mundo digital a personas que antes no habrían sido consideradas para ciertos trabajos o no habrían podido comunicarse con colegas o clientes”.

Entre los usuarios de Voiceitt se encuentra Colin Hughes, un ex productor de la BBC que se convirtió en defensor de la accesibilidad . Hughes, que padece distrofia muscular, depende del dictado para sus interacciones digitales, lo que le hace ser muy consciente tanto del potencial como de las limitaciones de las tecnologías actuales. Hughes ha utilizado Voiceitt para redactar correos electrónicos y dictar textos más extensos.

“Descubrí que la aplicación de Voiceitt es impresionantemente precisa con mi habla atípica, y su proceso de entrenamiento y configuración fue sencillo”, dijo Hughes, aunque destacó las deficiencias críticas para los usuarios profesionales. “Muchas personas con problemas de habla y discapacidades en las extremidades superiores necesitan algo más que una conversión de voz a texto”, señaló.

Aboga por funciones como el control del cursor controlado por voz y un reconocimiento de dictado mejorado para redactar contenido largo, y afirma que Voiceitt funciona mejor para mensajes de una sola oración.

Hughes enfatiza la necesidad de una tecnología de reconocimiento de voz más completa que permita a los usuarios hacer cosas como administrar correos electrónicos y formatear documentos usando su voz.

Él ve un futuro en el que la tecnología desempeñará un papel más importante en la accesibilidad y agrega: “Todo este sector necesita una reestructuración. Voiceitt, con un mejor acceso a las principales plataformas, podría ser el que lidere este cambio”.

Según Smolley, en los últimos años se produjeron avances significativos en la tecnología de reconocimiento de voz.

Un ejemplo es el Proyecto de Accesibilidad del Habla, un proyecto de investigación dirigido por el Instituto Beckman de Ciencia y Tecnología Avanzada de la Universidad de Illinois, que recopila datos de voz de personas con diferentes afecciones para construir algoritmos para ayudar a las personas con habla no estándar.

A principios de este año, Apple ( AAPL ) lanzó su función “Escuchar habla atípica” impulsada por IA, que utiliza el aprendizaje automático para reconocer una gama más amplia de patrones de habla.

Con la tecnología que captura y almacena datos personales, como grabaciones de voz, la privacidad puede ser una preocupación para los usuarios. Smolley dice que su empresa cumple con las regulaciones de la Unión Europea, que ella llama “los estándares más altos del mundo en términos de privacidad de datos”.

“Si los datos del usuario se conservan en nuestra base de datos con su consentimiento, se anonimizan y desidentifican, y se utilizan para aumentar nuestra pila de datos y mejorar nuestro algoritmo”, añade.

Smolley cree que la tecnología de Voiceitt puede cambiar la vida de las personas. “Queremos que las personas no sólo sean más independientes en sus vidas y en su trabajo”, afirma Smolley, “sino que también puedan disfrutar de la tecnología y divertirse”.

Source link