Antiguos estudiantes de la Universidad de Stanford están creando la aplicación para cambiar su acento

Una startup llamada Sanas está desarrollando tecnología que tiene como objetivo reducir los malentendidos cambiando el acento de las personas en tiempo real.

Los estudiantes de la Universidad de Stanford escucharon dolor en la voz de su amigo mientras compartía la noticia.

«Chicos, tuve que dejar mi trabajo».

Para ellos, simplemente no tenía sentido. Hablaba inglés y español con fluidez, era muy amable y era un experto en ingeniería de sistemas. ¿Por qué no pudo mantener un trabajo en el centro de llamadas?

El amigo dijo que su acento dificultaba que muchos clientes lo entendieran; Algunos incluso lanzaron insultos por su forma de hablar.

Los tres estudiantes se dieron cuenta de que el problema era más grande que la experiencia de sus amigos. Así que pusieron en marcha una startup para solucionarlo.

Ahora, su empresa, Sanas, está probando un software impulsado por inteligencia artificial que tiene como objetivo eliminar la falta de comunicación cambiando los acentos de las personas en tiempo real. Un trabajador de un centro de llamadas en Filipinas, por ejemplo, normalmente puede hablar por el micrófono y terminar pareciendo alguien de KS a un cliente del otro lado.

Los fundadores de la startup dicen que los centros de llamadas son solo el comienzo. El sitio web de la empresa promueve sus planes como «la charla reinventada».

En última instancia, esperan que la aplicación que están desarrollando sea utilizada por una variedad de industrias e individuos. Podría ayudar a los médicos a comprender mejor a los pacientes, dicen, o ayudar a los nietos a comprender mejor a sus abuelos.

«Tenemos una visión muy grande para Sanas», dice el director ejecutivo Maxim Serebryakov.

Y para Serebryakov y sus cofundadores, el proyecto es personal.

No escuchas las voces de las personas tanto como sus acentos

El trío que fundó Sanas se conoció en la Universidad de Stanford, pero originalmente todos son de diferentes países: Serebryakov, ahora director ejecutivo, de Rusia; Andrés Pérez Sodiri, ahora director financiero, es de Venezuela. y Shun Zhang, ahora director de tecnología, de China.

READ  Las ganancias de Goldman se vieron afectadas por el comercio deficiente y los altos gastos; vacilación de acciones

Ya no son estudiantes de Stanford. Serebryakov y Peres se graduaron; Chang se retiró para concentrarse en devolverle la vida a Sanas.

Lanzaron la empresa el año pasado, dándole un nombre que se puede pronunciar fácilmente en diferentes idiomas «para resaltar nuestra misión global y nuestro deseo de unir a las personas», dice Pérez.

A lo largo de los años, los tres dicen que han experimentado cómo los dialectos pueden interponerse en su camino.

«Todos venimos de entornos internacionales. Hemos visto de primera mano cómo la gente te trata de manera diferente solo por tu forma de hablar», dice Serebryakov. «A veces es desgarrador».

Zhang dice que su madre, que llegó a los Estados Unidos hace más de 20 años desde China, todavía lo hace hablar con el cajero cuando van de compras juntos porque se siente avergonzada.

«Esa es una de las razones por las que me uní a Max y Andrés para construir esta empresa y tratar de ayudar a aquellas personas que piensan que sus voces no se escuchan tanto como sus acentos», dice.

Serebryakov dice que ha visto cómo tratan a sus padres en los hoteles cuando vienen a visitarlo a Estados Unidos, cómo las personas hacen suposiciones cuando escuchan sus acentos.

«Hablan un poco más alto. Cambian su comportamiento».

Pérez dice que después de asistir a una escuela británica, inicialmente tuvo problemas para entender los dialectos estadounidenses cuando llegó a los Estados Unidos.

Y no empiece con lo que sucede cuando su padre intenta usar Amazon Alexa que su familia le regaló para Navidad.

«Descubrimos rápidamente, cuando Alexa encendía luces en lugares aleatorios de la casa y las hacía rosadas, Alexa no entendía en absoluto el acento de mi papá», dice Pérez.

Los centros de llamadas están probando tecnología

El inglés es tEs el idioma más hablado del mundo.. Se estima que 1.500 millones de personas lo hablan, y la mayoría de ellos no son hablantes nativos. Solo en los Estados Unidos, millones de personas hablan inglés como segundo idioma.

Esto ha creado un mercado en crecimiento para aplicaciones que ayudan a los usuarios a practicar su pronunciación en inglés. Pero Sanas está utilizando la inteligencia artificial para adoptar un enfoque diferente.

READ  La nota: la inflación da un duro golpe cuando Biden intenta vender un récord económico

La premisa: en lugar de aprender a pronunciar las palabras de manera diferente, la tecnología puede hacerlo por usted. Ya no habrá necesidad de una formación costosa o que requiera mucho tiempo para reducir el acento. Y la comprensión será casi instantánea.

Serebryakov dice que sabe que los dialectos y las identidades de las personas pueden estar estrechamente vinculados, y enfatiza que la compañía no está tratando de borrar los dialectos o sugerir que una forma de hablar es mejor que otra.

«Permitimos que las personas no tengan que cambiar su forma de hablar para ocupar un puesto, para mantener un trabajo. La identidad y los dialectos son fundamentales. Están entrelazados», dice. «Nunca quieres que alguien cambie su tono solo para complacer a alguien».

El algoritmo de Sanas puede convertir actualmente el inglés desde y hacia los dialectos estadounidense, australiano, británico, filipino, hindi y español, y el equipo planea agregar más. Pueden agregar un nuevo tono al sistema entrenando una red neuronal con grabaciones de audio de actores profesionales y otros datos, un proceso que lleva varias semanas.

El equipo de Sanas tocó dos programas de CNN. En uno, se escuchó a un hombre con acento indio leyendo una serie de frases literarias. Estas mismas frases luego se convierten en dialecto americano:

Otro ejemplo con frases que podrían ser más comunes en la configuración de un centro de llamadas, como «Si me da su nombre completo y número de pedido, podemos continuar y comenzar a hacer la corrección por usted».

Los resultados con acento estadounidense suenan algo artificiales e integrados, como voces de asistentes virtuales como Siri y Alexa, pero Pérez dice que el equipo está trabajando para mejorar la tecnología.

«El tono cambia, pero la entonación se conserva», dice. «Seguimos trabajando para lograr que el resultado sea lo más natural, emocional y emocionante posible».

Pérez dice que los primeros comentarios de los centros de llamadas que han probado esta tecnología han sido positivos. Así que envíe comentarios en su sitio web a medida que se corra la voz sobre su proyecto.

READ  Los latinos están creando aplicaciones de empleo para hispanohablantes Noticias locales

Y ellos dicen Sus planes para la compañía obtuvieron $ 5.5 millones en fondos iniciales de inversionistas a principios de este año..

¿Cómo ven su futuro los fundadores de la startup?

Esto permitió a Sanas incrementar el número de sus empleados. La mayoría de los empleados de Palo Alto, con sede en California, provienen de entornos internacionales. Esto no es una coincidencia, dice Serebryakov.

«Lo que construimos ha resonado en mucha gente, incluso en las personas que contratamos. Es muy emocionante verlo», dice.

A medida que la empresa crece, puede pasar algún tiempo antes de que Sanas aparezca en la App Store o aparezca en un teléfono móvil cerca de usted.

El equipo dice que están trabajando con las empresas de subcontratación de centros de llamadas más grandes en este momento y están eligiendo implementaciones más lentas para usuarios individuales para que puedan mejorar la tecnología y garantizar la seguridad.

Pero eventualmente esperan que cualquiera que lo necesite lo use, también en otros campos.

Pérez prevé que desempeñará un papel importante para ayudar a las personas a conectarse con sus médicos.

«Cualquier segundo perdido debido a un malentendido debido a la pérdida de tiempo o mensajes incorrectos probablemente tendrá un impacto muy grande», dice. «Realmente queremos asegurarnos de que no se pierda nada en la traducción».

Algún día, dice, también podría ayudar a las personas a aprender idiomas, mejorar el doblaje de películas y ayudar a los altavoces inteligentes en los hogares y a los asistentes de voz en los automóviles a entender diferentes dialectos.

Y no solo en inglés, el equipo de Sanas también espera agregar otros idiomas al algoritmo.

Los tres fundadores todavía están trabajando en los detalles. Pero cómo esta tecnología podría mejorar la conectividad en el futuro, dicen, es algo que es fácil de entender.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *