¿Cómo funcionan las aplicaciones de traducción de voz Cat?

¿Cómo funcionan las aplicaciones de traducción de voz Cat?

Probablemente hayas visto aplicaciones que dicen traducir lo que dice tu gato. Pero, ¿pueden realmente traducir el maullido de tu gato al inglés? La respuesta corta es sí, más o menos. Es difícil debido a lo único que es el 'lenguaje' de cada gato, pero pueden acercarse bastante con la tecnología moderna.





Las aplicaciones de traducción de gatos como MeowTalk utilizan una forma de reconocimiento de voz que enfatiza el aprendizaje automático. Miremos más de cerca.





Reconocimiento de voz y aprendizaje automático

Mary Theresa McLean / Pixabay





El reconocimiento de voz funciona grabando la voz y convirtiendo el audio en un archivo de datos digital. Codifica datos como el tono y el volumen como puntos de datos que la aplicación puede analizar y combinar con significados. Micrófonos DPA explica que estos puntos de datos pueden verse muy diferentes según los sonidos de fondo y cómo se pronuncia una palabra.

A veces damos por sentado el reconocimiento de voz, pero es una increíble hazaña de tecnología. Especialmente considerando lo complejo que es el habla humana. Como El Científico explica, cada palabra implica una amplia gama de sonidos o 'fonemas' mezclados entre sí. Conseguir que una computadora entienda el habla es muy difícil. La nueva frontera de los sonidos de los gatos será aún más difícil.



Las aplicaciones que utilizan el reconocimiento de voz se programan con un 'vocabulario' de palabras llamado conjunto de datos. La aplicación luego hace coincidir su discurso con la opción más cercana en su vocabulario de datos.

Cuando comete un error, lo corrige y guarda esos datos para la próxima vez. Esto es parte del aprendizaje automático. Es la forma en que un programa aprende a reconocer el habla incluso cuando no es idéntico al conjunto de datos con el que comenzó.





Relacionado: ¿Qué son los algoritmos de aprendizaje automático? Así es como funcionan

El reconocimiento de voz todavía tiene problemas, especialmente con impedimentos y acentos del habla. Sin embargo, algunas empresas están mejorando el aprendizaje automático para superar estos problemas. Con el tiempo, el aprendizaje automático puede convertir el reconocimiento de voz en una herramienta poderosa.





¿Puedes grabar una llamada en el iphone?

Así es como funciona el reconocimiento de voz para los humanos. Pero, ¿funciona para los gatos?

Reconocimiento de voz frente a reconocimiento de maullidos

Ariana Suárez/ Unsplash

Primero, debemos entender por qué traducir cierto tipo de maullido como 'Tengo hambre' es diferente de analizar el habla humana. El problema es principalmente que la comunicación del gato se basa más en señales no verbales como la postura. Otro problema es la ausencia de un 'lenguaje felino' universal.

De acuerdo con la ASPCA , los gatos salvajes adultos nunca maúllan entre sí, solo a las personas. Otras investigaciones de la sociedad humana agrega que esos sonidos 'no ocurren en el vacío'. Debemos interpretarlos junto con el lenguaje corporal y otros contextos. En muchos casos, estas señales silenciosas son la única diferencia entre un maullido que significa 'tengo hambre' y uno que significa 'quiero jugar'.

Además de este problema, no hay dos gatos que tengan el mismo idioma. Los gatos desarrollan 'lenguajes' personalizados para sus dueños. Estos se basan en parte en la imitación de la voz del dueño y en parte en la personalidad del gato. No hay dos gatos que suenen igual, incluso cuando transmiten el mismo deseo o necesidad. Entonces, ¿cómo se puede traducir el vocabulario del habla de una aplicación para todas ellas?

Aprendizaje automático flexible para gatos

Sonidos de uso gratuito / Unsplash

Aunque a algunos asistentes virtuales les gusta Auto Intento comprender el tono y la emoción, el reconocimiento del habla sigue siendo terrible en las señales no verbales. Pero eso no significa que sea imposible interpretarlos.

cómo hacer tarjetas imprimibles en google docs

MeowTalk utiliza un tipo de aprendizaje automático más flexible para ayudar a superar estos problemas.

Descargar: MeowTalk para Android | iOS (Gratis)

Meowtalk fue creado por Javier Sánchez, quien también trabajó en el equipo de Alexa. Imaginó la aplicación como un paso hacia los collares inteligentes. Estos collares traducirían los sonidos de los gatos en el habla humana, basándose en complejas estrategias de aprendizaje automático para ayudar a los humanos a comprender y cuidar mejor a sus gatos.

El equipo de MeowTalk compensó los problemas de singularidad creando perfiles más específicos para cada gato. En la aplicación, registras a cada gato por separado. Ciencia Noruega informa que los gatitos maúllan de manera diferente a los gatos adultos, por lo que la aplicación también solicita el cumpleaños del gato. Cada perfil genera una red de datos única para el gato, incorporando un poco de aprendizaje profundo en el aprendizaje automático.

Relacionado: Aprendizaje profundo frente a aprendizaje automático frente a inteligencia artificial: ¿cómo van juntos?

Para el vocabulario, MeowTalk comienza con 10 perfiles de sonido en su conjunto de datos. Cada uno tiene un significado diferente, como 'feliz' o 'cazando'. Cuando la aplicación escucha un sonido y se equivoca, puede corregirlo o crear una nueva interpretación.

Datos de CATSOUNDS recopilados de Akvelon

La corrección le dice a la aplicación que reemplace el vocabulario base con el nuevo sonido.

¿Por qué mi teléfono está caliente cuando se carga?

Por ejemplo, puede decirle a la aplicación que haga coincidir 'Caza' con chirridos cortos en lugar de aullidos largos. Este tipo de corrección es más útil que agregar varios sonidos para que coincidan con un significado de la forma en que lo hace el reconocimiento de voz, que sería como decirle a la aplicación que un aullido largo y chirridos cortos ambos significa 'Llamada Madre'.

El aprendizaje automático en las aplicaciones de reconocimiento de voz generalmente resiste este tipo de sobrescritura. Sería como intentar enseñarle a Siri que cuando dices 'blog de tecnología', realmente te refieres a 'pera'. Pero la forma más flexible de aprendizaje automático que usa MeowTalk puede manejar esta corrección más fácilmente.

Crear una nueva interpretación agrega un significado que no estaba codificado previamente. Por ejemplo, si su gato tiene una llamada específica cuando quiere su juguete favorito, puede agregar 'Quiero mi mouse' como una opción. Es similar a agregar una palabra a su diccionario de autocorrección.

Relacionado: Cómo definir sus propias palabras de autocorrección en Android

Con el tiempo, puede desarrollar un perfil de habla altamente personalizado para su gato. Eventualmente, incluso podría ser lo suficientemente sofisticado como para ser útil para los cuidadores de mascotas o para resolver problemas de comportamiento. Al menos, ayuda a los dueños de gatos a estar más atentos a sus mascotas.

El veredicto: ¿Funcionan las aplicaciones de traducción para gatos?

Al final, la 'traducción de gatos' todavía depende mucho de que el usuario le enseñe a la aplicación cómo habla su gato. Ese probablemente siempre será el caso debido a lo única que es la comunicación de cada gato.

Pero el hecho de que el aprendizaje automático haya llegado tan lejos que los desarrolladores puedan lograrlo incluso parcialmente es increíble. El aprendizaje automático y la IA están avanzando a velocidades vertiginosas y no podemos esperar a ver a dónde van a continuación.

Cuota Cuota Pío Correo electrónico Temas relacionados
  • Tecnología explicada
  • Aprendizaje de idiomas
  • Aprendizaje automático
Sobre el Autor Natalie Stewart(47 Artículos publicados)

Natalie Stewart es escritora de MakeUseOf. Primero se interesó en la tecnología en la universidad y desarrolló una pasión por la redacción de medios en la universidad. Natalie se centra en la tecnología que sea accesible y fácil de usar, y le encantan las aplicaciones y los dispositivos que simplifican la vida de la gente común.

Más de Natalie Stewart

Suscríbete a nuestro boletín

¡Únase a nuestro boletín de noticias para obtener consejos técnicos, reseñas, libros electrónicos gratuitos y ofertas exclusivas!

Haga clic aquí para suscribirse