Cocinando con Inteligencia Artificial


Cocinando con Inteligencia Artificial

Considero que la mejor manera aprender sobre Tecnología, es "metiendo las manos" y experimentado con ella (sin menospreciar la teoría), igual que sucede con la cocina.
Hoy en día sin ser un experto, puedes realizar experimentos super-interesantes, sin necesidad de ser informático y con coste 0€.

Todas las aplicaciones móviles de éxito, comparten muchos factores en común: facilidad de uso -no es necesario leerse ningún manual/libro-, diseños simples e intuitivos y nos permiten utilizar tecnologías emergentes (sin entender exactamente cómo funcionan) para obtener resultados asombrosos.
Por analizar un ejemplo: Pokemon GO -parte izquierda de la siguiente infografía- VS la aplicación multidispositivo que queremos desarrollar, un traductor español-ingles con voz -parte derecha-:

No alt text provided for this image


La receta que seguiremos es para todos los públicos, todos los niveles y todos los bolsillos. Emplearás dos tecnologías dentro del campo de la Inteligencia Artificial: los servicios de traducción de texto y el lenguaje natural, ambas mejoradas con la reciente incorporación de Machine Learning.

No alt text provided for this image


Todo los ingredientes que necesitas para este cocinado son GRATIS, de esta manera no hay excusa para comenzar -abre un cuenta en Scratch-:

No alt text provided for this image

Se trata de una aplicación tremendamente simple, pero con una integración de servicios cloud muy "rica" (con Google y Amazon, como elementos principales), pero sin desvirtuar los productos, estos son los pasos:

No alt text provided for this image
SCRATCH: como puedes comprobar no es necesario ser un full stack developer para realizar esta parte de la receta, son 8 lineas de código, totalmente visuales. Básicamente preguntas por el texto a traducir a la persona que utiliza la app, lo guardas en una variable, para posteriormente traducir el texto al ingles y finalmente pasarlo a voz con text‑to‑speech (TTS, en inglés):

No alt text provided for this image


TRADUTOR (Google) es como cuando utilizas el traductor web de Google, copias un texto en inglés y lo traduces, pero en esta receta, "pasas" el texto que se escribió en tu aplicación a Google, para que lo traduzca al castellano y tu "lo pintas" en la pantalla:

No alt text provided for this image


TEXT-TO-SPEECH (AWS) ahora tienes que pasar la variable al text-to-speech de AWS para que tu aplicación reproduzca la traducción en inglés del texto.

No alt text provided for this image


Una vez, terminada la receta, ahora llega la parte más divertida, probar el resultado y comprobar tus avances:



Deberá aparecerte algo similar a esta ventana en Scratch en tu navegador:


No alt text provided for this image


Según dicen los expertos la prestación del plato es fundamental, por ello, puedes crear un código QR para acceder a tu app y publicitarla, activa la cámara de fotos de tu smartphone y enfoca el siguiente código, se abrirá tu navegador con la pagina: https://scratch.mit.edu/projects/323584189


No alt text provided for this image

Espero que te resultará interesante y:
No alt text provided for this image

Referencias externas:

SCRATCH: lenguaje de programación visual creado por el MIT Media Lab, su principal característica: permite el desarrollo de apps sin tener conocimientos profundos sobre el desarrollo. Puedes acceder en https://scratch.mit.edu/

TRANSLATE: LA API Translation utiliza la traducción automática neuronal preparada previamente de Google para ofrecerte resultados rápidos y dinámicos. Además, en la API Translation también puedes usar traducciones de modelos personalizados para optimizar tu flujo de trabajo dentro de la misma biblioteca de cliente. Más información en https://cloud.google.com/translate

Text-To-Speech convierte texto escrito en un discurso oral y natural, estas APIs son muy fácil de usar y te permiten propiciar interacciones naturales con los usuarios; una solución flexible y fácil de usar que permite crear experiencias naturales en una amplia variedad de casos prácticos. Más información en https://aws.amazon.com/es/polly/what-is-text-to-speech/

QR: código QR es un código de barras bidimensional cuadrada que puede almacenar los datos codificados. La mayoría del tiempo los datos es un enlace a un sitio web. Un código QR es la evolución del código de barras (Wikipedia).

#AI #TTS #Scratch #GoogleCloud #AWS #Hands-On-Labs

// Opiniones totalmente personales



Comentarios