Amazon Transcribe
Clase 18 de 19 • Curso de Introducción a AWS: Redes, Gobernanza y Machine Learning
Contenido del curso
Clase 18 de 19 • Curso de Introducción a AWS: Redes, Gobernanza y Machine Learning
Contenido del curso
Daniel Alejandro Hernandez Mendonca
Mauro Nava
Ferney Alonso Gaviria Gómez
Kevin Guzman
Angel Daniel Mendieta Castillo
Jhon Freddy Tavera Blandon
Mario Alexander Vargas Celis
CARLOS VELIZ DE VILLA AGUIRRE
Ramiro José López Velásquez
Abdul Orlando Florez Lopez
Luis Enrrique Pernia Carroz
Victor Rodriguez
FABIAN PEREZ
Ramiro José López Velásquez
ANDRES ALFONSO MIRA MEJIA
Andy Natanel Escalante Yaya
José Miguel Vásquez Guerra
Bryan Castano
Jeisson Espinosa
Creando a Jarvis
Imaginen combinar:
Y asi crear una conversación hablada con una inteligencia artificial como tony stark con jarvis
Un lambda que llame la api de chatgpt lo haria mas interesante.
Me divertí mucho con esta.
Intenté que transcribiera una canción (Síndrome de Fregolí de Los Petit Fellas (es un hip hop, o algo así, entonces puse a la IA en problemas, como pueden imaginarse ;) ))
Tambien intenté transcribir la intro de un podcast y le fue mejor. Quizá un buen micrófono haga que transcriba mejor. Impresionante el abanico de posibilidades que se abre (para bien y para mal)
Brutal la canción Men!!!, la IA no está preparada para tanto style
brutal esta herramienta.
Transcribe es una herramienta poderosa que facilita la conversión de audio a texto, ofreciendo múltiples características para mejorar la precisión y utilidad de las transcripciones. Desde la identificación de hablantes hasta la redacción de información personal, Amazon Transcribe puede integrarse en una amplia variedad de aplicaciones para mejorar la accesibilidad, la eficiencia y la comprensión de los contenidos hablados.
¿Qué es Amazon Transcribe?
Amazon Transcribe es un servicio de reconocimiento automático de voz (ASR - Automatic Speech Recognition) de AWS que convierte audio en texto de manera precisa y automática.
Características principales
🎙 Conversión de audio a texto en varios idiomas y acentos. 🔍 Identificación de hablantes (speaker diarization) para transcripciones con múltiples personas. 📝 Puntuación y formato automático para mejorar la legibilidad. 🔤 Detección de palabras inapropiadas para censurar contenido. 📌 Etiquetado de palabras con confianza para mejorar la precisión. 💼 Integración con otros servicios de AWS como Amazon S3, Lambda y Comprehend.
Ejemplo de uso con Python y Boto3
📌 Convertir un archivo de audio en texto
import boto3
# Crear cliente de Amazon Transcribe transcribe = boto3.client('transcribe', region_name='us-east-1')
# Nombre del trabajo de transcripción job_name = "mi-transcripcion" audio_file_uri = "s3://mi-bucket/audio.mp3" # Archivo de audio en S3
# Iniciar la transcripción transcribe.start_transcription_job( TranscriptionJobName=job_name, Media={'MediaFileUri': audio_file_uri}, MediaFormat='mp3', # Formato del archivo de audio LanguageCode='es-US' # Código de idioma (ejemplo: español) )
# Verificar el estado de la transcripción response = transcribe.get_transcription_job(TranscriptionJobName=job_name) print("Estado:", response['TranscriptionJob']['TranscriptionJobStatus'])
Casos de Uso
📞 Análisis de llamadas – Transcripción automática para atención al cliente. 🎙 Subtitulación de videos y podcasts – Generar subtítulos precisos. 🗂 Indexación de contenido – Convertir audio en texto para facilitar la búsqueda. 🚀 Comandos de voz – Integración con aplicaciones que usan reconocimiento de voz. 🏛 Cumplimiento y auditoría – Convertir grabaciones en texto para documentación.
Amazon Transcribe es serverless, por lo que solo pagas por el tiempo de audio procesado. 🚀
Interesante lo que amazon ofrece en cuanto a su variedad de servicios. Lo que no he podido observar o escuchar durante todo el curso es hasta donde podemos utilizar en la capa gratuita. Es decir hubiese sido bueno conocer lo que cada servicio esta en la capa gratuita o ya es de paga, para no llevarnos una sorpresa en cuanto a costos una vez practicado con los servicios vistos en el curso.
Aquí tienes el detalle amigo.
Hacer pruebas como las que mostro el mentor Alexis del transcribe y polly, puede generar costos?
Hola Abdul, si tienes activada la capa gratuita no genera costos a menos que excedas el limite de capa gratuita, que actualmente es 60 minutos al mes durante 12 meses para amazon transcribe y Amazon Polly incluye 5 millones de caracteres por mes para habla o solicitudes de marcas de voz durante los primeros 12 meses, a partir de la primera solicitud de habla.
-
En general en AWS se paga por lo que se usa y cada servicio mide lo que se usa de manera distinta según sea el caso pues todos tienen sus propias políticas de precio por uso.
-
Te dejo los links con las políticas de precios por uso para ambos servicios aca:
políticas de precios de amazon transcribe políticas de precios de amazon polly
Hola, Como sé si mi cuenta esta en la capa gratuita?
No le veo tanto utilidad a estos servicios de aws cuando puedes usarlo en chatgpt
Tienes razón, a día de hoy ya no son tan competentes estos servicios, pero piensa que en su día eran mucha innovación ya que fueron creados para Amazon Alexa por allá del 2014.
✅
Como seria con una canción de Bad Bunny?
uauauauauauauauaua
Vayah, esto se pone mejor con cada clase.
Este curso es Excellente !.
Información resumida de esta clase #EstudiantesDePlatzi
Es importante que cuando iniciemos con un servicio leamos primero el como funciona, su documentación y estas cosas
Amazon Transcribe es una poderosa herramienta