Compresión de video con H264 y MP3

Clase 26 de 32 • Fundamentos de Ingeniería de Software

Resumen

Optimizar video y audio requiere entender cómo se comprime, qué contenedores y códecs se usan, y qué protocolos los transportan. Aquí encontrarás una guía clara para elegir mejor, ahorrar batería y evitar errores comunes en producción y reproducción.

¿Cómo se comprimen video y audio sin perder demasiado?

La compresión no solo reduce el tamaño de cada imagen, también aprovecha que en un video muchas zonas cambian poco a lo largo del tiempo. En audio, se eliminan partes que el oído humano no percibe. Ambas decisiones equilibran calidad, peso y consumo del procesador.

¿Qué significan los frames por segundo?

Un video son muchas fotos por segundo: 24, 30 o 12 fps.
Ejemplo práctico: 100 frames a 24 fps ≈ 4 segundos.
Si cada frame pesara 1.9 MB (como un JPG del ejemplo), esos 100 frames serían ≈ 190 MB para 4 s.
Compresión temporal: se reutilizan zonas estáticas a través del tiempo para reducir bytes.
En escenas educativas con fondo fijo, el algoritmo puede mantener áreas constantes por minutos.

¿Por qué existen los keyframes y los artefactos?

Los keyframes reestablecen la referencia completa cada cierto número de frames para evitar errores acumulados.
Si se pierde un keyframe, aparecen los drop keyframes: pantallas verdes o objetos congelados hasta la siguiente referencia.
Los códecs avanzados como H264 y H265 no solo usan rectángulos; también aproximan con formas geométricas.
Más compresión implica más trabajo para CPU/GPU al decodificar y más consumo de batería.

¿Qué son los kbps y la fidelidad en audio y video?

kbps indica cuántos bytes por segundo representan la señal: más kbps, mayor fidelidad.
Números comunes en audio: 96, 128, 256 kbps.
Con 1000 kbps, una onda se representa con muchos puntos (alta fidelidad). Con 100 kbps, el software aproxima y pierde detalle.
En video ocurre algo similar: con pocos kbps, la imagen se suaviza por aproximaciones de color.
MP3 comprime eliminando partes de la onda que el oído humano no detecta.
Otros formatos: AAC, FLAC (compresión sin pérdida, como PNG o .zip), OGG (abierto, poco usado), y .WAB como representación sin compresión.

¿Qué es un contenedor y qué códecs dominan?

Un contenedor guarda video, audio, subtítulos y metadatos (por ejemplo, 1280×720 y el códec usado). Permite múltiples pistas de video y audio, y funcionalidades como transmisión segmentada.

¿Qué hacen formatos como MP4, WebM y MKV?

Contenedores conocidos: AVI, MP4, FLV, MPG, WebM, MKV.
MKV (Matrioshka Video): soporta subtítulos con animaciones o estilo CSS y múltiples pistas de audio.
Multipart: el video se divide en fragmentos que repiten la cabecera; útil para llegar a mitad de una transmisión en vivo.
El contenedor gestiona cabeceras y metadatos esenciales.

¿Qué códecs se usan y quién los controla?

Códec: codificador/decodificador o compresor/descompresor. Ejemplos: DivX, H264, VP9, Ogg.
VP9 y Ogg: abiertos a la comunidad. WebM (contenedor) y VP9 fueron abiertos por Google tras comprar On2.
H264 y MP4: cerrados y con patentes administradas por MPEG LA (empresas como Apple, Microsoft, Universal, Sony).
La televisión digital terrestre suele usar H264 en MP4, según el estándar de cada país.

¿Cómo afecta el hardware y la batería?

iPhone y muchos Android incluyen un chip dedicado para H264: comprime/ descomprime con menor consumo eléctrico.
Esto alarga la vida de la batería, pero desincentiva usar alternativas más libres como WebM/VP9.
Históricamente, pocos Android soportan VP9, mientras que H264 se soporta ampliamente.

¿Qué protocolos permiten transmitir video en Internet?

Para entrega continua y resiliente, no basta con descargar archivos: se necesitan protocolos que soporten fragmentación, bidirección y baja latencia.

¿Qué mejoras tiene HTTP para medios?

Descarga progresiva: reanudar sin empezar desde cero.
Lectura aleatoria: bajar partes específicas del archivo.
Descarga paralela de pedacitos para acelerar la entrega.

¿Cómo funciona RTMP en streaming?

RTMP (Real Time Message Protocol) permite enviar y recibir video.
Soporta multipart: fragmentos con cabeceras propias para empezar en cualquier punto.
Transporta video, audio y texto (chats, videojuegos) en paralelo.
Usado en plataformas como YouTube y Twitch.

¿Qué propone Web RTC?

Web RTC es peer to peer: los clientes también comparten el video entre sí.
Similar a BitTorrent, con un servidor que origina y pares que redistribuyen.
Ideal para videollamadas punto a punto.
Exigente para CPU (codificación/decodificación en tiempo real) y para la conexión.
Por ahora, soporte limitado en pocos navegadores.

¿Te quedó alguna duda sobre contenedores, códecs o protocolos? Comparte tu caso de uso y comentemos cómo optimizar calidad, peso y consumo según tu escenario.

Everardo Sánchez

student•

Muy bueno el video, solo algunos comentarios con respecto a los términos de audio y sonido.

Estrictamente cuando hablamos de audio nos referimos a señales eléctricas, cuando hablamos de sonido nos referimos a ondas mecánicas.
Por ejemplo cuando hacemos un aplauso en el mundo “real”, se generan ondas mecánicas (sonido) que llegarían a un micrófono, dicho micrófono se conoce como transductor ya que convierte de un tipo de energía a otra. En éste caso se convierte de energía mecánica a eléctrica y solo después del micrófono es que se le puede llamar audio.

Freddy Vega

Team Platzi•

Esto es un excelente aporte!

Paula Becerra

teacher•

Qué buen aporte 😃

Pedro Ortiz

student•

BMP - imagen sin compresíón AVI - video sin compresión WAV -audio sin compresión

Juan Christopher

student•

Eso si no lo sabia!

Marco Gonzalez

student•

capo

Everardo Sánchez

student•

En el caso de la compresión de mp3 no es que el oido humano no escuche esas ondas, de hecho las grabaciones en general de alta fidelidad se hacen a 16bits con un muestreo de 44100 Hz. Esto se basa en el teorema de Nyquist y asegura que grabaremos solo lo que el humano es capaz de escuchar (20Hz-20KHz). Si revisamos un archivo wav podemos ver que se encuentra esa información.

Ahora bien, con un mp3 lo que hace es quitar información que no es muy perceptible o relevante con respecto al demás contenido, pero a fin de cuentas el oido si lo puede escuchar. Es como si en un texto se eliminaran algunas letras, el cerebro es capaz e entender el mensaje. Lo msmo psa con l mp3.

Para que se queden con una idea más clara de cuanta información de pierde al escuchar un mp3 les dejo ésta imagen comparativa de diversos formatos así como dos links a videos.

El primero es una especie de documental sobre el panorama en la industria de la música desde la perspectiva de la compresión.
Distortion of sound

El otro es una charla de Andrew Scheps en google del 2013, igual sobre el tema de compresión.
Lost in Translation

Héctor Daniel Vega Quiñones

teacher•

¿Entonces si una canción no tiene audio comprimido la calidad es mayor?
En una ocasión descargué canciones de Rainbow que pesaban alrededor de 60 mb cada una.

Everardo Sánchez

student•

Si, la compresión por lo general arruina la calidad de los audios.

Existen tipos de compresión sin pérdida también llamados losseless, FLAC es uno de esos tipos que no generan un cambió perceptible al compararlo con un WAV, que en teoría es la forma de onda digitalizada.

Algo importante es que no te debes de guiar siempre por el tamaño del archivo, si bien es cierto que uno con mayor fidelidad es más pesado puede darse el caso que el mismo esté siendo ocupado para esteganografía. Lo ideal es entrenar tu oido para poder percibir la calidad de un sonido o bien analizar el audio en algún editor dónde puedas ver la forma de onda o bien realizar un espectrograma. En youtube hay varios videos dónde se hace y explica ese ejercicio.

Jhon Alexander Romero Gonzaga

student•

Básicamente el audio digital debe parecerse al análogo y mientras mas resolución tenga el audio mayor sera su parecido a la curva del análogo.

Luis E

student•

y mayor el tamaño del archivo

John Jairo Pico Parra

student•

por eso es que los discos de vinilo sonaban tan bien :)

Eber Laurente Lliuyacc

student•

La clase más densa a mi parecer, pero pese a ello muy buena.

Una parte de mis notas por si a alguno le sirve:

++Elementos para la compresión de videos++

Los contenedores son los tipos de archivos donde se guardan los videos, no son simples formatos como el jpg, dado que un video tiene la animación en movimiento, el sonido, subtitulo (como los DVD que pueden tener diferentes tracks de video, audio y diferentes subtítulos). Por lo cual se han creado múltiples contenedores, por ejemplo: el .avi, .mp4, .flv, .mpg, el impulsado por Google webm o Cada uno de estos formatos, tienen fragmentos internos que los optimizan para cada caso. Por ejemplo .mp4, .flv y webm son capaces de soportar el Multipar, el cual es el caso donde se rompe el video en muchos fragmentos y en cada fragmento se repite la cabecera, para que sin importar en que parte de la transmisión del video en vivo en que se ingrese, se pueda recibir los datos de la cabecera. o El trabajo del contenedor es entregar la cabecera y los metadatos del video. Los metadatos contienen información del tamaño del video (que puede ser 1280 x 720), los códecs internos que se utiliza, entre otros.
Codecs significa codificador de codificador, también puede entenderse como compresor-descompresor. Un codec es un algoritmo, es una pieza de código especial que comprime un video y lo descomprime, que codifica en un código especial y luego lo decodifica. Algunos ejemplos: divx, H.264, vp9, ogg. Los dos últimos son códecs de código abierto. Mientras que H.264 y mp4 son formatos cerrados, tanto en código fuente, como patentes. (MPEG-LA es la compañía dueño, es un consorcio formado por múltiples compañías, entre ellas Apple y Microsoft, universal, Sony y otros.)
Los protocolos, son la forma de transmitir los videos. o HTTP no es un buen protocolo para transmitir video, ya que abre la conexión para transmitir y luego la cierra. Entonces en los casos en los que la conexión se pierde la transición de video sin saber en el momento en el que volver a inciar. o Se han hecho múltiples mejoras al HTTP, entre estos:  Modificaciones para descargas de manera progresiva cualquier tipo de archivo. Que en el caso de los videos permite volver al punto donde se quedo cuando de corta la conexión. Con estas mejoras es posible hacer mejoras aleatorias los puntos aleatorios  La posibilidad de descargas de segmentos de manera paralela. Los protocolos especializados se llaman protocolos de Streaming. Uno de de ellos es el RTMP (real time mesages protocol).  El RTMP permite enviar y recibir; recibir por pedazos independientes; multipar cada uno con sus propios contenedores y cabeceras; permite recibir la cabecera en otro lado; permite recibir también texto con los que se pueden programar chats o videojuegos que funcionan de una manera completamente paralela; esta es la forma como funciona Youtube, Twich, etc. o El protocolo experimental webRTC que permite transmitir no solo video sino cualquier tipo de formato.  Es un protocolo per-to-per. Es decir, todas las personas que se conectan y bajan el video pueden transmitir el video a los demás, funcionan también como servidor, es muy similar a bittorren, con la diferencia de que hay un servidor central que distribuye la información original. Este es ideal para video llamadas, con el que se puede hacer la conexión punto a punto sin necesidad de pasar por el servidor  Uno de sus inconvenientes es que es muy pesado en el procesador dado que se tiene que hacer al codificación y decodificación en tiempo real. Exige mucho a la conexión, es probablemente el futuro, por ahora es soportado en muy pocos navegadores

Jose Suarez

student•

Totalmente, pasa que la parte de audio y video ya es otro mundo.

Javier Nicolás Nieto

student•

Excelente resumen! acá escribí la parte que falta:) . . ¿Cómo se comprime? Usamos un algoritmo muy similiar a jpg solo que además de comprimir un área bidimensional, comprimimos en el tiempo tridimensional. Por ejemplo del minuto 1 al 1,1 hay partes que no cambian entonces a esas partes se las toma como artefactos (como en jpg). Igualmente existe una forma de hacer las transiciónes más suaves sin tantos artefactos:
Keyframes: cada cierta cantidad de frame existe un frame que vuelve a definir todo el área Cuando se pone verde la imagen de repente es porque hubo un drop keyframe (caída de keyframe) Con códecs más nuevos se pueden usar otras figuras además de solo cuadrados para crear los artefactos, pero son mucho más pesados para el procesador al momento de descomprimir en tiempo real . . Con el audio, al igual que las imágenes, el codec y el contenedor son lo mismo(porque el contenedor tiene solo audio) La forma de comprimir con mp3 es eliminando todas las frecuencias por arriba de 44100hz. Esto se debe a que la frecuencia audible por el humano es de 20000hz, entonces por una cuestión matemática y de fidelidad, la frecuencia de compresión debe ser el doble que la audible (un poco más por las dudas). Además, mp3 modifica la tasa de muestreo: 128kbps, 32kbps, 96kbps, etc. Esto es la cantidad de veces por segundo que la onda se escribe (si se está comprimiendo) o se lee (si se está descomprimiendo). Por eso kbps, (kilobits por segundo). Para terminar de definir al audio digital utilizamos algo llamado cuantificación o resolución de bits. Esto define el espacio vertical mínimo que puede haber entre un bit y otro cuando dibujamos la onda. La cuantificación consiste en convertir el nivel de las muestras fijadas en el proceso de muestreo, normalmente un nivel de tensión, en un valor entero de rango finito y predeterminado. Por ejemplo, utilizando cuantificación lineal, una codificación lineal de 8 bits discriminará entre 256 niveles de señal equidistantes (28).

Los videos también pueden tener kbps. Si hay muy pocos, existen espacios vacíos, entonces los algoritmos de reproducción de video hacen una aproximación tratando de entender los colores de su alrededor (por eso se ve como suavizado cuando le bajamos los kbps).

BONUS: MKV (Matroska video) puede contener una cantidad muy grande de vídeo, audio, imagen o pistas de subtítulos dentro de un solo archivo. De ahí sale el nombre Matroska, BMP - imagen sin compresíón AVI - video sin compresión WAV -audio sin compresión

Paula Becerra

teacher•

Un codec es un algoritmo que puede significar Codificador - Decodificador, lo que hace es comprimir y luego descomprimir un video.
Ejemplos:
DivX
H.264
VP9

Irving Juárez

student•

Gracias, no me había quedado muy claro

David Galicia Gomez

student•

Gracias por la explicacion 👌

Josan Guerra

student•

En un vídeo hay muchos factores para comprimir, un vídeo es si es una serie de fotos vistas muy rápido. por ejemplo si un vídeo tiene 100 frames a 24 frames/segundo y si cada frame pesara 1.9MB el vídeo pesaría más de 190MB por 4 segundos de vídeo. Los frames por segundo son la cantidad de fotos que tiene un video por segundo.
Podemos usar jpg y comprimir cada una de estas fotos y ya tendriamos un peso menor. Pero a medida que avanzo el tiempo se descubrieron formas mas eficientes de compresion.
Hay una forma de compresion que es comprimir a lo largo del tiempo, porque resulta que un video las cosas cambian pero casi siempre no cambian tanto. Para ello hablemos de varios elementos que contiene un video:
Contenedores: Son los tipos de archivos donde se guarda el video, porque no es simplemente un formato como jpg, los videos son la animacion del movimiento, el sonido, los subtitulos, en dvd diferentes tracks de video, audio y subtitulos, mas cosas internas, etc…Por eso se han creado multiples contenedores como:
.avi, mp4, .flv (flash video), .mpg, webm (lo empuja mucho google), etc…
Google espera que webm se vuelva el contenedor estandar para internet pero mp4 es el ganador indiscutible.
Hay formatos raros que lo encuentran solamente en lugares perdidos de internet, uno de ellos es mkv (matroska video). Este es muy popular en japon porque te permite insrtar subtitulos y subtitulos con formatos especiales por ejemplo animaciones o estilos css, tb te permite insertar tracks diferentes de audio por ejemplo puedo ver una pelicula japonesa en ingles, o con subtitulos en ingles o sin subtitulos, etc…hay muchos formatos.
Lo especial de estos formatos es que hay fragmentos internos que los optimiza para cada caso por ejemplo en el caso de mp4, webm y flv son capaces de soportar multipart (esto es cuando rompes el video en muchos fragmentos chicos, y en cada fragmento lo que hace es repetir la cabecera). Por ejemplo si nosotros llegamos a una transmision en vivo, nosotros nunca llegamos a recibir la cabecera porque para eso tuvimos que estar al principio de una transmision en vivo entonces en cada segmento de la transmision en vivo, entonces en cada segmento de la transmision en vivo vuelve a repetir la cabecera para que sin importar el punto en el que estes en el video recibas esos datos.
El trabajo del contenedor es entregar la cabecera y metadatos del video, por ejemploo metadatos que deben de ir dentro del conetenedor son el tamano del video (1280*720), los codecs interno que usa, etc…
Codecs (codificador-decodificador o compresor-descompresor): Un codec es un algoritmo, es una pieza de codigo especial que comprime un video y lo descomprime. Historicamente el codec que se usaba mucho antes era DivX. El mas popular de nuestra epoca y el que mas se encuentran es H.264. El codec de webm es VP9. VP9 y ogg son codecs de codigo abierto. VP9 es especial porque la empresa que lo hizo google la compro (onto, hacian el contenedor y el codec de flash ) y los dejo de codigo abierto, por eso webm y el codc vp9 son de codigo abierto.
H264 y mp4 son formatos cerrados (tanto en codigo fuente como patentes) porque resulta que en EE.UU estos formatos son patentables, en una empresa llamada MPEG-LS que son los duenos del h264 y mp4. Esto es un consorcio compuesto por multiples empresas (apple, microsoft, sony, universal, etc…)
La mayoria de la tdt (televisiondigital terrestre) usa mp4 y h264. Por ondas aereas a nuestros televisores llega un video codificado en h264 y mp4 cuando prendemos el tele para ver tv en hd (depende del pais, pero en general funciona asi).
En los videos afecta mucho el contenedor y el codec. En los iphone y muchos android hay un chip especializado que no sirve para nada mas que para comprimir y descomprimir h264. La razon de porque hacen un chip especializado y no se lo dejan a la cpu o gpu del SoC es porque asi usan menos electricidad y aprovechan mas la bateria, sobretodo teniendo en cuanta que ver videos es de lo que mas destruye la bateria de un movil. Por eso lo colocan en un chip aparte para alargar la vida de la bateria mucho mas PERO ESTO GENERA QUE LOS DESARROLLADORES NO PUEDEN USAR OTRO TIPO DE COMPRESORES Y CONTENEDORES QUE SEAN MAS LIBRES COMO WEBM O VP9. COMO NORMAL GENERAL TODOS LOS MOVILES SOPORTAN H265 Y MP4 Y MUY POCOS WEBM Y VP9
Protocolos: Son la forma de transmitir videos. Uno muy obvio es HTTP pero este no es bueno para transmitir videos porque por ej, que pasa cuando se te corta la senal? o transmitiendo un video en vivo? Recuerda que HTTP es un protocolo que abre la conexion, envia los datos y la cierra. Han habido muchos mejoras a htttp para que pueda transmitir videos, una d ellas es la modificacion para poder descragar de manera progresiva cualquier tipo de archivo por ejemplo: antes descargabas un archivo y lo cancelabas, el archivo empieza desde 0 en vez de empezar desde donde paro, ESTO OCURRE PORQUE EN LOS SERVIDORES WEB NO PERMITIAN DESCARGA PROGESIVA Y SIEMPRE VOLVIAN A LA CABECERA DEL ARCHIVO. CON MEJORAS AL PROTOCOLO HTTP ES POSIBLE HACER DESCARGAS PROGESIVAS EN LUGARES ALEATORIOS. OTRAS DE LAS MEJORAS ES PODER DESCARGAR PEDACITOS DE FORMA PARALELA, AUNQUE HAY PROTOCOLOS ESPECIALIZADOS QUE HACEN ESTO SE LLAMAN PROTOCOLOS DE STREAMING, EL MAS POPULAR ES RTMP (Real Time Messages Protocol).
RTMP: Es una forma especial de transmitir video que te permite varias cosas, primero enviar y recibir, de tal manera que tu puedes ser el emisor del video. Te permite recibir por pedazos independientes ‘multipark’ cada uno de los videos con sus propios contenedores y cabeceras. Te permite recibir la cabecera en otro lado, enviar no solo video si no tb texto (ENTONCES PODEMOS PROGRAMAR CHATS O VIDEOJUEGOS EN RTM). Y FUNCIONA DE UNA MANERA PARALELA (PARA ASI DESCARGAR PARALELAMENTE MULTIPLES PEDACITOS) ESA ES LA FORMA EN QUE FUNCIONAN POR EJEMPLO YOUTUBE O TWITCH.
Hay protocolos experimentales como web app desert que estan disenados para cambiar la forma en que nosotros transmitimos y enviamos no solamente videos si no cualquier tipo de formato. Este protocolo es un protocolo P2P es decir todas las personas que se conectan y bajan el video empiezan a compartir el video a los demas y tb funciona como servidor. Es similar a bittorrent con la diferencia de hay un servidor central, que distribuye la informacion original y luego nosotros directamente la obtenemos P2P. ES IDEAL PARA VIDEOLLAMADAS porque en una videollamada no me interesa ir al servidor y luego al otro punto, puedo hacer kla conexion punto a punto sin necesidad de pasar al otro lado. Web app desert es muy pesado en el procesador porque tiene que hacer la codificacion y decodificacio en tiempo real y tb exige mucho a tu conexion. ESTO ES PROBABLEMENTE EL FUTURO DE LAS CONEXIONES (Esta soportado en pocos navegadores)
PERO COMO SE COMPRIME UN VIDEO?
Ustedes han escuchado 24 frames/segundo, 60 frames/segundo, etc…Esto funciona asi por ejemplo en un video de accion:
Hay cosas que se mantienen muy similar por ejemplo en este video el pecho de nuestro personaje es exactamente el mismo a lo largo del tiempo entonces yo puedo crear un algoritmo que agarre esto e internamente me diga que desde 1:00 hasta 1:05 coloque en ese rectangulo el color negro

ESTOY USANDO MUY POCOS BYTES PORQUE NO SOLO ESTOY COMPRIMIENDO EN EL AREA BIDIMENSIONAL DE LA IMAGEN, SI NO TAMBIEN EN EL AREA TRIDIMENSIONAL DEL TIEMPO.
EJEMPLO: MIN 11:14 - 12:02
EL PROBLEMA DE ESTE SISTEMA ES QUE CUANDO HAY UN CAMBIO RADICAL POR EJEMPLO UN CAMBIO DE ESCENA NO ME SIRVE PORQUE ESTOY CAMBIANDO TODOS LOS RECTANGULITOS O PIXELES.
EN ESTOS CAMBIOS RADICALES LOS ALGORITMOS CREAN ALGO ESPECIAL LLAMADO “KEYFRAMES”, AGARRAN UNA SERIE DE FOTOGRAMAS O FRAMES ESPECIFICOS Y ESTOS LOS LLAMA KEYFRAMES.
CADA CIERTA CANTIDAD DE FRAMES HAY UN FRAME QUE VUELVE A REDEFINIR TODO EL AREA, RECTANGULOS Y COMPRESION. DE ESTA MANERA LA TRANSICION ES SUAVE Y NO HAY NECESIDAD DE CREAR ARTEFACTOS.
SI TE A PASADO QUE ESTAS CON UN VIDEO Y DE REPENTE TODO QUEDA VERDE Y EL OBJETO QUE SE MUEVE SE EMPIEZA A VER LARGO, TO MAL, Y LUEGO TODO VUELVE A ESTAR BIEN?? ESTO ES PORQUE SE CAYO UN KEYFRAME
ESTOS SE LLAMAN DROPKEYFRAME (PORQUE SE PERDIO LA DEFINICION ORIGINAL DE ESTOS RECTANGULOS DE COMPRESION A LO LARGO DEL TIEMPO).
ESTO SE PUEDE PONER MUCHO MAS COMPLEJO PORQUE LAS VERSIONES DE H264 Y H265 NO SOLAMENTE FUNCIONAN CON RECTANGULOS SI NO TB CON FIGURAS GEOMETRICAS COMO APROXIMACIONES, CIRCULOS, FORMAS, ETC… Y CON LA LLEGADA DE LA INTELIGENCIA ARTIFICIAL A LA COMPRESION ESTAN EMPEZANDO A ENCONTRARSE PATRONES AUN MAS COMPLEJOS QUE PUEDEN COMPRIMIR MUCHO MAS EL VIDEO, EL PROBLEMA ES QUE EL COSTO DEL PROCESADOR PARA DESCOMPRIMIR ESOS RECTANGULOS ES ALTO, PORQUE AL FINAL DEL DIA LA CPU Y LA GPU TIENEN QUE REPRESENTAR TODOS LOS BYTES REPRESENTADOS EN PANTALLA A LA VELOCIDAD DEL VIDEO.
ENTONCES CONTRA MAS COMPLEJO SEA EL ALGORITMO DE COMPRESION Y MAS EXTREÑA SEA SU CONFIGURACION, MAS PESADO SERA PARA EL PROCESADOR PODER DECODIFICADOR Y REPRESENTARLO EN PANTALLA Y VA A SER AUN MAS DIFICIL PARA LA CPU DE UN TELEFONO ENTONCES VA A GUSTAR MAS ELECTRICIDAD, SE VA A CALENTAR MAS Y VA A GASTAR MAS BATERIA.

Sonido: El sonido es una onda electrica, que esta representada en bytes y funciona exactamente igual que una imagen. Ustedes pueden representar toda los elementos de la onda o comprimirla, uno de los algoritmos mas populares de comprension es mp3.
Similar a las imagenes el codec y el contenedor son lo mismo porque no hya mas cosas. Entonces mp3 es un contenedor y un codec.
mp3 NO COMPRIME EL ARCHIVO ENCONTRANDO AREAS SIMILARES, SI NO QUE BUSCA LAS PARTE DEL SONIDO QUE NO PUEDE CAPTURAR EL OIDO HUMANO Y LAS ELIMINA, DEJANDO SOLO LAS QUE SI SE PUEDEN ESCUCHAR.
PARA OPTIMIZAR LA CALIDAD DEL MP3 LO QUE PODEMOS HACER ES BAJAR LA CANTIDAD DE SONIDOS QUE ESCUCHA EL OIDO.
TAMBIEN HAY PTRA FORMA DE OPTIMIZAR MP3, SEGURAMENTE HABRAS VISTO 128KB/S, 96KB/S, ETC… ESTO SIGNIFICA QUE POR SEGUNDO LA ONDA ESTA REPRESENTADA EN 128.000 BYTES (LOS BYTES SON POSICIONES EN LA ONDA PARA LUEGO REPRESENTARLA Y LEERLA POR UN SOFTWARE QUE CONVIERTA ESA CURVA EN VIBRACION DE UNA MEMBRANA QUE GENERE UN SONIDO QUE UN HUMANO PUEDA ESCUCHAR).
ENTRE MAS BYTES LE ASIGNE A UNA ONDA, MAS CALIDAD TIENE, Y ENTRE MAS LE QUITE YO A ESTA MENOS CALIDAD TIENE. EJEMPLO: MIN 16:20 - 18:00
MP3 TIENE PATENTES Y REQUIERE LICENCIAS PARA PODER SER REPRODUCIDOS, IGUAL QUE MP4 Y H264.
HAY MAS COMO AAC, FLAC (SE COMPORTA COMO EL PNG PERO EN AUDIO), OGG (COMPLETAMENTE ABIERTO Y POCO USADO), WAV (REPRESENTA TODOS LOS BITS POSIBLE DE UNA ONDA DE AUDIO)

Jose Suarez

student•

Le echaste bolas copiando toda la clase jajaja

Sergio Iván Piñón Peña

student•

Estaría bien un resumen xD

Diego Ramos Ricardez

student•

Sólo sé que después de este curso no veré el mundo de la misma forma.

Juan Christopher

student•

Pss... ¡Si!. Tienes mayores conexiones neuronales.

Elber Alfonso Roa Ibarra

student•

se abre y entiendes cosas que das por hechas

Rodrigo Gutierrez

student•

Freddy al principio del video

Emily García

student•

jajajjaj de lujo xdxd

Diego Miranda

student•

Comparación de una canción a diferentes Kbps

Oscar Andres Gordillo Alvarez

student•

Buen aporte, gracias

Usuario anónimo

user•

interesante

Francisco Joel Morando Pinedo

student•

Creo que este fue el único video de todo el curso que realmente puedo decir que entendí.

Christopher Román

student•

Hay conocimientos más "expresables", menos "prácticos" y para ámbitos de estudio recomendaría soportarte de aplicaciones que puedas encontrar en internet sobre cada tema que no entiendas.

Un abrazo y suerte en tu trayecto! ♥

Maided Guadalupe Hernández Ponce

student•

Te recomiendo que investigues más acerca de los temas vistos. En mi caso, creo ha sido el único vídeo que no entendí muy bien, investigaré más.

Sergio Estrella

teacher•

Como me siento después de ver todo esto y entenderlo a la primera :sweat_smile:

Ruddy Ramos

student•

x2 Jajajajajaja

Marcos Monteverde

student•

jajjajaja

Mateo Agudelo Echavarria

student•

¿Por qué los videos de platzi no se suben a 480p? Eso ayudaría a gente latinoamericana con Internet más irregular.

Mateo Rios

student•

Los videos de Platzi no se suben a menos de 720p ya que consideran que se pierde mucha de la experiencia de usuario de la plataforma. Cabe resaltar que Platzi, utiliza algoritmos que contribuyen a la optimización del uso de internet en la descarga de los videos por lo que puede permitirse subir video en 720p y 1080p sin que el los usuarios tengan un ancho de banda demasiado alto

Mateo Agudelo Echavarria

student•

Creo que ese algoritmo no es suficiente, yo al vivir en una zona rural tuve que ver videos de platzi con internet satelital por bastante tiempo. Y la velocidad era nefasta, y prefiero esforzar un poco la vista para ver un código que ver que el video se tilda cada 2 min.

Jaime Santamarta Martín

student•

WebRTC : Es el protocolo que menciona Freddy que puede llegar a revolucionar el mundo de las videollamadas, a finales de 2018 soportado por todos los navegadores ampliamente utilizados, y por los O.S Moviles actuales.
Desarrollada por Google y Mozilla, es utilizado en programas como google Hangouts, google Meets, facebook Messenger, Discord, Amazon Chime, HousePart, , GoToMeeting, etc…

Néstor Iván Cepeda Munevar

student•

Uso muchísimo Skype, Zoom y Google Hangout, si existen más formas de comunicación en especial en PCs con poca capacidad seria excelente.

He probado , y puedo decir que ofrece una conexión bastante estable.

Carlos Santaniello

student•

Breve historia de códecs de vídeo:

Juan Christopher

student•

¡Gran aporte!.

Marcos Monteverde

student•

Gracias

Jonathan Araujo

student•

Y yo pensaba que era mi internet el culpable de reiniciar mis descargas 😅😅

Kath Sánchez

teacher•

Todos lo pensábamos jajaja

Usuario anónimo

user•

¡Igualmente! :)

Diego Adrián Sánchez Gutiérrez

student•

Vídeos FPS, son la cantidad de fotos por segundo en un vídeo Contenedor tipos de archivo donde se guardan los datos .Avi, mp4, flv, mpg, webm, mkv multipart, rompe el vídeo en muchos pedazos con su cabecera para hacer streaming Codecs algoritmo que comprime y descomprime vídeos divx, h264, vp9, ogg MPEG-LA, apple M$, universal, sony protocolo http, rtmp, webrtc en un vídeo solo modifica los pixeles que cambian key frame redefine toda el área el costo de descomprimir aumenta con la complejidad sonido, mp3 recorta el ancho de la onda a solo lo que escucha el humano en musica kbps son los bits de muestreo por segundo para representar una onda aac, flac, ogg, wav

Luis E

student•

gracias por la explicación

Alejandro Gómez García

student•

Es posible que las imágenes o vídeos contengan virus en sus cabeceras o contenido?

Carlos Santaniello

student•

Si, es posible introducir información en una imagen con una técnica llamada esteganografía. Más información aquí: https://es.wikipedia.org/wiki/Esteganograf%C3%ADa

Diego Rubio

student•

que buena pregunta ni siquiera me lo había imaginado

Simón Arenas

student•

MKV (Matroska video) puede contener una cantidad muy grande de vídeo, audio, imagen o pistas de subtítulos dentro de un solo archivo. De ahí sale el nombre Matroska, son esas muñecas rusas que adentro tienen más muñecas.

Camilo Alfonso Ferro Camelo

student•

Como aporte al minuto 15:24, el oído humano escucha desde los 20 Hz hasta los 20 KHz. Existe el volumen y el tono, los tonos son altos, medios, bajos y son medidos en Hz. el volumen que es la intensidad del sonido, es medido en dB un sonido con mas de 85 dB es peligroso para el oído humano.

Compresión de video con H264 y MP3

Computación, procesadores y memoria

Cómo funciona el código binario en computadores

Cómo funciona un email desde Enter hasta notificación

Cómo funcionan los circuitos electrónicos

Procesadores y arquitecturas de CPU

System on a chip: cómo funciona tu smartphone

Cómo funcionan disco duro, RAM y CPU

Cómo la GPU convierte archivos en píxeles

Periféricos y sistemas de entrada de información

La evolución de la arquitectura de la computación

Cómo funciona Internet

Introducción a las redes y protocolos de Internet

Puertos y protocolos de red

Anatomía de una IP: 32 bits en 4 bytes

Cables submarinos: cómo viaja internet

Qué es un dominio, DNS o Domain Name System

Por qué tu test de velocidad miente

Cómo funciona la velocidad en internet

Qué es el Modelo Cliente/Servidor

Cómo funciona una petición HTTP

Internet es más grande de lo que crees

Sistemas operativos

Diferencias entre Windows, Linux, Mac, iOS y Android

Permisos, niveles de procesos y privilegios de ejecución

Sistemas operativos móviles vs desktop

Sistemas operativos embebidos e Internet of Things

Archivos y estructuras de datos

Metadatos, cabeceras y extensiones de archivos

Por qué JPG pesa menos que BMP

Compresión de video con H264 y MP3

Cómo funcionan los algoritmos de compresión ZIP

Contenido Bonus

Cómo las redes neuronales procesan datos

¿Qué es SQL y NoSQL?

Variables y ciclos con combate Pokémon

Raspberry Pi: cómo crear proyectos IoT reales

Principios de la ingeniería de software sostenible