Metadatos, cabeceras y extensiones de archivos
Clase 24 de 32 • Fundamentos de Ingeniería de Software
Resumen
La mayoría de extensiones son de tres caracteres, porque en los inicios de la computación, solo era posible asignar 3 bytes para la extensión (tipo) de archivo, y 8 para el nombre. Sin embargo, todo avanzo y ya no estamos limitados a usar únicamente tres caracteres para denotar el tipo de archivo. Uno de los conocimientos básico que debemos tener, es el saber identificar las diferentes extensiones que pueden tener los archivos que más utilizamos y reconocer que tipos de programas pueden abrir dichos archivos.
¿Cómo funcionan las extensiones de los archivos?
Los Sistemas Operativos tienen en una base de datos guardada la correspondencia de cada extensión de archivo. Es decir, en la base de datos dirá algo como: jpg = imagen, mp3 = música, html = página web y así. En todo caso, para llegar a esta base de datos y encontrar a que corresponde, es necesario primero identificar que tipo de archivo es. Para ello el S.O. lee los primeros bits de cada archivo hasta que encuentra cierto patrón, esos bits de identificación se llaman la cabecera. Una vez identificado el patrón, el SO ya conoce que tipo de archivo es, con que programa se debe abrir y cómo se debe mostrar gracias a la base de datos.
Todo esto en la web funciona a través de un estándar denominado MIME TYPES (Extensión para emails multipropósito). Eventualmente, funcionaba solo con emails, pero hoy en día está en la mayoría de protocolos de comunicación. La forma en que funciona es sencilla, en la cabecera del protocolo de comunicación (independiente de si es http, ftp) se envían metadatos con la información del archivo. De tal forma que si es una página web, envía text/html, si es un video mp4 envía video/mp4 y así se logra la identificación de los archivos
Contribución creada con los aportes de: Mayra López.