
Ruben Peña
Pregunta¿Por qué no se ha estandarizado el uso del UTF-16 en HTML?

Ezequiel Choque
_De acuerdo con los resultados de una muestra de Google de varios miles de millones de páginas, menos del 0.01% de las páginas en la Web están codificadas en UTF-16. UTF-8 representó más del 80% de todas las páginas web, si incluye su subconjunto, ASCII, y más del 60% si no lo hace. No le recomendamos utilizar UTF-16 como codificación de su página.
Si, por alguna razón, no tiene otra opción, aquí hay algunas reglas para declarar la codificación. Son diferentes a los de otras codificaciones.
La especificación HTML5 prohíbe el uso del metaelemento para declarar UTF-16, porque los valores deben ser compatibles con ASCII . En su lugar, debe asegurarse de tener siempre una marca de orden de bytes al comienzo de un archivo codificado en UTF-16. En efecto, esta es la declaración en el documento.
Además, si su página está codificada como UTF-16, no declare que su archivo es "UTF-16BE" o "UTF-16LE", use solo "UTF-16". La marca de orden de bytes al principio de su archivo indicará si el esquema de codificación es little-endian o big-endian . (Esto se debe a que el contenido codificado explícitamente como, por ejemplo, UTF-16BE no debe usar una marca de orden de bytes; pero HTML5 requiere una marca de orden de bytes para las páginas codificadas de UTF-16)._