No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Aportes 13

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

UNICODE 😎


Unicode es un sistema de codificación de caracteres más moderno que tiene como objetivo representar todos los caracteres utilizados en todos los sistemas de escritura del mundo. Unicode utiliza más de un byte para representar caracteres y ofrece diferentes formas de codificación, como UTF-8, UTF-16 y UTF-32.
.
UTF-8 es el esquema de codificación más comúnmente utilizado en la web y en sistemas informáticos modernos. Utiliza de 1 a 4 bytes para representar caracteres, según su valor.
.
UTF-16 utiliza principalmente 2 bytes, pero también puede usar 4 bytes para caracteres más raros o menos comunes.
.
UTF-32 utiliza 4 bytes, lo que simplifica que todos los caracteres se representan con la misma cantidad de bytes.
.

Este sistema es el que nos permite utilizar emojis 😋 que son una combinación de varios caracteres. 💚

Algo interesante es que Unicode no ocupa los 32 bits necesariamente para cada carácter, sino que según la codificación que se le dé ocupará un rango distinto de bits.
UTF-8 utiliza de 1 a 4 bytes dependiendo del caracter a representar para así ocupar menos espacio.

Clase 8 - UNICODE


Repaso de la clase


¿Cómo se llama el código que tenía el objetivo de representar los caracteres especiales que el código ASCII no podía?

  • UNICODE.

¿Qué caracteres especiales podemos representar gracias a UNICODE?

  • Los caracteres especiales faltantes en ASCII.
  • Emojis.
  • Los caracteres especiales de cada abecedario del mundo.

Existen otros tipos de alfabetos y estos entran en representación de caracteres especiales por la forma en que se representan las letras

ejemplo:

Ñ , o emojis

Nació un nuevo código que se llamo UNICODE lista muy amplia de caracteres especiales y emojis que año tras año siguen saliendo nuevos emojis o caracteres

Unicode: El estándar universal para texto

Unicode es un estándar de codificación de caracteres que permite representar la mayoría de los sistemas de escritura del mundo utilizando un único conjunto de números. En palabras simples, es un lenguaje que permite que las computadoras comprendan y representen diferentes idiomas y símbolos de manera uniforme.

Aquí hay algunos puntos clave sobre Unicode:

  • Asigna un código único (punto de código) a cada carácter. Esto incluye letras, números, símbolos, emoji, caracteres de puntuación y mucho más.
  • Admite más de 139.000 caracteres de más de 100 escrituras diferentes. Esto abarca idiomas populares como inglés, español, chino, árabe, hindi y muchos más.
  • Sigue evolucionando para abarcar nuevos idiomas y símbolos.
  • Es el estándar de texto dominante en la actualidad. Se utiliza en casi todos los sistemas operativos, navegadores web, aplicaciones y dispositivos electrónicos.

Ventajas de Unicode:

  • Facilita el intercambio de texto entre diferentes idiomas. Permite que la información se comparta y procese sin importar el idioma original.
  • Mejora la accesibilidad del texto. Permite que las personas con discapacidades accedan a la información en su propio idioma.
  • Simplifica el desarrollo de software multilingüe. Los desarrolladores no necesitan trabajar con múltiples codificaciones de caracteres diferentes.

Algunos ejemplos de la aplicación de Unicode:

  • Puedes escribir un documento en español con palabras en inglés, chino y emojis, y todo se mostrará correctamente en un dispositivo compatible con Unicode.
  • Un sitio web puede ofrecer contenido en varios idiomas sin necesidad de versiones separadas para cada idioma.
  • Las aplicaciones de traducción automática utilizan Unicode para procesar y traducir texto de diferentes idiomas.

Recursos adicionales:

 
 

UTF-8, UTF-16 y UTF-32: Formas de codificar caracteres Unicode

UTF-8:

  • Codificación de longitud variable: Usa de 1 a 4 bytes para representar un carácter.
  • Eficiencia: Más eficiente en espacio para texto occidental común (mayoría de idiomas europeos y latinoamericanos).
  • Procesamiento: Fácil de procesar e implementar.
  • Uso común: Estándar común en internet y sistemas operativos.

UTF-16:

  • Codificación de longitud variable: Usa 2 o 4 bytes para representar caracteres.
  • Eficiencia: Similar a UTF-8 para la mayoría de los textos, pero puede ser menos eficiente para algunos casos.
  • Procesamiento: Puede ser menos eficiente en procesamiento que UTF-8 para algunos casos.
  • Uso común: Utilizado en sistemas operativos como Windows.

UTF-32:

  • Codificación de longitud fija: Usa 4 bytes para representar todos los caracteres.
  • Eficiencia: Menos eficiente que UTF-8 o UTF-16.
  • Procesamiento: Complejo de procesar.
  • Uso común: Se usa en situaciones específicas como procesamiento interno de sistemas o para idiomas complejos.

Acá les va un aporte curioso

El profe tiene cierto parecido a Penn Badgley de la serie You.

**Unicode es un estándar de codificación de caracteres **diseñado para facilitar el tratamiento informático, transmisión, y visualización de textos de numerosos idiomas y disciplinas técnicas, además de textos clásicos de lenguas muertas. El término Unicode proviene de los tres objetivos perseguidos: universalidad, uniformidad, y unicidad ☻.

Resumen de la clase: ![](https://static.platzi.com/media/user_upload/Captura%20de%20Pantalla%202024-06-19%20a%20la%28s%29%2019.24.33-dc25c4bd-698d-4f19-b18a-60e217718550.jpg)
🧠

https://youtu.be/M_yNoV3c8DY este video puede ayudar a profundizar un poco mas el tema.

178 80 228

Es interesante como se usa UNICODE. No pense que este sirve para los emojis y como nos permite agregar el valor de signos aparte. A seguir aprendiendo.