Runas en Go: bytes vs caracteres reales

Curso de Go

Contenido del curso

Introducción y Configuración

Fundamentos de Go

Estructuras de Datos y Funciones

Manejo de Errores y Concurrencia

Buenas Prácticas en Go

Tomar examen

Runas en Go: bytes vs caracteres reales

Resumen

En Go cada carácter de una cadena no se llama carácter sino runa, y entender esta diferencia te ayuda a optimizar memoria y a manejar textos con caracteres especiales como Unicode UTF-8. Si vienes de otros lenguajes donde una letra equivale a un byte, aquí vas a descubrir por qué Go cuenta distinto y cómo aprovecharlo.

¿Qué es una runa en Go y por qué importa?

Una runa en Go es la unidad real con la que el lenguaje representa cada carácter de una cadena. El nombre viene justo de las runas vikingas, y aunque suene exótico, responde a una decisión técnica muy concreta: permitir que Go maneje caracteres especiales sin desperdiciar espacio en memoria.

Cuando trabajas con letras normales bajo el estándar Unicode, cada carácter consume cierto espacio. Las runas optimizan ese consumo, y ahí se nota la obsesión de Go por mejorar el rendimiento incluso en los detalles más pequeños [1:05].

¿Una runa es lo mismo que un carácter? No. En Go una runa es la representación interna de un punto Unicode, y un solo carácter visible puede ocupar varias runas dependiendo del idioma o símbolo.

¿Cómo se comporta una cadena con caracteres Unicode UTF 8?

Para verlo en acción, basta con crear una carpeta runas con un archivo main.go e importar el paquete unicode/utf8, que es la forma estándar en la que Go procesa los textos de cualquier cadena.

Si defines una constante con la palabra hola escrita en tailandés y mides su longitud con len(), el resultado es 18. Eso ocurre porque los caracteres no son alfanuméricos y se procesan distinto en memoria [3:10].

En cambio, si defines otra constante con la palabra hola en español, la longitud es 4. Misma palabra, mismo significado, pero un abismo en cómo Go las almacena.

go const saludo = "สวัสดี" const saludo2 = "Hola"

fmt.Println("Longitud saludo:", len(saludo)) // 18 fmt.Println("Longitud saludo2:", len(saludo2)) // 4

¿Cómo cuento las runas reales de una cadena?

La función len() te devuelve bytes, no runas. Para contar runas reales necesitas el paquete unicode/utf8 y su función RuneCountInString, que recorre la cadena respetando los puntos Unicode.

¿Por qué len() y RuneCountInString dan resultados distintos? Porque len() cuenta bytes en memoria y RuneCountInString cuenta caracteres Unicode. En textos en español suelen coincidir, pero en idiomas como tailandés, japonés o emojis no.

Para recorrer cada runa y ver dónde empieza en memoria, puedes usar un ciclo for con range, que te entrega dos valores: el índice en bytes y el valor de la runa.

go for i, r := range saludo { fmt.Printf("Índice %d: runa %U carácter %c\n", i, r, r) }

Al ejecutar go run main.go, la consola muestra el código Unicode de cada runa, su carácter visible y la posición exacta donde inicia en memoria [5:40]. Esa salida es la prueba visual de que Go no ve cuatro letras: ve una secuencia de bytes mapeados a runas.

¿Por qué aprender runas te hace mejor desarrollador en Go?

Llegar al nivel de detalle de las runas implica un conocimiento más avanzado del lenguaje, y demuestra que te interesa entender cómo Go maneja los recursos por dentro.

Estos son los aprendizajes que te llevas al dominar este tema:

Diferenciar bytes de runas para evitar errores al medir longitudes.
Procesar correctamente textos en cualquier idioma con Unicode UTF 8.
Optimizar memoria al elegir entre string, []byte y []rune según el caso.
Recorrer cadenas con range sabiendo qué te devuelve cada iteración.

Como recurso adicional, existe un artículo publicado en octubre de 2013 en el blog oficial de Go que explica a profundidad el manejo de memoria entre caracteres y runas [7:20]. Vale la pena leerlo si quieres profundizar.

Gracias a esto no solo conoces más de Go, también entiendes mejor cómo se maneja el cómputo en los sistemas que construyes. Y más importante: aprendes a mejorar el manejo de memoria para seguir presumiendo que tus aplicaciones de Go son las más rápidas. ¿Habías notado antes esta diferencia entre len() y el conteo real de caracteres? Cuéntame en los comentarios.

Comentarios7

Lina Marcela Malaver Gómez

Estudiante

Otra forma de verlo...

package main

import (
	"fmt"
	"unicode/utf8"
)

func main() {
	const unicode = "áéíóú"

	fmt.Println("El unicode es:", unicode)
	fmt.Println("Len: ", len(unicode))

	for i := 0; i < len(unicode); i++ {
		fmt.Printf("%x ", unicode[i])
	}

	fmt.Println("Conteo de runas:", utf8.RuneCountInString(unicode))

	for idx, valorRuna := range unicode {
		fmt.Printf("%#U comienza en %d\n", valorRuna, idx)
	}
}
```package main
import (    "fmt"    "unicode/utf8")
func main() {    const unicode = "áéíóú"
    fmt.Println("El unicode es:", unicode)    fmt.Println("Len: ", len(unicode))
    for i := 0; i < len(unicode); i++ {        fmt.Printf("%x ", unicode\[i])    }
    fmt.Println("Conteo de runas:", utf8.RuneCountInString(unicode))
    for idx, valorRuna := range unicode {        fmt.Printf("%#U comienza en %d\n", valorRuna, idx)    }}

Miguel Angel Reyes Moreno

Estudiante

Para entender mejor este código, hay que saber que el paquete 'fmt'

contiene la función Printf, y los formatos de salida disponibles.

Documentación oficial ->

Catalano Nicolas

Estudiante

Yo use este codigo como saludo en tailandes:

package main

import (
	"fmt"
	"unicode/utf8"
)

func main() {
	const saludoEnTailandes = "สวัสดีครับ" // "Hello" in Thai
	const saludo2 = "Hola"

	fmt.Println("El saludo es:", saludoEnTailandes)
	fmt.Println("Len: ", len(saludoEnTailandes)) // 30
	fmt.Println("El saludo es:", saludo2)
	fmt.Println("Len saludo 2: ", len(saludo2)) // 4

	for i := 0; i < len(saludoEnTailandes); i++ {
		fmt.Printf("%x ", saludoEnTailandes[i])
	}

	fmt.Println("Rune count:", utf8.RuneCountInString(saludoEnTailandes))

	for idx, valorRuna := range saludoEnTailandes {
		fmt.Printf("%#U comienza en %d\n", valorRuna, idx)
	}
}

Ronaldo Jiménez

Estudiante

package main

import (
	"fmt"
)

func main() {
	// Definimos una cadena de texto que incluye caracteres especiales y un emoji
	palabra := "Go está chévere👍"

	// --- Recorrido usando for y range (¡La forma correcta!) ---
	fmt.Println("Recorrido usando 'range' (¡con runes!):")
	for i, r := range palabra {
		fmt.Printf("Índice: %d, Rune: %c, Valor Unicode: %U\n", i, r, r)
	}

	fmt.Println("\n--- Recorrido usando 'for' simple (¡con bytes!) ---")
	fmt.Println("Esto puede generar caracteres ilegibles para Unicode:")
	for i := 0; i < len(palabra); i++ {
		fmt.Printf("Índice: %d, Byte: %c, Valor byte: %d\n", i, palabra[i], palabra[i])
	}
}

Jair Israel Avilés Eusebio

Estudiante

No veo los recursos disponibles de esta clase como el profesor lo menciona.

Amin Espinoza

Profesor

Ops! Ya lo revisaré. Gracias!

Samuel Soto Hoyos

Estudiante

[Strings, bytes, runes and characters in Go](https://go.dev/blog/strings)

Eddy Manuel López Amaya

Estudiante

interesante

package main

import (
	"fmt"
	"unicode/utf8"
)

func main() {
	const unicode = "áéíóú"

	fmt.Println("El unicode es:", unicode)
	fmt.Println("Len: ", len(unicode))

	for i := 0; i < len(unicode); i++ {
		fmt.Printf("%x ", unicode[i])
	}

	fmt.Println("Conteo de runas:", utf8.RuneCountInString(unicode))

	for idx, valorRuna := range unicode {
		fmt.Printf("%#U comienza en %d\n", valorRuna, idx)
	}
}
```package main
import (    "fmt"    "unicode/utf8")
func main() {    const unicode = "áéíóú"
    fmt.Println("El unicode es:", unicode)    fmt.Println("Len: ", len(unicode))
    for i := 0; i < len(unicode); i++ {        fmt.Printf("%x ", unicode\[i])    }
    fmt.Println("Conteo de runas:", utf8.RuneCountInString(unicode))
    for idx, valorRuna := range unicode {        fmt.Printf("%#U comienza en %d\n", valorRuna, idx)    }}

package main

import (
	"fmt"
	"unicode/utf8"
)

func main() {
	const saludoEnTailandes = "สวัสดีครับ" // "Hello" in Thai
	const saludo2 = "Hola"

	fmt.Println("El saludo es:", saludoEnTailandes)
	fmt.Println("Len: ", len(saludoEnTailandes)) // 30
	fmt.Println("El saludo es:", saludo2)
	fmt.Println("Len saludo 2: ", len(saludo2)) // 4

	for i := 0; i < len(saludoEnTailandes); i++ {
		fmt.Printf("%x ", saludoEnTailandes[i])
	}

	fmt.Println("Rune count:", utf8.RuneCountInString(saludoEnTailandes))

	for idx, valorRuna := range saludoEnTailandes {
		fmt.Printf("%#U comienza en %d\n", valorRuna, idx)
	}
}

package main

import (
	"fmt"
)

func main() {
	// Definimos una cadena de texto que incluye caracteres especiales y un emoji
	palabra := "Go está chévere👍"

	// --- Recorrido usando for y range (¡La forma correcta!) ---
	fmt.Println("Recorrido usando 'range' (¡con runes!):")
	for i, r := range palabra {
		fmt.Printf("Índice: %d, Rune: %c, Valor Unicode: %U\n", i, r, r)
	}

	fmt.Println("\n--- Recorrido usando 'for' simple (¡con bytes!) ---")
	fmt.Println("Esto puede generar caracteres ilegibles para Unicode:")
	for i := 0; i < len(palabra); i++ {
		fmt.Printf("Índice: %d, Byte: %c, Valor byte: %d\n", i, palabra[i], palabra[i])
	}
}

Runas en Go: bytes vs caracteres reales

Introducción y Configuración

Características y ventajas del lenguaje de programación Go

Instala Go en WSL con un comando

Paquetes en Go sin npm ni pip

Fundamentos de Go

Formas de declarar variables en Go

Conversión de tipos en Go

if else y operador módulo en Go

Cuatro formas de usar for en Go

Estructuras de Datos y Funciones

Sentencia switch en Go con ejemplos reales

Arreglos en Go: fijos e inferidos

Creación y uso de slices dinámicos en Go

Mapas en Go: creación, acceso y manipulación de datos clave-valor

Cómo crear y usar funciones personalizadas en Go

Retorno de múltiples valores en Go

Funciones variadic en Go con tres puntos

Funciones recursivas en Go con Fibonacci

Punteros en Go para optimizar rendimiento del sistema