Compartir contenido

La inteligencia artificial ha llegado para quedarse. Cada vez más personas utilizan herramientas como ChatGPT para escribir textos, resolver dudas, programar o incluso crear imágenes. Sin embargo, existe un concepto que aparece constantemente cuando hablamos de IA y que suele generar bastante confusión: los tokens.

Si alguna vez has leído frases como «has alcanzado el límite de tokens» o «este modelo admite 200.000 tokens de contexto», probablemente te hayas preguntado qué significa realmente.

En este artículo descubrirás, de forma sencilla y sin conocimientos técnicos, qué son los tokens, para qué sirven y por qué son tan importantes en el funcionamiento de la inteligencia artificial.

¿Qué es un token?

Un token es la unidad básica con la que trabaja un modelo de inteligencia artificial.

Aunque nosotros escribimos utilizando palabras y frases, los modelos de IA no entienden el lenguaje exactamente igual que una persona. Antes de procesar un texto, lo dividen en pequeñas piezas llamadas tokens.

Estas piezas pueden ser:

Una palabra completa.
Parte de una palabra.
Un número.
Un signo de puntuación.
Incluso un espacio o un símbolo especial.

En otras palabras, los tokens son el idioma interno que utiliza la inteligencia artificial para leer y generar texto.

Un ejemplo muy sencillo

Supongamos que escribimos:

«Hoy hace mucho calor en Madrid.»

Para una persona es una única frase.

Sin embargo, la IA podría dividirla aproximadamente así:

Hoy
hace
mucho
calor
en
Madrid
.

Cada uno de estos elementos sería un token o un pequeño conjunto de tokens, dependiendo del modelo utilizado.

Cuanto más largo sea el texto, mayor será el número de tokens que tendrá que procesar la IA.

¿Por qué la IA utiliza tokens y no palabras?

La razón es bastante sencilla.

Los idiomas contienen millones de palabras diferentes, además de nombres propios, números, símbolos, abreviaturas y errores ortográficos.

Si la IA tuviera que aprender todas las palabras posibles sería prácticamente imposible.

En cambio, al trabajar con tokens puede construir cualquier palabra combinando pequeñas piezas.

Por ejemplo:

La palabra:

extraordinariamente

podría dividirse en varios tokens como:

extra
ordinaria
mente

Este sistema permite que la IA comprenda palabras nuevas que nunca había visto exactamente iguales.

¿Cuántos tokens tiene una palabra?

No existe una regla fija.

Depende del idioma y de la longitud de la palabra.

Como orientación:

Una palabra corta suele ocupar 1 token.
Una palabra larga puede ocupar 2 o 3 tokens.
Una frase de unas 20 palabras suele rondar entre 25 y 35 tokens.

En español suele cumplirse aproximadamente esta equivalencia:

1 token ≈ ¾ de palabra
100 palabras ≈ 130-150 tokens
1.000 palabras ≈ 1.300-1.500 tokens

Es una aproximación, pero resulta muy útil para hacerse una idea.

¿Para qué sirven los tokens?

Los tokens cumplen varias funciones fundamentales.

1. Leer lo que escribimos

Cuando hacemos una pregunta, la IA convierte nuestro texto en tokens para poder entenderlo.

2. Recordar la conversación

Cada conversación tiene un límite de contexto.

Ese contexto no se mide en páginas ni en palabras.

Se mide en tokens.

Por ejemplo, si un modelo admite 200.000 tokens significa que puede recordar una enorme cantidad de información antes de empezar a olvidar las partes más antiguas de la conversación.

3. Generar respuestas

La IA no escribe una frase completa de una sola vez.

Va generando un token detrás de otro.

Es decir:

Predice el siguiente token.
Después calcula el siguiente.
Después otro.
Y así sucesivamente.

Este proceso ocurre cientos de veces por segundo.

¿Los tokens afectan al coste de la IA?

Sí.

En la mayoría de servicios profesionales de inteligencia artificial el precio se calcula según el número de tokens procesados.

Normalmente se distinguen dos tipos:

Tokens de entrada: los que escribimos nosotros.
Tokens de salida: los que genera la IA como respuesta.

Cuanto mayor sea el texto enviado y más larga sea la respuesta, mayor será el número de tokens utilizados.

Por eso muchas plataformas muestran el consumo de tokens o establecen límites mensuales.

¿Qué significa «ventana de contexto»?

Es uno de los conceptos más importantes.

La ventana de contexto representa la cantidad máxima de tokens que un modelo puede tener presentes al mismo tiempo.

Dentro de esa ventana se incluye:

Nuestra pregunta.
Las respuestas anteriores.
Documentos que hayamos subido.
Instrucciones del sistema.
Conversaciones anteriores (cuando corresponda).

Cuando se supera ese límite, el modelo empieza a eliminar información antigua para dejar espacio a la nueva.

Es parecido a una mesa de trabajo.

Si la mesa es pequeña, llega un momento en el que hay que retirar papeles antiguos para seguir trabajando.

¿Por qué es importante entender los tokens?

Aunque un usuario nunca tenga que contarlos manualmente, conocer este concepto ayuda a comprender mejor cómo funciona la IA.

Por ejemplo:

Entender por qué una conversación muy larga puede perder contexto.
Saber por qué algunos modelos pueden analizar documentos enormes y otros no.
Comprender cómo se calcula el coste en las APIs de inteligencia artificial.
Crear instrucciones más eficientes y organizadas.

Además, cuando trabajamos con grandes documentos, bases de datos o programación, el número de tokens cobra todavía más importancia.

Consejos para aprovechar mejor los tokens

Si utilizas herramientas de inteligencia artificial con frecuencia, estos consejos pueden ayudarte:

Haz preguntas claras y concretas.
Evita repetir información innecesaria.
Resume conversaciones muy largas cuando sea posible.
Divide documentos enormes en varias partes si el modelo tiene un contexto limitado.
Mantén las instrucciones organizadas para que la IA las interprete correctamente.

De esta forma aprovecharás mejor la capacidad del modelo y obtendrás respuestas más precisas.

En definitiva, cada pregunta que hacemos y cada respuesta que recibimos están formadas por miles de tokens trabajando juntos en segundo plano. Entender este concepto permite utilizar la inteligencia artificial de forma más consciente y sacar el máximo partido a sus posibilidades, tanto en un uso cotidiano como en entornos profesionales.

¿Qué son los tokens en Inteligencia Artificial? La clave para entender cómo «piensan» ChatGPT y otras IA