TECNOLOGÍAS

Fine-Tuning

Continuar el entrenamiento de un modelo con tus propios ejemplos para cambiar cómo se comporta, lo que es la herramienta adecuada para el estilo y el formato, y la equivocada para inyectar hechos recientes.

Última revisión: porKevin Riedl wiki ↗

El fine-tuning toma un LLM preentrenado y lo entrena más con un conjunto curado de tus propios ejemplos, ajustando los pesos del modelo para que se incline hacia el comportamiento que demostraste. Lo usas para incorporar un tono consistente, un formato de salida específico, un vocabulario de dominio o una tarea que el modelo base maneja con torpeza. Cambia cómo responde el modelo, no a qué hechos tiene acceso.

La decisión que de verdad importa es fine-tuning frente a RAG, y la gente la entiende al revés constantemente. RAG inyecta hechos recientes y cambiantes en tiempo de ejecución recuperándolos de tus datos, así que la respuesta solo es tan actual como tu última actualización de documento. El fine-tuning enseña comportamiento duradero pero congela el conocimiento en el momento del entrenamiento, así que es la herramienta equivocada cuando tus hechos cambian, y tampoco frenará de forma fiable que el modelo invente cosas, ya que la alucinación se reduce con fundamentación, no con afinado. La regla general: ajusta para la forma, recupera para los hechos. Muchos sistemas reales usan ambos, un modelo afinado que responde con tu estilo propio, fundamentado por recuperación para los datos en vivo.

La realidad de los costes da menos miedo que antes pero sigue siendo real. Necesitas un conjunto de datos limpio y etiquetado (normalmente de cientos a miles de ejemplos), la propia ejecución del entrenamiento y el coste continuo de reafinar cada vez que el modelo base mejora o tus requisitos cambian. Ese último coste es el que los equipos olvidan. Un fine-tune no es un proyecto único, es un compromiso de mantenimiento.

Ejemplo de fine-tuning ganando de plano: una empresa necesita que cada respuesta del modelo vuelva como JSON estricto que coincida con un esquema interno, con un estilo de casa específico y conciso, a lo largo de millones de llamadas. El prompting puede lograrlo la mayoría de las veces, pero la respuesta mal formada ocasional rompe el sistema posterior, y meter la guía de estilo completa y el esquema en cada prompt quema tokens en cada llamada. Un fine-tune incorpora el formato y el tono en los pesos del modelo, de modo que las instrucciones ya no tienen que repetirse en el contexto, lo que hace las respuestas a la vez más fiables y más baratas por llamada a ese volumen. Ese es el punto óptimo: comportamiento duradero, alto volumen de llamadas y un formato que el prompting no acaba de clavar de forma consistente.

¿Cuándo gana el fine-tuning sin discusión? Cuando el prompting más la recuperación no pueden producir de forma fiable el formato o comportamiento que necesitas, y tienes suficientes ejemplos de alta calidad para enseñarlo. En la duda, agota primero el prompting y RAG, porque son más baratos de cambiar. Tomamos esta decisión de construir frente a afinar bajo Inteligencia Artificial.

// FAQ

Preguntas frecuentes

Ajusta para la forma, recupera para los hechos. El fine-tuning cambia cómo se comporta el modelo (tono, formato, tarea). RAG inyecta hechos actuales en tiempo de ejecución. Si tus datos cambian a menudo, quieres RAG, no un fine-tune que congela el conocimiento.
Más de lo que sugiere la ejecución del entrenamiento. Presupuesta la creación de un conjunto de datos limpio y etiquetado, el entrenamiento en sí y el coste recurrente de reafinar siempre que el modelo base o tus requisitos cambien. El mantenimiento es la parte que los equipos subestiman.
Cuando necesitas hechos recientes o que cambian con frecuencia en las respuestas. El fine-tuning incorpora el conocimiento en el momento del entrenamiento. Para datos en vivo, usa recuperación. También es equivocado si el prompting y RAG ya te llevan allí de forma más barata.