Fine-Tuning
Continuar el entrenamiento de un modelo con tus propios ejemplos para cambiar cómo se comporta, lo que es la herramienta adecuada para el estilo y el formato, y la equivocada para inyectar hechos recientes.
El fine-tuning toma un LLM preentrenado y lo entrena más con un conjunto curado de tus propios ejemplos, ajustando los pesos del modelo para que se incline hacia el comportamiento que demostraste. Lo usas para incorporar un tono consistente, un formato de salida específico, un vocabulario de dominio o una tarea que el modelo base maneja con torpeza. Cambia cómo responde el modelo, no a qué hechos tiene acceso.
La decisión que de verdad importa es fine-tuning frente a RAG, y la gente la entiende al revés constantemente. RAG inyecta hechos recientes y cambiantes en tiempo de ejecución recuperándolos de tus datos, así que la respuesta solo es tan actual como tu última actualización de documento. El fine-tuning enseña comportamiento duradero pero congela el conocimiento en el momento del entrenamiento, así que es la herramienta equivocada cuando tus hechos cambian, y tampoco frenará de forma fiable que el modelo invente cosas, ya que la alucinación se reduce con fundamentación, no con afinado. La regla general: ajusta para la forma, recupera para los hechos. Muchos sistemas reales usan ambos, un modelo afinado que responde con tu estilo propio, fundamentado por recuperación para los datos en vivo.
La realidad de los costes da menos miedo que antes pero sigue siendo real. Necesitas un conjunto de datos limpio y etiquetado (normalmente de cientos a miles de ejemplos), la propia ejecución del entrenamiento y el coste continuo de reafinar cada vez que el modelo base mejora o tus requisitos cambian. Ese último coste es el que los equipos olvidan. Un fine-tune no es un proyecto único, es un compromiso de mantenimiento.
Ejemplo de fine-tuning ganando de plano: una empresa necesita que cada respuesta del modelo vuelva como JSON estricto que coincida con un esquema interno, con un estilo de casa específico y conciso, a lo largo de millones de llamadas. El prompting puede lograrlo la mayoría de las veces, pero la respuesta mal formada ocasional rompe el sistema posterior, y meter la guía de estilo completa y el esquema en cada prompt quema tokens en cada llamada. Un fine-tune incorpora el formato y el tono en los pesos del modelo, de modo que las instrucciones ya no tienen que repetirse en el contexto, lo que hace las respuestas a la vez más fiables y más baratas por llamada a ese volumen. Ese es el punto óptimo: comportamiento duradero, alto volumen de llamadas y un formato que el prompting no acaba de clavar de forma consistente.
¿Cuándo gana el fine-tuning sin discusión? Cuando el prompting más la recuperación no pueden producir de forma fiable el formato o comportamiento que necesitas, y tienes suficientes ejemplos de alta calidad para enseñarlo. En la duda, agota primero el prompting y RAG, porque son más baratos de cambiar. Tomamos esta decisión de construir frente a afinar bajo Inteligencia Artificial.