Fine-Tuning
Continuar el entrenamiento de un modelo con tus propios ejemplos para cambiar cómo se comporta, lo que es la herramienta adecuada para el estilo y el formato, y la equivocada para inyectar hechos recientes.
El fine-tuning toma un modelo preentrenado y lo entrena más con un conjunto curado de tus propios ejemplos, ajustando los pesos del modelo para que se incline hacia el comportamiento que demostraste. Lo usas para incorporar un tono consistente, un formato de salida específico, un vocabulario de dominio o una tarea que el modelo base maneja con torpeza. Cambia cómo responde el modelo, no a qué hechos tiene acceso.
La decisión que de verdad importa es fine-tuning frente a RAG, y la gente la entiende al revés constantemente. RAG inyecta hechos recientes y cambiantes en tiempo de ejecución recuperándolos de tus datos, así que la respuesta solo es tan actual como tu última actualización de documento. El fine-tuning enseña comportamiento duradero pero congela el conocimiento en el momento del entrenamiento, así que es la herramienta equivocada cuando tus hechos cambian. La regla general: ajusta para la forma, recupera para los hechos. Muchos sistemas reales usan ambos, un modelo afinado que responde con tu estilo propio, fundamentado por recuperación para los datos en vivo.
La realidad de los costes da menos miedo que antes pero sigue siendo real. Necesitas un conjunto de datos limpio y etiquetado (normalmente de cientos a miles de ejemplos), la propia ejecución del entrenamiento y el coste continuo de reafinar cada vez que el modelo base mejora o tus requisitos cambian. Ese último coste es el que los equipos olvidan. Un fine-tune no es un proyecto único, es un compromiso de mantenimiento.
¿Cuándo gana el fine-tuning sin discusión? Cuando el prompting más la recuperación no pueden producir de forma fiable el formato o comportamiento que necesitas, y tienes suficientes ejemplos de alta calidad para enseñarlo. En la duda, agota primero el prompting y RAG, porque son más baratos de cambiar. Tomamos esta decisión de construir frente a afinar bajo Inteligencia Artificial.