Definimos preliminarmente un maximo de chunking de 200 tokens
Bajo el siguiente supuesto:
- Se reserva al menos 3k de ventana de contexto para el retrieval del rag
- Por lo tanto se espera como minimo 16 retrievals
/modelos contiene los archivos docker-compose correspondientes a cada modelo para su despliegue./modelos contiene los archivos docker-compose correspondientes a cada modelo para su despliegue.