Pruebas al modelo con fine-tuning
Debemos evaluar la eficiencia del modelo:
- Metricas automaticas: se utilizaran metricas como BLEU y METEOR.
- Diversidad y novedad: si tenemos diferentes preguntas y cuando estas respuestas tienen cierta similitud(lo que queremos evitar).
- Evaluacion de dominio especifico: Si todas las respuestas pertenecen al mismo contexto con el dataset con el que se entreno.
- Evaluación humana: Pedimos a un grupo de personas que evalúen las respuestas generadas en la gramatica y si acierta con el contexto.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?
o inicia sesión.