300 shaares
Une étude qui propose un aperçu global de l'évaluation des LLMs, en les classant en trois catégories principales : l'évaluation des connaissances et des capacités, de l'alignement et de la sécurité. Elle offre une revue détaillée des méthodes d'évaluation, établit une collection d'évaluations sur la performance des LLMs dans des domaines spécialisés et discute de la création de plateformes d'évaluation exhaustives.