Bibliographie

I - Accompagnement

Généralité

Guides pour la prise en compte de l’impact de l’IA

II - Développement

Plateforme de partage de modèles

Articles de recherche centraux

Transformers

Fine-tuning

Bonnes pratiques du prompt engineering

Evaluation (métriques)

Basée sur embeddings Basée sur modèle fine-tuné Basé sur LLM
BERTScore UniEval G-Eval
MoverScore Lynx GPTScore
Prometheus-eval

Evaluation (frameworks) - Ragas (spécialisé pour le RAG) - Ares (spécialisé pour le RAG) - Giskard - DeepEval

Evaluation (RAG) - Evaluation of Retrieval-Augmented Generation: A Survey - Automated Evaluation of Retrieval-Augmented Language Models with Task-Specific Exam Generation

Evaluation (divers) - Prompting strategies for LLM-based metrics - LLM-based NLG Evaluation: Current Status and Challenges - Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena

Librairies et ressources

LLM platform - Ollama

Pipelines et orchestration LLM - LangChain - LlamaIndex - Haystack

RAG - Graph RAG

Evaluation - SelfCheckGPT