Bibliographie
I - Accompagnement
Généralité
Guides pour la prise en compte de l’impact de l’IA
II - Développement
Plateforme de partage de modèles
Articles de recherche centraux
Transformers
- Papier original ‘Attention Is All You Need’
- Explication illustrée et très détaillée
- Les différents types de modèles
- Les Mixture of Experts
Fine-tuning
Bonnes pratiques du prompt engineering
Evaluation (métriques)
Basée sur embeddings | Basée sur modèle fine-tuné | Basé sur LLM |
---|---|---|
BERTScore | UniEval | G-Eval |
MoverScore | Lynx | GPTScore |
Prometheus-eval |
Evaluation (frameworks) - Ragas (spécialisé pour le RAG) - Ares (spécialisé pour le RAG) - Giskard - DeepEval
Evaluation (RAG) - Evaluation of Retrieval-Augmented Generation: A Survey - Automated Evaluation of Retrieval-Augmented Language Models with Task-Specific Exam Generation
Evaluation (divers) - Prompting strategies for LLM-based metrics - LLM-based NLG Evaluation: Current Status and Challenges - Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena
Librairies et ressources
LLM platform - Ollama
Pipelines et orchestration LLM - LangChain - LlamaIndex - Haystack
RAG - Graph RAG
Evaluation - SelfCheckGPT