SinergIA - La Unió en la Diversitat
🎯 Resum
SinergIA és un sistema multi-agent avançat dissenyat per millorar la precisió en tasques de raonament mèdic. El projecte integra diversos 'agents experts' (models de llenguatge fine-tuned amb LoRA per a especialitats clíniques concretes) coordinats per un supervisor. L'objectiu és superar les limitacions d'un sol model generalista mitjançant la diversitat cognitiva i el debat estructurat, validat amb el benchmark MedQA.
Assoliments Clau:
- Fine-tuning de múltiples models experts (LoRA)
- Orquestració d'agents amb LangGraph
- Millora significativa en el benchmark MedQA (+15%)
- Interfície interactiva completa amb modes de Batalla i Consulta
- Sistema de rànquing Elo per avaluar el rendiment relatiu dels agents
🛠️ Stack Tecnològic
📊 Resultats i Mètriques
🏗️ Arquitectura del Sistema
El sistema utilitza una arquitectura en estrella on un 'Agent Supervisor' rep la consulta i selecciona dinàmicament quins 'Agents Experts' són més rellevants. Aquests experts, entrenats específicament en subdominis mèdics (Cirurgia, Farmacologia, etc.) generen respostes que són posteriorment sintetitzades i criticades. Aquest cicle de generació-crítica-refinament permet reduir al·lucinacions, augmentar la precisió global i millorar la completesa de la resposta mèdica.
🧩 Reptes i Solucions
-
Repte: Disponibilitat de DadesAccedir a corpus mèdics de qualitat per a l'entrenament dels experts.✅ Solució: Utilització de llibres de text mèdics i datasets acadèmics filtrats per especialitat.
-
Repte: Coordinació d'AgentsEvitar que els agents es contradiguin o generin soroll en el debat.✅ Solució: Implementació d'un flux LangGraph estricte amb un supervisor que pondera les opinions segons la confiança.
-
Repte: Dependència d'APIEls models base van ser discontinuats durant el desenvolupament.✅ Solució: Adaptació ràpida de l'arquitectura i documentació exhaustiva dels resultats previs.
🎓 Aprenentatges i Conclusions
Aquest projecte ha demostrat el poder de l'especialització en IA. Un conjunt de models petits però experts sovint supera un sol model gegant en tasques de nínxol. També ha posat de manifest la fragilitat de construir sobre APIs experimentals, reforçant la importància de tenir backups locals o codi agnòstic del model.