209 lines
8.0 KiB
Markdown
209 lines
8.0 KiB
Markdown
# TODO — Système multi-agents (Nexus + agents spécialisés)
|
|
|
|
## Légende
|
|
- [x] Implémenté
|
|
- [ ] À faire
|
|
- [~] Partiel / à améliorer
|
|
|
|
---
|
|
|
|
## 1. Infrastructure de base
|
|
|
|
| Item | État |
|
|
|------|------|
|
|
| `agents_core` — librairie partagée (pip install -e) | [x] |
|
|
| `BaseAgent` — classe abstraite commune à tous les agents | [x] |
|
|
| Système de skills (plugins `.py` auto-découverts) | [x] |
|
|
| File d'attente SQLite FIFO par agent (`task_queue.py`) | [x] |
|
|
| Mode pause / resume par agent (`/pause`, `/resume`) | [x] |
|
|
| Plages horaires par agent (`work_hours` dans config.json) | [x] |
|
|
| Broker MQTT local (Mosquitto) | [x] |
|
|
| Topics MQTT structurés : inbox, status, capabilities, broadcast | [x] |
|
|
| LWT (Last Will Testament) MQTT → statut offline automatique | [x] |
|
|
| Reconnexion automatique MQTT | [x] |
|
|
| Reconnexion automatique XMPP (backoff exponentiel) | [x] |
|
|
| Dispatch XMPP handler en thread (évite blocage asyncio) | [x] |
|
|
| Protection contre appels LLM concurrents (`_llm_lock`) | [x] |
|
|
| Switch LLM global via MQTT retained (`/llm local/cloud`) | [x] |
|
|
| Reset historique LLM automatique lors d'un switch | [x] |
|
|
|
|
---
|
|
|
|
## 2. Nexus — orchestrateur
|
|
|
|
| Item | État |
|
|
|------|------|
|
|
| Connexion XMPP + MUC | [x] |
|
|
| Multi-utilisateurs XMPP (`admin_jids`) | [x] |
|
|
| Commandes `/admins add/remove/list` | [x] |
|
|
| **Persistance des admins ajoutés à chaud** (réécriture config.json) | [ ] |
|
|
| Mode veille `/sleep` / `/wake` | [x] |
|
|
| Scheduler APScheduler (`/schedule`, `/schedules`, `/schedule cancel`) | [x] |
|
|
| Rapports quotidiens agrégés (`/report`) | [x] |
|
|
| Délégation directe `@agent message` | [x] |
|
|
| Broadcast `@all message` | [x] |
|
|
| Mise à jour agent `/update <agent>` (envoi MQTT) | [x] |
|
|
| Commandes `/llm`, `/llm local/cloud`, `/llm list`, `/llm set` | [x] |
|
|
| Réponses nexus dans le MUC quand commande vient du MUC | [x] |
|
|
| Routage LLM dynamique (capacités agents injectées automatiquement) | [x] |
|
|
| **Vérification `work_hours` avant délégation** (delegate skill) | [ ] |
|
|
| **Blackout global** (plage horaire où aucune tâche n'est envoyée) | [ ] |
|
|
| **Commandes `/claude` et `/mammouth`** (appels one-shot API externes) | [ ] |
|
|
| **Skill `notify`** — envoyer une notification proactive à l'utilisateur | [ ] |
|
|
| **Historique des conversations** (persistance SQLite, `/history`) | [ ] |
|
|
| **Confirmation avant exécution** pour les actions destructives | [ ] |
|
|
| Commande `/status` détaillée (uptime, nb tâches, LLM actif…) | [~] |
|
|
| Skill `web_search` (DuckDuckGo) | [x] |
|
|
| Skill `web_read` (BeautifulSoup) | [x] |
|
|
| Skill `memory` (clé/valeur SQLite) | [x] |
|
|
| Skill `delegate` | [x] |
|
|
| Skill `mqtt_send` | [x] |
|
|
|
|
---
|
|
|
|
## 3. agent_debian — administration système
|
|
|
|
| Item | État |
|
|
|------|------|
|
|
| Skills : `sysinfo`, `apt`, `systemd`, `filesystem`, `network` | [x] |
|
|
| Skills : `process`, `journal`, `user`, `container`, `cron` | [x] |
|
|
| Skill `script` avec `$MQTT_REPLY_TOPIC` pour retour résultat | [x] |
|
|
| Skill `shell` (commandes arbitraires) | [x] |
|
|
| Monitoring proactif disque (>85%) → alerte MQTT | [x] |
|
|
| Monitoring proactif RAM (>90%) → alerte MQTT | [x] |
|
|
| **Seuils de monitoring configurables** dans config.json | [ ] |
|
|
| **Skill `backup`** — sauvegarde fichiers/bases vers destination | [ ] |
|
|
| **Skill `firewall`** — gestion ufw/iptables | [ ] |
|
|
| **Skill `logwatch`** — analyse automatique des logs suspects | [ ] |
|
|
| **Tests end-to-end des skills depuis Nexus** | [ ] |
|
|
|
|
---
|
|
|
|
## 4. agent_ansible — automatisation
|
|
|
|
| Item | État |
|
|
|------|------|
|
|
| Skill `playbook` | [x] |
|
|
| Skill `adhoc` (avec aliases : ping, facts, uptime…) | [x] |
|
|
| Skill `inventory` | [x] |
|
|
| Skill `galaxy` | [x] |
|
|
| Skill `vault` | [x] |
|
|
| `ansible.cfg` optimisé (pipelining, fact cache, 10 forks) | [x] |
|
|
| **Résultats long playbook** envoyés en streaming MQTT | [ ] |
|
|
| **Skill `template`** — générer des fichiers de config depuis Jinja2 | [ ] |
|
|
| **Venv + service systemd installés et testés** | [ ] |
|
|
|
|
---
|
|
|
|
## 5. agent_deploy — déploiement d'agents
|
|
|
|
| Item | État |
|
|
|------|------|
|
|
| Déploiement SSH (Paramiko) + local | [x] |
|
|
| Catalogue d'agents (nexus, debian, ansible, deploy) | [x] |
|
|
| Skill `deploy` avec progress MQTT temps réel | [x] |
|
|
| Skill `ssh` (commande distante + SCP) | [x] |
|
|
| Skill `catalog` (list/show/add/remove) | [x] |
|
|
| **Déployer agent_debian sur machine distante (test réel)** | [ ] |
|
|
| **Vérification post-déploiement** (agent en ligne sur MQTT ?) | [ ] |
|
|
| **Rollback automatique** si déploiement échoue | [ ] |
|
|
|
|
---
|
|
|
|
## 6. Mise à jour des agents (`/update`)
|
|
|
|
| Item | État |
|
|
|------|------|
|
|
| Nexus envoie `/update` via MQTT à l'agent cible | [x] |
|
|
| **BaseAgent gère `/update` : `git pull` + `systemctl restart`** | [ ] |
|
|
| Vérification si mise à jour disponible (`git fetch` + diff) | [ ] |
|
|
| Confirmation XMPP après redémarrage réussi | [ ] |
|
|
| `/update` sur Nexus lui-même (git pull + restart) | [ ] |
|
|
|
|
---
|
|
|
|
## 7. LLM — améliorations
|
|
|
|
| Item | État |
|
|
|------|------|
|
|
| Timeout LLM configurable (300s par défaut) | [x] |
|
|
| Switch global local/cloud via `/llm` | [x] |
|
|
| Profils `llm_profiles` par agent | [x] |
|
|
| **Commandes `/claude` et `/mammouth`** (one-shot API externes) | [ ] |
|
|
| **Support multi-backends** dans `llm_client.py` (Anthropic, OpenAI) | [ ] |
|
|
| **Timeout par étape** dans `_llm_loop` (pas seulement global) | [ ] |
|
|
| **Limiter `max_steps`** configurable selon l'agent | [ ] |
|
|
| **Streaming des réponses LLM** vers XMPP (réponse progressive) | [ ] |
|
|
|
|
---
|
|
|
|
## 8. Sécurité / chiffrement
|
|
|
|
| Item | État |
|
|
|------|------|
|
|
| Filtrage XMPP par `admin_jids` | [x] |
|
|
| OMEMO (stub présent, non fonctionnel) | [~] |
|
|
| **OMEMO réel** (slixmpp-omemo) | [ ] |
|
|
| **OpenPGP alternative** (si OMEMO trop complexe) | [ ] |
|
|
| Authentification MQTT (username/password) | [~] |
|
|
| TLS MQTT | [~] |
|
|
| **Rotation des mots de passe** XMPP via commande | [ ] |
|
|
| **Rate limiting** — limiter le nombre de requêtes par minute | [ ] |
|
|
|
|
---
|
|
|
|
## 9. Observabilité / monitoring
|
|
|
|
| Item | État |
|
|
|------|------|
|
|
| Logs systemd par agent | [x] |
|
|
| Statut online/offline temps réel (MQTT retained) | [x] |
|
|
| **Dashboard web simple** — statut de tous les agents en temps réel | [ ] |
|
|
| **Métriques** — nb tâches/jour, temps moyen, taux d'erreur | [ ] |
|
|
| **Alertes** — notifier si un agent est offline depuis X minutes (paramétrable, désactivable) | [ ] |
|
|
| **Agrégation des logs** vers un topic MQTT centralisé | [ ] |
|
|
|
|
---
|
|
|
|
## 10. Nouveaux agents (idées)
|
|
|
|
| Agent | Rôle | État |
|
|
|-------|------|------|
|
|
| `agent_claude` | LLM Anthropic — tâches complexes, raisonnement | [ ] |
|
|
| `agent_mammouth` | LLM Mammouth AI — alternative FR | [ ] |
|
|
| `agent_docker` | Gestion Docker avancée (compose, registry, build) | [ ] |
|
|
| `agent_git` | Gestion dépôts Git, PR, issues Gitea/GitHub | [ ] |
|
|
| `agent_monitor` | Supervision réseau (ping, ports, services) | [ ] |
|
|
| `agent_mail` | Envoi/lecture emails, notifications | [ ] |
|
|
| `agent_homeassistant` | Domotique via HA API | [ ] |
|
|
|
|
---
|
|
|
|
## 11. Script d'installation (`install.sh`)
|
|
|
|
| Item | État |
|
|
|------|------|
|
|
| Scan modèles Ollama disponibles + choix interactif | [x] |
|
|
| Multi-utilisateurs XMPP (collection `admin_jids`) | [x] |
|
|
| Choix domaine XMPP | [x] |
|
|
| Sélection des agents à installer | [x] |
|
|
| Génération `config.json` + service systemd | [x] |
|
|
| Mode `--update` et `--uninstall` | [x] |
|
|
| **Test complet end-to-end de install.sh** | [ ] |
|
|
| **Documenter les prérequis (compte XMPP, Ollama…)** | [ ] |
|
|
| **Ajout `llm_profiles` automatique dans install.sh** | [ ] |
|
|
|
|
---
|
|
|
|
## 12. Ordre de priorité suggéré
|
|
|
|
1. **Implémenter `/update` dans BaseAgent** — git pull + restart (fonctionnalité clé)
|
|
2. **Persistance `/admins add`** — réécriture config.json
|
|
3. **Vérification `work_hours` dans delegate.py**
|
|
4. **Seuils monitoring configurables** dans agent_debian
|
|
5. **Test install.sh complet** sur machine vierge
|
|
6. **Commandes `/claude` et `/mammouth`** (quand clés API dispo)
|
|
7. **Support multi-backends LLM** dans llm_client.py
|
|
8. **Dashboard web** statut agents
|
|
9. **OMEMO** chiffrement XMPP
|