AgentClaw — lokales Multi-Agent-KI-System

AgentClaw

AgentClaw ist ein lokales Multi-Agent-KI-System für macOS. Mehrere Personas leben nebeneinander, delegieren Tasks, schreiben sich gegenseitig per @Mention, vernetzen sich peer-to-peer mit anderen Instanzen und erledigen im Hintergrund ihre Heartbeats, während ich schlafe. Kein Cloud-Zwang, kein Vendor-Lock-in — Ollama lokal, OpenRouter für die schweren Modelle, ComfyUI auf einer eigenen GPU-Box im LAN, Qdrant für Vektoren, Whisper.cpp für Speech-to-Text. Alles auf meinem Mac auf Port 5050.

Nach der letzten größeren Refactor-Session (NiceGUI 3.10 + Python 3.14, FastAPI, SQLite/SQLModel) zählt der Stack 21 FastAPI-Router, 13 UI-Seiten, 23 Skills, 8+ Background-Services und über zehn externe Integrationen. Zeit für eine saubere Übersicht.

Chat & Multi-Agent

  • Chat-Interface — Live-Messaging mit Agent-Auswahl, Multipart-Upload, Audio-I/O
  • Multi-Agent-Chat — Parallele Konversationen mit verschiedenen Personas
  • A2A-Delegation — Task-Dispatch zwischen Agenten via @Mentions
  • M2M-Netzwerk (MARTIN) — Peer-to-Peer-Vernetzung, Remote-Dispatch, Callbacks
  • Broadcast-Modus — eine Nachricht an mehrere Agenten
  • Chat-Context — dynamische Kontext-Injection (History, Memory, Wiki, Codebase)

Voice & Audio

  • TTS — Mistral Voxtral + Google, Streaming mit Satzsegmentierung
  • Voice-Input — Web Speech API, hands-free
  • Audio-Transkription — Whisper.cpp / Ollama / Mistral
  • LTX 2.3 Batch-Video — WAV + Startbild → Segmente → Prompts via gemma4:e4b → ComfyUI-Render → automatischer ffmpeg-Concat. Last-Frame-Chain zwischen Segmenten, pro Segment wahlweise Last-Frame / Start-Bild / eigenes Referenzbild

23 Skills

URL-Fetcher · Screenshot-Tool · Image-Gen (Flux/SDXL) · Image-Edit (Inpaint/Outpaint) · Chrome-Browser-Steuerung · Wikipedia · Wiki-Context · Web-Suche (SearXNG/DDG) · YouTube · Gmail · LinkedIn · Telegram · WhatsApp · Coding-Skill · Transcription · Prompt-Optimizer (RTF/TAG/BAB/CARE/RISE) · File-Management · Hacker News · Tagesschau RSS · Talking-Video · Mac Mail · Video-Gen · TTS

Autonomie & Scheduling

  • Heartbeat — periodische Tasks von Minuten bis Tagen
  • Dream-Cycle — nächtliche Memory-Konsolidierung
  • Watchdog — URL-Change-Detection mit Triggern
  • Scheduler — zentrale asyncio-Loop für alle Hintergrundjobs

Memory & Vektor

  • Langzeit-Memory — Qdrant-Vektor-DB mit Semantic-Recall
  • Document-Memory — PDFs/Bilder als Vektor (Google Embeddings)
  • Chat-History — SQLite pro Agent
  • Embeddings — Google Gemini oder lokale Ollama-Embeddings

21 FastAPI-Router

Agents-CRUD · Chat (SSE-Streaming) · Tasks (A2A Dispatch/Chain/Status/Cancel) · Memory (Recall/Cleanup/Docs) · Activity · Watchdogs · Skills · Providers · Backup/Restore · Voice · Content (Screenshots/News) · Tools (Discovery) · M2M (Nodes/Sync/Dispatch) · ComfyUI · Chrome-WS · Stats/Debug · Themes · Inbox · LTX-Batch · Transkription · Health.

UI-Seiten (NiceGUI)

Home-Dashboard · Chat · Tasks · Broadcast · Skills · Memory-Explorer · Insights · Watchdogs · Netzwerk/M2M · Backup · Agent-Editor · Settings · LTX-Batch.

Background-Services

Agent-, Chat-, Task-, Heartbeat-, Event-, Watchdog-, M2M- und WhatsApp-Watcher-Service, alles gebündelt im ServiceContainer (Dependency Injection).

Core-Engine

  • LLM-Interface (Ollama / OpenRouter / Mistral, Streaming + Retry + Fallback auf gemma4:e4b)
  • A2A-Protokoll (XML-Tasklists)
  • FastPath-Dispatch (deterministisch, ohne LLM)
  • Deterministic Router
  • Thread-safe State
  • Skills-Registry
  • Model-Capabilities-Detection (Vision, Tools, Thinking)
  • Operator-Kontext
  • Strukturiertes Logging

Storage

SQLite mit SQLModel, JSON-Migration aus v1, getrennte Layer für Agent / History / Provider / Node / Watchdog.

Integrationen

Ollama · OpenRouter (100+ Modelle) · Mistral · Google (Embeddings/TTS) · ComfyUI (Workflows) · Qdrant · Redis · Telegram · SearXNG · Playwright · YouTube Data API · Tagesschau · WhatsApp (WACLI-Bridge).

Tools & Utilities

Backup/Restore mit Versioning · Theme-System (Matrix Dark u.a.) · macOS App-Icon-Generator · Pydantic-Config · strukturiertes Logging.


Summary: 21 Router · 13 UI-Seiten · 8+ Services · 23 Skills · 20+ Core-Module · 10+ externe Integrationen — grob 100+ Features. Alles lokal-first, alles auf meinem Mac.