AgentClaw ist ein lokales Multi-Agent-KI-System für macOS. Mehrere Personas leben nebeneinander, delegieren Tasks, schreiben sich gegenseitig per @Mention, vernetzen sich peer-to-peer mit anderen Instanzen und erledigen im Hintergrund ihre Heartbeats, während ich schlafe. Kein Cloud-Zwang, kein Vendor-Lock-in — Ollama lokal, OpenRouter für die schweren Modelle, ComfyUI auf einer eigenen GPU-Box im LAN, Qdrant für Vektoren, Whisper.cpp für Speech-to-Text. Alles auf meinem Mac auf Port 5050.
Nach der letzten größeren Refactor-Session (NiceGUI 3.10 + Python 3.14, FastAPI, SQLite/SQLModel) zählt der Stack 21 FastAPI-Router, 13 UI-Seiten, 23 Skills, 8+ Background-Services und über zehn externe Integrationen. Zeit für eine saubere Übersicht.
Chat & Multi-Agent
- Chat-Interface — Live-Messaging mit Agent-Auswahl, Multipart-Upload, Audio-I/O
- Multi-Agent-Chat — Parallele Konversationen mit verschiedenen Personas
- A2A-Delegation — Task-Dispatch zwischen Agenten via
@Mentions - M2M-Netzwerk (MARTIN) — Peer-to-Peer-Vernetzung, Remote-Dispatch, Callbacks
- Broadcast-Modus — eine Nachricht an mehrere Agenten
- Chat-Context — dynamische Kontext-Injection (History, Memory, Wiki, Codebase)
Voice & Audio
- TTS — Mistral Voxtral + Google, Streaming mit Satzsegmentierung
- Voice-Input — Web Speech API, hands-free
- Audio-Transkription — Whisper.cpp / Ollama / Mistral
- LTX 2.3 Batch-Video — WAV + Startbild → Segmente → Prompts via
gemma4:e4b→ ComfyUI-Render → automatischer ffmpeg-Concat. Last-Frame-Chain zwischen Segmenten, pro Segment wahlweise Last-Frame / Start-Bild / eigenes Referenzbild
23 Skills
URL-Fetcher · Screenshot-Tool · Image-Gen (Flux/SDXL) · Image-Edit (Inpaint/Outpaint) · Chrome-Browser-Steuerung · Wikipedia · Wiki-Context · Web-Suche (SearXNG/DDG) · YouTube · Gmail · LinkedIn · Telegram · WhatsApp · Coding-Skill · Transcription · Prompt-Optimizer (RTF/TAG/BAB/CARE/RISE) · File-Management · Hacker News · Tagesschau RSS · Talking-Video · Mac Mail · Video-Gen · TTS
Autonomie & Scheduling
- Heartbeat — periodische Tasks von Minuten bis Tagen
- Dream-Cycle — nächtliche Memory-Konsolidierung
- Watchdog — URL-Change-Detection mit Triggern
- Scheduler — zentrale asyncio-Loop für alle Hintergrundjobs
Memory & Vektor
- Langzeit-Memory — Qdrant-Vektor-DB mit Semantic-Recall
- Document-Memory — PDFs/Bilder als Vektor (Google Embeddings)
- Chat-History — SQLite pro Agent
- Embeddings — Google Gemini oder lokale Ollama-Embeddings
21 FastAPI-Router
Agents-CRUD · Chat (SSE-Streaming) · Tasks (A2A Dispatch/Chain/Status/Cancel) · Memory (Recall/Cleanup/Docs) · Activity · Watchdogs · Skills · Providers · Backup/Restore · Voice · Content (Screenshots/News) · Tools (Discovery) · M2M (Nodes/Sync/Dispatch) · ComfyUI · Chrome-WS · Stats/Debug · Themes · Inbox · LTX-Batch · Transkription · Health.
UI-Seiten (NiceGUI)
Home-Dashboard · Chat · Tasks · Broadcast · Skills · Memory-Explorer · Insights · Watchdogs · Netzwerk/M2M · Backup · Agent-Editor · Settings · LTX-Batch.
Background-Services
Agent-, Chat-, Task-, Heartbeat-, Event-, Watchdog-, M2M- und WhatsApp-Watcher-Service, alles gebündelt im ServiceContainer (Dependency Injection).
Core-Engine
- LLM-Interface (Ollama / OpenRouter / Mistral, Streaming + Retry + Fallback auf
gemma4:e4b) - A2A-Protokoll (XML-Tasklists)
- FastPath-Dispatch (deterministisch, ohne LLM)
- Deterministic Router
- Thread-safe State
- Skills-Registry
- Model-Capabilities-Detection (Vision, Tools, Thinking)
- Operator-Kontext
- Strukturiertes Logging
Storage
SQLite mit SQLModel, JSON-Migration aus v1, getrennte Layer für Agent / History / Provider / Node / Watchdog.
Integrationen
Ollama · OpenRouter (100+ Modelle) · Mistral · Google (Embeddings/TTS) · ComfyUI (Workflows) · Qdrant · Redis · Telegram · SearXNG · Playwright · YouTube Data API · Tagesschau · WhatsApp (WACLI-Bridge).
Tools & Utilities
Backup/Restore mit Versioning · Theme-System (Matrix Dark u.a.) · macOS App-Icon-Generator · Pydantic-Config · strukturiertes Logging.
Summary: 21 Router · 13 UI-Seiten · 8+ Services · 23 Skills · 20+ Core-Module · 10+ externe Integrationen — grob 100+ Features. Alles lokal-first, alles auf meinem Mac.

