Ollama LaunchCline: lokaler KI-Agent für Cloud-freies Programmieren

Aktualisiert:
Ollama LaunchCline: lokaler KI-Agent für Cloud-freies Programmieren

TL;DR

  • Ollama hat den Befehl ollama launch angekündigt – Starten von KI-Agenten mit einer Zeile im Terminal (offizielle Ankündigung)
  • Der erste unterstützte Agent ist Cline: liest Dateien, führt Befehle im Terminal aus, führt Git-Operationen autonom durch
  • Unterstützt lokale Modelle (qwen3.6, gemma4) und Cloud-Modelle (kimi-k2.6:cloud, minimax-m3:cloud, glm-5.1:cloud)
  • Der Kanban Board-Modus startet mehrere Agenten parallel über eine Weboberfläche
  • Auf einem MacBook M1 mit 16 GB RAM sind Cloud-Modelle über Ollama die komfortabelste Option

🚀 Was hat das Ollama-Team angekündigt

Das Ollama-Team hat den neuen Befehl ollama launch hinzugefügt, der es ermöglicht, KI-Agenten direkt aus dem Terminal zu starten – ohne manuelle Konfiguration, ohne separate Konfigurationsdateien und ohne die Notwendigkeit, die Dokumentation des Agenten zu suchen.

Der erste offiziell unterstützte Agent ist Cline, ein Open-Source-Tool für autonomes Programmieren. Ein Befehl im Terminal – und der Agent ist installiert, das Modell ausgewählt, die Arbeit begonnen.

ollama launch ist nicht nur ein Shortcut. Es ist ein einziger Einstiegspunkt für den Start von Agenten mit lokalen oder Cloud-Modellen, ohne den Code oder die Provider-Einstellungen ändern zu müssen.

Zusammen mit der Unterstützung für Cline hat Ollama den Zugriff auf Cloud-Modelle über dieselbe Schnittstelle angekündigt: kimi-k2.6:cloud, minimax-m3:cloud, glm-5.1:cloud. Das bedeutet, ein einziges Werkzeug – sowohl lokale Privatsphäre als auch Cloud-Leistung, je nach Aufgabe.

🤖 Was ist Cline und wie unterscheidet es sich von KI-Chats

Cline ist ein Open-Source-KI-Agent für die Programmierung. Er beantwortet nicht nur Fragen wie ChatGPT oder ein normaler Chat in der IDE. Cline agiert autonom: Er liest die Dateien Ihres Projekts, nimmt Änderungen vor, führt Befehle im Terminal aus und wartet vor jedem Schritt auf Ihre Bestätigung.

Hauptunterschiede zu einem normalen KI-Chat:

Möglichkeit KI-Chat (ChatGPT, Claude.ai) Cline (Agent)
Lesen von Projektdateien ❌ Muss manuell kopiert werden ✅ Liest selbstständig
Code-Bearbeitung ❌ Nur Vorschläge im Chat ✅ Nimmt Änderungen direkt vor
Befehlsausführung ❌ Zeigt Befehle als Text an ✅ Führt Maven, npm, Docker aus
Git-Operationen
Vorschau von Änderungen vor Anwendung ✅ Zeigt Diff an
Parallele Aufgaben ✅ Kanban Board

🔒 Warum einen Agenten lokal ausführen

Die meisten KI-Tools für die Programmierung – Cursor, GitHub Copilot, Claude Code – senden Ihren Code an externe Server. Für kommerzielle Projekte, NDAs und Unternehmens-Repositories kann dies ein Problem darstellen.

Die Ausführung von Cline über Ollama mit einem lokalen Modell löst dies:

  • Code verlässt die Maschine nicht – keine Anfragen an OpenAI, Anthropic oder andere Anbieter
  • Keine Abonnements oder Tokens – das lokale Modell wird kostenlos ausgeführt
  • Offline-Modus – funktioniert ohne Internet
  • Volle Kontrolle – Sie wählen das Modell, nicht der Anbieter

Aus meiner Erfahrung ist für ein MacBook M1 mit 16 GB RAM der Start mit Cloud-Modellen am bequemsten. Ich habe Cline über kimi-k2.6:cloud getestet – der Agent funktionierte schnell, ohne dass ich lokale Modelle mit zig Gigabyte herunterladen musste. Wenn Ihnen jedoch die Vertraulichkeit und die lokale Codeverarbeitung wichtig sind, ermöglicht Ollama jederzeit den Wechsel zu einem lokalen Modell, ohne das Werkzeug selbst zu ändern.

Ollama LaunchCline: lokaler KI-Agent für Cloud-freies Programmieren

⚙️ Wie das ollama launch cline-Team funktioniert

Grundlegender Befehl

Das Starten des Agenten ist ein einziger Befehl im Terminal:

ollama launch cline

Was unter der Haube passiert:

  1. Ollama prüft, ob Node.js ≥ 22 vorhanden ist
  2. Wenn Cline noch nicht installiert ist, wird angeboten, es über npm zu installieren
  3. Zeigt eine Liste der verfügbaren Modelle zur Auswahl an
  4. Startet den Agenten

Starten mit einem lokalen Modell

Um ein Modell sofort ohne interaktive Auswahl anzugeben:

ollama launch cline --model qwen3.6

Verfügbare lokale Modelle (aktuelle Liste zum Zeitpunkt der Veröffentlichung):

  • qwen3.6 — leistungsstark, aber RAM-intensiv
  • gemma4 — Kompromiss zwischen Qualität und Geschwindigkeit

Cloud-Modelle über Ollama

Ollama hat die Unterstützung für Cloud-Modelle mit dem Suffix :cloud hinzugefügt. Sie werden mit demselben Befehl gestartet, aber die Berechnungen erfolgen auf der Seite des Anbieters:

ollama launch cline --model kimi-k2.6:cloud

Verfügbare Cloud-Modelle:

Modell Anbieter Besonderheit
kimi-k2.6:cloud Moonshot AI Stark in Code, großer Kontext
minimax-m3:cloud MiniMax Schnell, gut für allgemeine Aufgaben
glm-5.1:cloud Zhipu AI Alternative Option

📋 Welche Aufgaben erfüllt Cline

Analyse eines Repositories

Cline kann ein ganzes Projekt analysieren und seine Architektur erklären. Schreiben Sie einfach:

Analyze this repository and explain its architecture

Der Agent durchläuft selbstständig die Verzeichnisstruktur, liest wichtige Dateien und gibt eine detaillierte Beschreibung zurück.

Refactoring und Code-Verbesserung

Cline findet Duplikate, schlägt Verbesserungen vor und nimmt sofort Änderungen an den Dateien vor:

Find duplicated code
Suggest performance improvements

Schreiben von Tests

Der Agent liest bestehende Klassen und generiert Unit-Tests unter Berücksichtigung des Projektkontexts — Framework, Namenskonventionen, Paketstruktur.

Fehlerbehebung

Sie können einen Stacktrace oder eine Fehlerbeschreibung übermitteln — Cline findet die entsprechende Datei, schlägt eine Korrektur vor und zeigt den Diff vor der Anwendung an.

Bearbeiten von Dateien und Anzeigen von Diff-Änderungen

Vor jeder Dateibearbeitung zeigt Cline einen Diff an: was war, was wird sein. Sie bestätigen oder lehnen jeden Schritt ab. Der Agent wendet keine Änderungen ohne Ihre Erlaubnis an.

Automatisches Ausführen von Befehlen im Terminal

Cline kann Build-, Test- und Deploy-Befehle direkt ausführen:

  • mvn clean install — Maven
  • ./gradlew build — Gradle
  • npm run test — Node.js
  • docker build — Docker

Wichtig: Cline fragt vor der Ausführung jedes Befehls im Terminal um Erlaubnis. Die Autonomie des Agenten bedeutet nicht das Fehlen von Kontrolle.

🗂️ Parallel Tasks und Kanban Board

Persönlich hat mir der Kanban Board-Modus am besten gefallen. Nach dem Start öffnet er eine lokale Weboberfläche, auf der Sie einzelne Aufgaben erstellen und mehrere Cline-Agenten parallel ausführen können. Das ähnelt bereits eher einem System zur Verwaltung eines Teams von KI-Entwicklern als einem gewöhnlichen KI-Chat.

ollama launchcline -- kanban

Nach dem Start öffnet sich eine Weboberfläche mit einem Kanban-Board. Jede Karte ist ein separater Agent mit seiner eigenen Aufgabe. Zum Beispiel:

  • Agent 1 — schreibt Tests für das Autorisierungsmodul
  • Agent 2 — refaktoriert die Service-Schicht
  • Agent 3 — aktualisiert die Dokumentation

Jeder Agent arbeitet isoliert, der Fortschritt wird in Echtzeit im Browser angezeigt.

Kanban Board ist ein Umbruch im Entwicklungsansatz: nicht „eine Anfrage — eine Antwort“, sondern „mehrere Agenten — parallele Arbeit am Projekt“.

💾 MacBook M1 mit 16 GB: persönliche Erfahrung

Ich habe Ollama Launch Cline auf einem MacBook Pro M1 mit 16 GB RAM im Rahmen der Entwicklung von AskYourDocs getestet — einer eigenen B2B-SaaS-Lösung für die unternehmensinterne Dokumentensuche.

Kurz zu den Ergebnissen:

Modell Komfort auf M1 16 GB Empfehlung
qwen3.6 ⚠️ Schwer, Speicher am Limit Vorsichtig
gemma4 🟡 Akzeptabel Zulässig
kimi-k2.6:cloud ✅ Komfortabel Optimal
minimax-m3:cloud ✅ Komfortabel Optimal

In der Praxis erwiesen sich Cloud-Modelle über Ollama für die tägliche Arbeit mit einem echten Java-Repository (Spring Boot, ~40 Klassen) als viel bequemer: keine Verzögerungen beim Laden, der Agent reagiert schnell, der Speicher des Computers überhitzt nicht.

Der lokale Modus ist sinnvoll, wenn der Code vertraulich ist und die Maschine nicht verlassen darf. In anderen Fällen ist kimi-k2.6:cloud meine aktuelle Standardwahl.

⚖️ Cline vs Cursor

Ich habe Cursor einige Monate lang benutzt, bevor ich Cline über Ollama ausprobiert habe. Cursor ist ein benutzerfreundliches Werkzeug mit einer niedrigen Einstiegshürde: herunterladen, Projekt öffnen und die KI hilft bereits. Aber bei der Arbeit an AskYourDocs begann mich eine Sache zu beunruhigen: Ein Spring Boot-Projekt mit benutzerdefinierter RAG-Logik und Konfigurationen ist kein Code, den man gerne an externe Server sendet. Cline mit einem lokalen Modell löst dieses Problem vollständig.

Cursor punktet bei der Einfachheit des Starts. Cline punktet dort, wo der Schutz des Codes und die Flexibilität bei der Modellauswahl wichtig sind.

Parameter Cline (über Ollama) Cursor
Typ Agent im Terminal / Web-UI Eigenständige IDE (Fork von VS Code)
Preis Kostenlos (Open-Source) Kostenloser Plan / $20/Monat Pro
Lokale Modelle ✅ Vollständige Unterstützung über Ollama ❌ Eingeschränkt
LLM-Anbieter Beliebig (Ollama, OpenRouter) Integrierte Cursor-Modelle
Dateizugriff
Befehlsausführung
Kanban / Parallele Agenten
Datenschutz ✅ 100% lokal (mit lokalem Modell) ❌ Code wird in die Cloud gesendet
Einstiegshürde Mittel (Node.js, npm) Niedrig (einfach IDE herunterladen)

⚖️ Cline vs Claude Code

Parameter Cline (über Ollama) Claude Code
Entwickler Open-Source-Community Anthropic
Schnittstelle Terminal + Web Kanban UI CLI (Terminal)
LLM-Unterstützung Multi-Anbieter Nur Anthropic API
Lokale Modelle
Preis Kostenlos (mit lokalem Modell) Bezahlung nach Anthropic-Token
Parallele Aufgaben ✅ Kanban Board
Einrichtungskomplexität Mittel Niedrig
Agentenqualität Abhängig vom Modell Konstant hoch (Claude Sonnet)

Claude Code punktet bei der Antwortqualität dank Claude Sonnet unter der Haube. Cline über Ollama punktet bei Flexibilität, Preis und Datenschutz.

👥 Wer sollte Ollama Launch Cline ausprobieren

Unbedingt, wenn Sie:

  • Java- oder Python-Entwickler sind, der routinemäßiges Refactoring automatisieren möchte
  • Mit vertraulichem Code arbeiten und keine Cloud-Tools verwenden können
  • Einen KI-Agenten ohne Abonnement und Token-Kosten ausprobieren möchten
  • DevOps-Ingenieur sind, der einen Agenten zur Automatisierung von Build- und Deployment-Befehlen benötigt
  • Node.js-Entwickler sind – Cline ist auf Node.js aufgebaut, die Unterstützung des Ökosystems ist ausgezeichnet

Warten Sie vorerst, wenn Sie:

  • Ein Anfänger sind, der eine einfache Benutzeroberfläche ohne Konfiguration benötigt – Cursor ist benutzerfreundlicher
  • Maximale Agentenqualität ohne Kompromisse wünschen – Claude Code auf claude.ai ist stabiler
  • Ein MacBook M1 mit 8 GB RAM haben – lokale Modelle werden schwer sein, nur der Cloud-Modus bleibt übrig

Eine detaillierte Schritt-für-Schritt-Installationsanleitung, typische Fehler und deren Behebung finden Sie im nächsten Artikel.

❓ FAQ

Kann Cline ohne Internet verwendet werden?

Ja, wenn es mit einem lokalen Modell gestartet wird (qwen3.6, gemma4). Bei der Auswahl von Cloud-Modellen mit dem Suffix :cloud ist Internet erforderlich.

Welche Modelle unterstützt Ollama Launch?

Zum Zeitpunkt der Veröffentlichung sind die lokalen Modelle qwen3.6, gemma4 und die Cloud-Modelle kimi-k2.6:cloud, minimax-m3:cloud, glm-5.1:cloud verfügbar. Die Liste wird mit Ollama-Updates erweitert.

Ist der Zugriff des Agenten auf das Repository sicher?

Cline fordert vor jeder Dateänderung und jeder Befehlsausführung im Terminal eine Bestätigung an. Der Agent handelt nicht ohne Ihre Erlaubnis. Bei Verwendung eines lokalen Modells wird der Code nicht nach außen gesendet.

Wie unterscheidet sich Cline von GitHub Copilot?

GitHub Copilot ist eine Code-Vervollständigung innerhalb der IDE. Cline ist ein vollwertiger Agent: Er liest das gesamte Repository, nimmt Änderungen vor, führt Befehle aus und erledigt Aufgaben autonom. Das Autonomie-Niveau ist grundlegend anders.

Wird VS Code für die Arbeit mit Cline über Ollama benötigt?

Nein. Über ollama launch cline wird der Agent als eigenständiges Werkzeug im Terminal mit einer Web-Oberfläche gestartet. VS Code wird nicht benötigt – obwohl Cline auch als VS Code-Erweiterung existiert, wenn Sie direkt im Editor arbeiten möchten.

Quellen