⚡ TL;DR

Ollama hat den Befehl ollama launch angekündigt – Starten von KI-Agenten mit einer Zeile im Terminal (offizielle Ankündigung)
Der erste unterstützte Agent ist Cline: liest Dateien, führt Befehle im Terminal aus, führt Git-Operationen autonom durch
Unterstützt lokale Modelle (qwen3.6, gemma4) und Cloud-Modelle (kimi-k2.6:cloud, minimax-m3:cloud, glm-5.1:cloud)
Der Kanban Board-Modus startet mehrere Agenten parallel über eine Weboberfläche
Auf einem MacBook M1 mit 16 GB RAM sind Cloud-Modelle über Ollama die komfortabelste Option

🚀 Was hat das Ollama-Team angekündigt

Das Ollama-Team hat den neuen Befehl ollama launch hinzugefügt, der es ermöglicht, KI-Agenten direkt aus dem Terminal zu starten – ohne manuelle Konfiguration, ohne separate Konfigurationsdateien und ohne die Notwendigkeit, die Dokumentation des Agenten zu suchen.

Der erste offiziell unterstützte Agent ist Cline, ein Open-Source-Tool für autonomes Programmieren. Ein Befehl im Terminal – und der Agent ist installiert, das Modell ausgewählt, die Arbeit begonnen.

ollama launch ist nicht nur ein Shortcut. Es ist ein einziger Einstiegspunkt für den Start von Agenten mit lokalen oder Cloud-Modellen, ohne den Code oder die Provider-Einstellungen ändern zu müssen.

Zusammen mit der Unterstützung für Cline hat Ollama den Zugriff auf Cloud-Modelle über dieselbe Schnittstelle angekündigt: kimi-k2.6:cloud, minimax-m3:cloud, glm-5.1:cloud. Das bedeutet, ein einziges Werkzeug – sowohl lokale Privatsphäre als auch Cloud-Leistung, je nach Aufgabe.

🤖 Was ist Cline und wie unterscheidet es sich von KI-Chats

Cline ist ein Open-Source-KI-Agent für die Programmierung. Er beantwortet nicht nur Fragen wie ChatGPT oder ein normaler Chat in der IDE. Cline agiert autonom: Er liest die Dateien Ihres Projekts, nimmt Änderungen vor, führt Befehle im Terminal aus und wartet vor jedem Schritt auf Ihre Bestätigung.

Hauptunterschiede zu einem normalen KI-Chat:

Möglichkeit	KI-Chat (ChatGPT, Claude.ai)	Cline (Agent)
Lesen von Projektdateien	❌ Muss manuell kopiert werden	✅ Liest selbstständig
Code-Bearbeitung	❌ Nur Vorschläge im Chat	✅ Nimmt Änderungen direkt vor
Befehlsausführung	❌ Zeigt Befehle als Text an	✅ Führt Maven, npm, Docker aus
Git-Operationen	❌	✅
Vorschau von Änderungen vor Anwendung	❌	✅ Zeigt Diff an
Parallele Aufgaben	❌	✅ Kanban Board

🔒 Warum einen Agenten lokal ausführen

Die meisten KI-Tools für die Programmierung – Cursor, GitHub Copilot, Claude Code – senden Ihren Code an externe Server. Für kommerzielle Projekte, NDAs und Unternehmens-Repositories kann dies ein Problem darstellen.

Die Ausführung von Cline über Ollama mit einem lokalen Modell löst dies:

Code verlässt die Maschine nicht – keine Anfragen an OpenAI, Anthropic oder andere Anbieter
Keine Abonnements oder Tokens – das lokale Modell wird kostenlos ausgeführt
Offline-Modus – funktioniert ohne Internet
Volle Kontrolle – Sie wählen das Modell, nicht der Anbieter

Aus meiner Erfahrung ist für ein MacBook M1 mit 16 GB RAM der Start mit Cloud-Modellen am bequemsten. Ich habe Cline über kimi-k2.6:cloud getestet – der Agent funktionierte schnell, ohne dass ich lokale Modelle mit zig Gigabyte herunterladen musste. Wenn Ihnen jedoch die Vertraulichkeit und die lokale Codeverarbeitung wichtig sind, ermöglicht Ollama jederzeit den Wechsel zu einem lokalen Modell, ohne das Werkzeug selbst zu ändern.

⚙️ Wie das ollama launch cline-Team funktioniert

Grundlegender Befehl

Das Starten des Agenten ist ein einziger Befehl im Terminal:

ollama launch cline

Was unter der Haube passiert:

Ollama prüft, ob Node.js ≥ 22 vorhanden ist
Wenn Cline noch nicht installiert ist, wird angeboten, es über npm zu installieren
Zeigt eine Liste der verfügbaren Modelle zur Auswahl an
Startet den Agenten

Starten mit einem lokalen Modell

Um ein Modell sofort ohne interaktive Auswahl anzugeben:

ollama launch cline --model qwen3.6

Verfügbare lokale Modelle (aktuelle Liste zum Zeitpunkt der Veröffentlichung):

qwen3.6 — leistungsstark, aber RAM-intensiv
gemma4 — Kompromiss zwischen Qualität und Geschwindigkeit

Cloud-Modelle über Ollama

Ollama hat die Unterstützung für Cloud-Modelle mit dem Suffix :cloud hinzugefügt. Sie werden mit demselben Befehl gestartet, aber die Berechnungen erfolgen auf der Seite des Anbieters:

ollama launch cline --model kimi-k2.6:cloud

Verfügbare Cloud-Modelle:

Modell	Anbieter	Besonderheit
`kimi-k2.6:cloud`	Moonshot AI	Stark in Code, großer Kontext
`minimax-m3:cloud`	MiniMax	Schnell, gut für allgemeine Aufgaben
`glm-5.1:cloud`	Zhipu AI	Alternative Option

📋 Welche Aufgaben erfüllt Cline

Analyse eines Repositories

Cline kann ein ganzes Projekt analysieren und seine Architektur erklären. Schreiben Sie einfach:

Analyze this repository and explain its architecture

Der Agent durchläuft selbstständig die Verzeichnisstruktur, liest wichtige Dateien und gibt eine detaillierte Beschreibung zurück.

Refactoring und Code-Verbesserung

Cline findet Duplikate, schlägt Verbesserungen vor und nimmt sofort Änderungen an den Dateien vor:

Find duplicated code
Suggest performance improvements

Schreiben von Tests

Der Agent liest bestehende Klassen und generiert Unit-Tests unter Berücksichtigung des Projektkontexts — Framework, Namenskonventionen, Paketstruktur.

Fehlerbehebung

Sie können einen Stacktrace oder eine Fehlerbeschreibung übermitteln — Cline findet die entsprechende Datei, schlägt eine Korrektur vor und zeigt den Diff vor der Anwendung an.

Bearbeiten von Dateien und Anzeigen von Diff-Änderungen

Vor jeder Dateibearbeitung zeigt Cline einen Diff an: was war, was wird sein. Sie bestätigen oder lehnen jeden Schritt ab. Der Agent wendet keine Änderungen ohne Ihre Erlaubnis an.

Automatisches Ausführen von Befehlen im Terminal

Cline kann Build-, Test- und Deploy-Befehle direkt ausführen:

mvn clean install — Maven
./gradlew build — Gradle
npm run test — Node.js
docker build — Docker

Wichtig: Cline fragt vor der Ausführung jedes Befehls im Terminal um Erlaubnis. Die Autonomie des Agenten bedeutet nicht das Fehlen von Kontrolle.

🗂️ Parallel Tasks und Kanban Board

Persönlich hat mir der Kanban Board-Modus am besten gefallen. Nach dem Start öffnet er eine lokale Weboberfläche, auf der Sie einzelne Aufgaben erstellen und mehrere Cline-Agenten parallel ausführen können. Das ähnelt bereits eher einem System zur Verwaltung eines Teams von KI-Entwicklern als einem gewöhnlichen KI-Chat.

ollama launchcline -- kanban

Nach dem Start öffnet sich eine Weboberfläche mit einem Kanban-Board. Jede Karte ist ein separater Agent mit seiner eigenen Aufgabe. Zum Beispiel:

Agent 1 — schreibt Tests für das Autorisierungsmodul
Agent 2 — refaktoriert die Service-Schicht
Agent 3 — aktualisiert die Dokumentation

Jeder Agent arbeitet isoliert, der Fortschritt wird in Echtzeit im Browser angezeigt.

Kanban Board ist ein Umbruch im Entwicklungsansatz: nicht „eine Anfrage — eine Antwort“, sondern „mehrere Agenten — parallele Arbeit am Projekt“.

💾 MacBook M1 mit 16 GB: persönliche Erfahrung

Ich habe Ollama Launch Cline auf einem MacBook Pro M1 mit 16 GB RAM im Rahmen der Entwicklung von AskYourDocs getestet — einer eigenen B2B-SaaS-Lösung für die unternehmensinterne Dokumentensuche.

Kurz zu den Ergebnissen:

Modell	Komfort auf M1 16 GB	Empfehlung
`qwen3.6`	⚠️ Schwer, Speicher am Limit	Vorsichtig
`gemma4`	🟡 Akzeptabel	Zulässig
`kimi-k2.6:cloud`	✅ Komfortabel	Optimal
`minimax-m3:cloud`	✅ Komfortabel	Optimal

In der Praxis erwiesen sich Cloud-Modelle über Ollama für die tägliche Arbeit mit einem echten Java-Repository (Spring Boot, ~40 Klassen) als viel bequemer: keine Verzögerungen beim Laden, der Agent reagiert schnell, der Speicher des Computers überhitzt nicht.

Der lokale Modus ist sinnvoll, wenn der Code vertraulich ist und die Maschine nicht verlassen darf. In anderen Fällen ist kimi-k2.6:cloud meine aktuelle Standardwahl.

⚖️ Cline vs Cursor

Ich habe Cursor einige Monate lang benutzt, bevor ich Cline über Ollama ausprobiert habe. Cursor ist ein benutzerfreundliches Werkzeug mit einer niedrigen Einstiegshürde: herunterladen, Projekt öffnen und die KI hilft bereits. Aber bei der Arbeit an AskYourDocs begann mich eine Sache zu beunruhigen: Ein Spring Boot-Projekt mit benutzerdefinierter RAG-Logik und Konfigurationen ist kein Code, den man gerne an externe Server sendet. Cline mit einem lokalen Modell löst dieses Problem vollständig.

Cursor punktet bei der Einfachheit des Starts. Cline punktet dort, wo der Schutz des Codes und die Flexibilität bei der Modellauswahl wichtig sind.

Parameter	Cline (über Ollama)	Cursor
Typ	Agent im Terminal / Web-UI	Eigenständige IDE (Fork von VS Code)
Preis	Kostenlos (Open-Source)	Kostenloser Plan / $20/Monat Pro
Lokale Modelle	✅ Vollständige Unterstützung über Ollama	❌ Eingeschränkt
LLM-Anbieter	Beliebig (Ollama, OpenRouter)	Integrierte Cursor-Modelle
Dateizugriff	✅	✅
Befehlsausführung	✅	✅
Kanban / Parallele Agenten	✅	❌
Datenschutz	✅ 100% lokal (mit lokalem Modell)	❌ Code wird in die Cloud gesendet
Einstiegshürde	Mittel (Node.js, npm)	Niedrig (einfach IDE herunterladen)

⚖️ Cline vs Claude Code

Parameter	Cline (über Ollama)	Claude Code
Entwickler	Open-Source-Community	Anthropic
Schnittstelle	Terminal + Web Kanban UI	CLI (Terminal)
LLM-Unterstützung	Multi-Anbieter	Nur Anthropic API
Lokale Modelle	✅	❌
Preis	Kostenlos (mit lokalem Modell)	Bezahlung nach Anthropic-Token
Parallele Aufgaben	✅ Kanban Board	❌
Einrichtungskomplexität	Mittel	Niedrig
Agentenqualität	Abhängig vom Modell	Konstant hoch (Claude Sonnet)

Claude Code punktet bei der Antwortqualität dank Claude Sonnet unter der Haube. Cline über Ollama punktet bei Flexibilität, Preis und Datenschutz.

👥 Wer sollte Ollama Launch Cline ausprobieren

Unbedingt, wenn Sie:

Java- oder Python-Entwickler sind, der routinemäßiges Refactoring automatisieren möchte
Mit vertraulichem Code arbeiten und keine Cloud-Tools verwenden können
Einen KI-Agenten ohne Abonnement und Token-Kosten ausprobieren möchten
DevOps-Ingenieur sind, der einen Agenten zur Automatisierung von Build- und Deployment-Befehlen benötigt
Node.js-Entwickler sind – Cline ist auf Node.js aufgebaut, die Unterstützung des Ökosystems ist ausgezeichnet

Warten Sie vorerst, wenn Sie:

Ein Anfänger sind, der eine einfache Benutzeroberfläche ohne Konfiguration benötigt – Cursor ist benutzerfreundlicher
Maximale Agentenqualität ohne Kompromisse wünschen – Claude Code auf claude.ai ist stabiler
Ein MacBook M1 mit 8 GB RAM haben – lokale Modelle werden schwer sein, nur der Cloud-Modus bleibt übrig

Eine detaillierte Schritt-für-Schritt-Installationsanleitung, typische Fehler und deren Behebung finden Sie im nächsten Artikel.

❓ FAQ

Kann Cline ohne Internet verwendet werden?

Ja, wenn es mit einem lokalen Modell gestartet wird (qwen3.6, gemma4). Bei der Auswahl von Cloud-Modellen mit dem Suffix :cloud ist Internet erforderlich.

Welche Modelle unterstützt Ollama Launch?

Zum Zeitpunkt der Veröffentlichung sind die lokalen Modelle qwen3.6, gemma4 und die Cloud-Modelle kimi-k2.6:cloud, minimax-m3:cloud, glm-5.1:cloud verfügbar. Die Liste wird mit Ollama-Updates erweitert.

Ist der Zugriff des Agenten auf das Repository sicher?

Cline fordert vor jeder Dateänderung und jeder Befehlsausführung im Terminal eine Bestätigung an. Der Agent handelt nicht ohne Ihre Erlaubnis. Bei Verwendung eines lokalen Modells wird der Code nicht nach außen gesendet.

Wie unterscheidet sich Cline von GitHub Copilot?

GitHub Copilot ist eine Code-Vervollständigung innerhalb der IDE. Cline ist ein vollwertiger Agent: Er liest das gesamte Repository, nimmt Änderungen vor, führt Befehle aus und erledigt Aufgaben autonom. Das Autonomie-Niveau ist grundlegend anders.

Wird VS Code für die Arbeit mit Cline über Ollama benötigt?

Nein. Über ollama launch cline wird der Agent als eigenständiges Werkzeug im Terminal mit einer Web-Oberfläche gestartet. VS Code wird nicht benötigt – obwohl Cline auch als VS Code-Erweiterung existiert, wenn Sie direkt im Editor arbeiten möchten.

Quellen

Kategorien

Ollama LaunchCline: lokaler KI-Agent für Cloud-freies Programmieren

Dmitro Petrov