Logobild:Shutterstock

Das chinesiche Startup Deepseek führt mit der Version 3.1 erstmals ein KI-Modell mit zwei Betriebsmodi ein, einem "denkenden" und einem "nicht-denkenden" Modus. Die hybride Architektur soll den Weg in das von Deepseek und anderen KI-Unternehmen ausgerufene "Agenten-Zeitalter" weisen.

Deepseek V3.1 setzt auf der Vorgängerversion V3 auf und wurde laut den Angaben mit 840 Milliarden zusätzlichen Tokens weitertrainiert, um ein längeres Kontextverständnis und bessere Fähigkeiten bei komplexen Aufgaben zu ermöglichen. Das neue Tokenizer-Set-up und eine überarbeitete Chat-Vorlage sollen die technischen Änderungen ergänzen. Bei der neuen KI-Version setzt Deepseek nach eigenen Angaben auf die Technologie FP8. Bei diesem Datenverarbeitungsformat benötigt die Software weniger Arbeitsspeicher und ist schneller.

Der Think-Modus (deepseek-reasoner) ist laut den Infos auf mehrstufiges Schlussfolgern und effiziente Nutzung von Werkzeugen optimiert, während der Non-Think-Modus (deepseek-chat) für einfache Aufgaben gedacht ist. Die Nutzer können dabei selber wählen, ob die KI schnell antworten oder länger an einer ausgefeilten Antwort arbeiten soll. Beide Modi unterstützen ein Kontextfenster von 128.000 Tokens.

In Coding-Benchmarks erreicht das Hybrid-Modell Angaben zufolge Ergebnisse, die sich auf Augenhöhe mit den neuesten Hybrid-Modellen von Anthropic und OpenAI bewegen. Der Think-Modus soll zudem schnellere und bessere Antworten als das im Mai aktualisierte Reasoning-Modell Deepseek-R1-0528 liefern.

Mit dem neuen Modell führt Deepseek ab dem 5. September 2025 auch eine neue Preisstruktur ein. Die Nutzung der Input-API kostet demnach 0,07 US-Dollar pro Million Tokens bei Cache-Treffer, 0,56 US-Dollar bei Cache-Fehlschlag. Die Ausgabe von Tokens kostet 1,68 US-Dollar pro Million Tokens.

Das liegt weit unter den gängigen Preisen — Gemini 2.5 Pro berechnet für Ausgaben 10,00 US-Dollar pro Million Tokens (15,00 US-Dollar bei Prompts > 200k), OpenAI GPT-5 10,00 US-Dollar pro Million Tokens und Anthropic Claude Opus 4.1 sogar 75,00 US-Dollar pro Million Tokens. Der Preisdruck nimmt also weiter zu.

Die Open-Source-Gewichte sind auf der Open-Source-Plattform Hugging Face verfügbar. Der Quellcode und die Gewichte stehen unter der MIT-Lizenz.