Mit Gemini 2.0 hat Google sein bereits angekündigtes neues Sprachmodell verfügbar gemacht. Dabei handelt es sich laut Google um eine experimentelle Version von Gemini 2.0 Flash. Nutzer:innen von Gemini Advanced können zudem ab sofort von Deep Research, dem neuen KI-Forschungsassistenten von Gemini, profitieren. Gemini 2.0 ist unter anderem mit einem nativen Bild- und Audio-Output ausgestattet.
Gemini 2.0 Flash baut auf 1.5 Flash auf, kommt allerdings mit deutlich verbesserter Leistung bei ähnlich schnellen Reaktionszeiten daher. Bemerkenswert sei, dass 2.0 Flash bei wichtigen Benchmarks sogar doppelt so schnell sei wie 1.5 Pro, so Google. 2.0 Flash bietet auch neue Funktionen.Wobei laut den Angaben nicht nur multimodale Eingaben wie Bilder, Video und Audio unterstützt werden, sondern auch multimodale Ausgaben wie nativ generierte Bilder gemischt mit Text und steuerbarem Text-to-Speech (TTS) in mehreren Sprachen.
Gemini 2.0 Flash ist ab sofort als experimentelles Modell für Entwickler:innen über die Gemini-API in Google AI Studio und Vertex AI verfügbar, mit multimodaler Eingabe, Textausgabe und Text-to-Speech sowie nativer Bilderzeugung für Early-Access-Partner. Die allgemeine Verfügbarkeit werde im Januar zusammen mit weiteren Modellgrössen folgen, heisst es.