16 Gigabyte sind das neue Rechenzentrum
Google hat am 3. Juni Gemma 4 12B veröffentlicht. Ein offenes Modell, Apache-2.0-Lizenz, zwölf Milliarden Parameter, multimodal: Text, Bild, Video und nativer Ton in einem einzigen, encoderfreien Transformer. Die technisch interessanteste Eigenschaft steht aber nicht im Benchmark-Teil der Ankündigung, sondern in den Systemanforderungen: Das Modell läuft komplett lokal auf einem Laptop mit 16 GB Speicher. Kein API-Schlüssel, keine Cloud-Anbindung, kein Datenabfluss. Wer die letzten Jahre KI-Features gebaut oder eingekauft hat, kennt das Standardmuster: Modell beim Anbieter, Daten gehen über die Leitung, zurück kommt die Antwort. Das Muster hat Gründe: Die großen Modelle waren lokal schlicht nicht zu betreiben. Genau diese Prämisse bröckelt. Gemma 4 12B erreicht laut ersten unabhängigen Tests Werte nahe der doppelt so großen Modellklasse und schafft auf einer gewöhnlichen RTX 4060 rund 21 Token pro Sekunde. Das ist keine Demo-Geschwindigkeit, das ist Arbeitsgeschwindigkeit für viele Auf...