Phi-4

Microsoft stellt kleine Reasoning-Modelle vor

Uhr
von Yannick Chavanne und Übersetzung: Filip Sinjakovic, jor

Mit Phi-4-Reasoning und seinen Varianten führt Microsoft kleine Sprachmodelle ein, die bei komplexen Aufgaben gute Leistungen erbringen sollen und dabei weniger Energie verbrauchen als die bisherigen Modelle.

(Source: Rajesh Rajput / Unsplash)
(Source: Rajesh Rajput / Unsplash)

Kleine, energieeffizientere Sprachmodelle respektive Small Language Models (SLMs) werden immer relevanter. Microsoft folgt diesem Trend, indem es Techniken zur Verkleinerung von Modellen auf die Entwicklung von sogenannten Reasoning-Modellen anwendet, die komplexe Probleme lösen sollen, indem sie Aufgaben in Zwischenschritte aufteilen.

In diesem Zusammenhang stellt das Unternehmen mit Phi-4-Reasoning, Phi-4-Reasoning-Plus und Phi-4-Mini-Reasoning eine neue Reihe von kleinen Sprachmodellen vor, die der Hersteller als besonders leistungsfähig für mathematisches Denken beschreibt. Diese Modelle setzen sich laut Microsoft allmählich für agentische KI-Anwendungen durch, die in der Lage sind, komplexe und multidimensionale Aufgaben zu bewältigen. Bisher war dieses Kapazitätsniveau den grossen Modellen vorbehalten.

Das Hauptmodell, Phi-4-Reasoning, basiere auf 14 Milliarden Parametern, teilt Microsoft mit. Phi-4-Reasoning-Plus basiert auf derselben Architektur, wurde jedoch zusätzlich durch Reinforcement Learning trainiert, was die Nutzung von Rechenkapazitäten während der Inferenz optimieren soll. Laut Microsoft übertreffen diese beiden Modelle die Leistung von Konkurrenzmodellen wie OpenAI o1-mini und Deepseek-R1-Distill-Llama-70B in vielerlei Hinsicht, darunter mathematisches Denken und wissenschaftliche Fragen auf Doktoratsniveau.

Noch energieeffizienter sei Phi-4-Mini-Reasoning, das auf einer Transformer-Architektur basiert und speziell für das schrittweise mathematische Denken trainiert wurde, wobei es sich insbesondere auf künstliche Datensätze stützt, die vom Deepseek-R1-Modell generiert wurden.

Alle Modelle sind über die Plattformen Azure AI Foundry und Hugging Face verfügbar.

 

Während Microsoft seine Sprachmodelle energieeffizienter gestalten möchte, lässt die Integration des KI-Assistenten Copilot die Preise für Microsoft-365-Abos in die Höhe schiessen. Lesen Sie hier mehr darüber.

Webcode
umxDB4br