Microsoft hat das Microsoft 365 Copilot Agent Evaluations CLI eingeführt, ein kostenloses Kommandozeilentool zur systematischen Bewertung von KI-Agenten. Nutzer können Fragen an Agenten senden und deren Antworten mithilfe von Azure-OpenAI-Modellen analysieren. Das Tool unterstützt verschiedene Eingabearten und bewertet die Qualität der Antworten anhand von sieben Metriken. Das Evaluations-CLI ist Teil der Microsoft-365-Copilot-Extensibility-Plattform und soll langfristig in den Softwareentwicklungsprozess integriert werden. Aktuell ist das Tool nur für Windows verfügbar, mit zukünftiger Unterstützung für macOS und Linux in Aussicht.