Microsoft präsentiert neues Tool zur Evaluierung von Copilot-Agenten

Microsoft hat das Microsoft 365 Copilot Agent Evaluations CLI eingeführt, ein kostenloses Kommandozeilentool zur systematischen Bewertung von KI-Agenten. Nutzer können Fragen an Agenten senden und deren Antworten mithilfe von Azure-OpenAI-Modellen analysieren. Das Tool unterstützt verschiedene Eingabearten und bewertet die Qualität der Antworten anhand von sieben Metriken. Das Evaluations-CLI ist Teil der Microsoft-365-Copilot-Extensibility-Plattform und soll langfristig in den Softwareentwicklungsprozess integriert werden. Aktuell ist das Tool nur für Windows verfügbar, mit zukünftiger Unterstützung für macOS und Linux in Aussicht.

Dieser Text wurde von KI zusammengefasst.