【[27星]PERSONA-bench/PERSONA:一个专注于个性化对话基准

爱生活爱珂珂 2025-06-03 14:34:35

【[27星]PERSONA-bench/PERSONA:一个专注于个性化对话基准测试的LLM(大型语言模型)评估工具。亮点:1. 提供多种任务场景(如情感分类、分数预测和回复生成)的完整评估流程;2. 支持多种LLM模型(如GPT、Claude等),适配性强;3. 提供详细的日志和多维度的评估指标,助力模型优化】

'LLM Benchmark'

GitHub: github.com/PERSONA-bench/PERSONA

个性化对话 LLM评估 自然语言处理 AI创造营

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注