【[27星]PERSONA-bench/PERSONA:一个专注于个性化对话基准测试的LLM(大型语言模型)评估工具。亮点:1. 提供多种任务场景(如情感分类、分数预测和回复生成)的完整评估流程;2. 支持多种LLM模型(如GPT、Claude等),适配性强;3. 提供详细的日志和多维度的评估指标,助力模型优化】
'LLM Benchmark'
GitHub: github.com/PERSONA-bench/PERSONA
个性化对话 LLM评估 自然语言处理 AI创造营
【[27星]PERSONA-bench/PERSONA:一个专注于个性化对话基准测试的LLM(大型语言模型)评估工具。亮点:1. 提供多种任务场景(如情感分类、分数预测和回复生成)的完整评估流程;2. 支持多种LLM模型(如GPT、Claude等),适配性强;3. 提供详细的日志和多维度的评估指标,助力模型优化】
'LLM Benchmark'
GitHub: github.com/PERSONA-bench/PERSONA
个性化对话 LLM评估 自然语言处理 AI创造营
作者最新文章
热门分类
科技TOP
科技最新文章