哪种人工智能模型的幻觉率最低?来看幻觉率最低的人工智能模型TOP15 随着人工智能工具和应用越来越多地融入我们的日常生活,重要的是要记住,模型有时可能会产生不正确的信息。 这种现象被称为“幻觉”,IBM将其描述为当大型语言模型(LLM)(如生成式AI聊天机器人或计算机视觉工具)检测到不存在或人类无法察觉的模式或对象时,导致输出不准确或无意义。 这张图表显示了幻觉率最低的前15个人工智能大型语言模型。 幻觉率是LLM在其输出中产生错误或不支持信息的频率。 数据来自Vectara,截止到2024年12月11日更新。通过总结每个LLM的1000个简短文件,并使用一个模型来检测幻觉,得出与事实不一致的总结的百分比,从而计算出幻觉率。 下面图表展示了幻觉率最低的前15个人工智能模型以及它们的公司和原产国。 较小或更专业的模型,如智普Zhipu AI GLM-4-9B-Chat, OpenAI-o1-mini和Openai - 40 -mini在所有模型中具有最低的幻觉率。英特尔的Neural-Chat 7B也是一款更小的模型。 根据Vectara的说法,小规模的模型可以“实现与大规模LLM相当甚至更好(更低)的幻觉率。” 随着人工智能系统被部署在医学、法律和金融等领域的高风险应用中,测量幻觉率变得越来越重要。 虽然较大的模型通常比较小的模型表现得更好,并且不断扩大规模以获得更好的结果,但它们也存在成本高、推理速度慢和复杂性等缺点。 然而,较小的模型正在缩小差距,许多模型在特定任务上表现良好。例如,一项研究表明,较小的Mistral 8x78模型成功地减少了人工智能生成文本中的幻觉。 在基础模型方面,谷歌的Gemini 2.0略微优于OpenAI GPT-4,幻觉率仅相差0.2%。 然而,总体而言,GPT-4的几个变体(如Turbo、Mini、Standard)都在1.5%-1.8%的范围内,突出了对同一架构不同层次的准确性的强烈关注。
哪种人工智能模型的幻觉率最低?来看幻觉率最低的人工智能模型TOP15 随着人工
睿诚评世界
2025-01-11 06:49:26
0
阅读:0