GPT-4.5 发布:OpenAI 最新大型语言模型的性能与挑战

AI资讯2个月前发布 IdeaSavant
5.9K 0

OpenAI 最近发布了 GPT-4.5,作为“研究预览”版本,仅限于 Pro 订阅用户(每月 $200)和持有 API Key 的开发者使用。虽然官方宣称这是迄今为止最强大的模型,但也坦诚其性能未必超越某些较小模型。GPT-4.5 是一个庞大且昂贵的模型,其计算资源需求极高。

尽管存在争议,OpenAI 强调 GPT-4.5 在多个方面有所增强。例如,它在写作、世界知识和个人化优化方面表现出色,用户体验也更加自然流畅。此外,该模型在模式识别和关联建立上有更好的表现,适用于写作、编程及解决复杂问题。

模型特点与改进

GPT-4.5 被描述为规模最大、计算效率提高超过十倍的语言模型。然而,官方文档中删除了部分早期泄露的信息,包括未引入七项全新前沿能力的说法。OpenAI 还提到,GPT-4.5 使用了新的监督技术和传统方法,如监督微调和人类反馈强化学习,与之前的 GPT-4o 类似。

性能评估

尽管 GPT-4.5 的幻觉现象有所减少,但其编程任务表现平平。根据第三方测试,在多语言编程基准测试中,GPT-4.5 的得分仅为 45%,落后于其他竞争对手。不过,对于日常查询和专业查询,GPT-4.5 的胜率分别达到了 57.0% 和 63.2%。

成本与可用性

GPT-4.5 的 API 调用费用非常高,输入 100 万个 token 需要 75 美元,输出则需 150 美元。相比之下,GPT-4o 的价格要低得多。目前,GPT-4.5 主要面向 Pro 用户开放,并计划逐步推广给更多用户群体。

专家评价

业内专家对 GPT-4.5 的反应褒贬不一。Andrej Karpathy 认为,尽管模型规模扩大了 10 倍,但实际性能提升并不明显。他指出,GPT-4.5 并未接受深度推理训练,因此在数学和编程等领域缺乏显著进步。Gary Marcus 则批评 GPT-4.5 缺乏实质性突破,并质疑 GPT-5 的前景。

未来发展展望

OpenAI 正在评估是否长期提供 GPT-4.5 API 服务,以权衡当前能力与未来模型开发之间的关系。尽管面临诸多挑战,OpenAI 对大模型的独特潜力充满信心,期待用户能够感受到其带来的不同体验。

© 版权声明

相关文章

暂无评论

none
暂无评论...