GPT-4.5 发布：OpenAI 最新大型语言模型的性能与挑战

8.4K 0

OpenAI 最近发布了 GPT-4.5，作为“研究预览”版本，仅限于 Pro 订阅用户（每月 $200）和持有 API Key 的开发者使用。虽然官方宣称这是迄今为止最强大的模型，但也坦诚其性能未必超越某些较小模型。GPT-4.5 是一个庞大且昂贵的模型，其计算资源需求极高。

尽管存在争议，OpenAI 强调 GPT-4.5 在多个方面有所增强。例如，它在写作、世界知识和个人化优化方面表现出色，用户体验也更加自然流畅。此外，该模型在模式识别和关联建立上有更好的表现，适用于写作、编程及解决复杂问题。

模型特点与改进

GPT-4.5 被描述为规模最大、计算效率提高超过十倍的语言模型。然而，官方文档中删除了部分早期泄露的信息，包括未引入七项全新前沿能力的说法。OpenAI 还提到，GPT-4.5 使用了新的监督技术和传统方法，如监督微调和人类反馈强化学习，与之前的 GPT-4o 类似。

性能评估

尽管 GPT-4.5 的幻觉现象有所减少，但其编程任务表现平平。根据第三方测试，在多语言编程基准测试中，GPT-4.5 的得分仅为 45%，落后于其他竞争对手。不过，对于日常查询和专业查询，GPT-4.5 的胜率分别达到了 57.0% 和 63.2%。

成本与可用性

GPT-4.5 的 API 调用费用非常高，输入 100 万个 token 需要 75 美元，输出则需 150 美元。相比之下，GPT-4o 的价格要低得多。目前，GPT-4.5 主要面向 Pro 用户开放，并计划逐步推广给更多用户群体。

专家评价

业内专家对 GPT-4.5 的反应褒贬不一。Andrej Karpathy 认为，尽管模型规模扩大了 10 倍，但实际性能提升并不明显。他指出，GPT-4.5 并未接受深度推理训练，因此在数学和编程等领域缺乏显著进步。Gary Marcus 则批评 GPT-4.5 缺乏实质性突破，并质疑 GPT-5 的前景。