Grok-3 免费开放:性能争议与实际应用测评

AI资讯4个月前发布 Teller
8.2K 0

近期,Grok-3正式宣布免费开放,引起了广泛关注。作为一款由20万块GPU训练而成的强大AI模型,Grok-3推出了DeepSearch和Think两种模式,旨在提升用户的体验。然而,其发布也引发了业内激烈的争论。OpenAI的研究员指责Grok-3在评测中存在作弊行为,而xAI则坚决否认这一指控。尽管如此,Grok-3的实际表现仍然令人瞩目。

争议中的性能表现

Grok-3在发布初期因回答“9.11和9.9哪个大”这一简单问题而受到质疑。最初,Grok-3未能正确回答该问题,但在开启Think模式后,仅需4秒即可得出正确答案。此外,若将问题表述为“9.11和9.9谁大”,Grok-3在普通模式下也能迅速作答。然而,Think模式下,Grok-3却花费了34秒来处理同一个问题,这引发了进一步的讨论。

开发者的真实反馈

许多开发者对Grok-3进行了实测,总结了其几大优点:代码处理能力出色、上下文窗口极长、能够充分利用上下文信息、善于遵循指令,并且拥有友好易用的性格。例如,有人利用Grok-3在一小时内制作了一个带有声音效果的视频游戏,主题涉及马斯克使用激光、火箭和婴儿摧毁美国政府的情节。另一些人则在短短5分钟内开发了一款对抗小行星的游戏。

图像生成能力

Grok-3在图像生成方面表现出色,能够生成照片级真实的图像。Min Choi分享了多个案例,展示了Grok-3在各种场景下的精细表现,如海滩自拍、SpaceX火箭图像、月球探测车在纽约地铁的自拍以及微型小熊猫的微距镜头等。尽管如此,Grok-3在生成特定姿势(如倒立)的人物时仍存在问题,显示了其不足之处。

竞赛中的表现

在2024年麻省理工学院的积分大赛中,Grok-3以1分02秒的时间击败了o1 Pro和其他人类选手,展示了其在解决复杂数学问题上的强大能力。马斯克对此表示赞赏,认为这是一个令人惊叹的成就。

未来展望

Grok-3未来可能推出高级语音模式,支持联网、自定义语音、语音转录和音频分享等功能。目前,默认提供Sal男性声音和Ara女性声音供用户选择。用户界面底部设有关闭退出语音模式、静音和分享三个按键,方便操作。

总结

尽管Grok-3面临一些争议,但其在代码处理、图像生成和数学竞赛中的表现无疑证明了其强大的实力。随着更多功能的推出,Grok-3有望继续引领AI技术的发展方向。

© 版权声明

相关文章

Grok-3 免费开放:性能争议与实际应用测评 暂无评论

none
暂无评论...