Open MLLM excelling in vision, reasoning, and long context via multimodal pre-training.
什么是InternVL?
InternVL 是来自 OpenGVLab 的一个开放多模态大型语言模型(1B-78B),在视觉、推理、长文本理解和代理能力方面表现出色,采用了原生多模态预训练。它在文本任务上超越了基础的语言模型。
如何使用 InternVL?
你可以向 InternVL 提问。例如,可以询问某个人在看什么,使用 Python 实现流程图,以及将不同图像之间建立联系。
InternVL 的核心功能
多模态预训练
视觉和推理能力
长文本理解
代理能力
在文本任务上优于基础的语言模型
InternVL3