xAI发布支持视觉的多模态AI模型Grok-1.5V

CoinON消息,马斯克旗下人工智能公司 xAI 宣布推出首个多模态 AI 模型 Grok-1.5V。除了强大的文本处理能力,Grok 还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。

在多个领域的基准测试中,Grok-1.5V 的表现均可与现有的前沿多模态模型相媲美。尤其在 xAI 新推出的 RealWorldQA 基准测试中,Grok 在现实世界空间理解能力上超越了同类模型。RealWorldQA 数据集包含 700 多张图像,旨在评估多模态模型对物理世界的基本理解能力。

Grok-1.5 将很快向早期测试人员和现有用户开放。

上一篇:

下一篇:

xAI发布支持视觉的多模态AI模型Grok-1.5V

星期六 2024-04-13 17:40:04

CoinON消息,马斯克旗下人工智能公司 xAI 宣布推出首个多模态 AI 模型 Grok-1.5V。除了强大的文本处理能力,Grok 还能够处理各种视觉信息,包括文档、图表、屏幕截图和照片等。

在多个领域的基准测试中,Grok-1.5V 的表现均可与现有的前沿多模态模型相媲美。尤其在 xAI 新推出的 RealWorldQA 基准测试中,Grok 在现实世界空间理解能力上超越了同类模型。RealWorldQA 数据集包含 700 多张图像,旨在评估多模态模型对物理世界的基本理解能力。

Grok-1.5 将很快向早期测试人员和现有用户开放。