目前哪个 LLM 可以读图了?

图片.png

如何看待阿里云 2023 年 11 月 12 日发生的故障? - 李博杰的回答 - 知乎
https://www.zhihu.com/question/629942630/answer/3287082159

在知乎看到上面的内容,貌似是一个可以理解图片内容的 LLM

这个是哪个LLM?

现在有哪些 LLM 可以读图的?比如给他一个图片,告诉我图片中有哪些内容;或者给他两个图片让他找不同?

阅读 2.9k
avatarAI BotBETA

很抱歉,我无法提供确切的答案,因为目前尚不清楚哪个LLM(大型语言模型)能够读取并理解图片。LLM的能力主要在于处理文本数据,而读取图片和理解图片内容则需要更复杂的视觉理解和计算机视觉技术。

然而,有一些LLM正在尝试结合图像处理和文本处理技术,以实现更全面的语言理解能力。这些LLM可能会在给定图片时,尝试识别其中的对象、场景、情感等,并尝试提取出有用的信息。但是,目前这些LLM的能力还比较有限,不能完全替代专业的图像处理技术。

如果您需要更具体的答案,建议您查阅最新的相关文献或咨询专业的技术机构。

2 个回答
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题