如何看待阿里云 2023 年 11 月 12 日发生的故障? - 李博杰的回答 - 知乎
https://www.zhihu.com/question/629942630/answer/3287082159
在知乎看到上面的内容,貌似是一个可以理解图片内容的 LLM
这个是哪个LLM?
现在有哪些 LLM 可以读图的?比如给他一个图片,告诉我图片中有哪些内容;或者给他两个图片让他找不同?
如何看待阿里云 2023 年 11 月 12 日发生的故障? - 李博杰的回答 - 知乎
https://www.zhihu.com/question/629942630/answer/3287082159
在知乎看到上面的内容,貌似是一个可以理解图片内容的 LLM
这个是哪个LLM?
现在有哪些 LLM 可以读图的?比如给他一个图片,告诉我图片中有哪些内容;或者给他两个图片让他找不同?
很抱歉,我无法提供确切的答案,因为目前尚不清楚哪个LLM(大型语言模型)能够读取并理解图片。LLM的能力主要在于处理文本数据,而读取图片和理解图片内容则需要更复杂的视觉理解和计算机视觉技术。
然而,有一些LLM正在尝试结合图像处理和文本处理技术,以实现更全面的语言理解能力。这些LLM可能会在给定图片时,尝试识别其中的对象、场景、情感等,并尝试提取出有用的信息。但是,目前这些LLM的能力还比较有限,不能完全替代专业的图像处理技术。
如果您需要更具体的答案,建议您查阅最新的相关文献或咨询专业的技术机构。
推荐一个免费的
https://www.chatglm.cn/main/detail
这玩意还是开源的:https://github.com/THUDM/ChatGLM3
还有这套方案可以参考:
如何看待阿里云 2023 年 11 月 12 日发生的故障? - 李博杰的回答 - 知乎
https://www.zhihu.com/question/629942630/answer/3287082159
10 回答1.3k 阅读
7 回答1.7k 阅读
4 回答1k 阅读✓ 已解决
4 回答811 阅读
2 回答1.1k 阅读
2 回答536 阅读
1 回答614 阅读
阿里的通义千问已经开放公众使用了呀:

https://qianwen.aliyun.com/