正文内容 评论(0)
信息洞察力全维升级!讯飞星火大模型V3.5上新:专业领域的全能小帮手
三、长图文:精准解析图文内容 轻松识别关键元素
在面对包含丰富视觉信息的图片或长篇文本时,讯飞星火的图文识别大模型就展现出了异于常人的能力,它不仅能精确地解析复杂的版面布局,还能够广泛适用于各种环境和情境,识别多种关键元素以及跨领域的符号。
我们可以直接将需要识别的图片,通过“图文”按钮上传,并在下方提出需要询问的问题即可。
例如:日常生活场景 识别说明书
①请问这款散热器需要在什么环境下使用?并且需要在什么环境下存放?
可以看到,通过文字识别,讯飞星火已经充分理解了说明书所表达的含义,通过我们的提问,它可以准确无误的给出问题的答案。
②请问这款散热器如何切换灯语?
而在面对这种图+文的说明书时,则更加考验大模型对图文识别的处理能力。
通过测试,它可以精准的识别到有图隔断的文字内容,面对所提出的问题,精准的回答了出来。
甚至还可以识别图片中的文字,精确度非常可观。