Skip to content

Dify文件上传,图片/文档理解


如需转载,请联系微信群主

Dify 0.10.1版本支持文件上传啦!🎉🎉🎉🎉🎉🎉

运行结果展示

运行结果

下载DSL

上传多文件,图文理解工作流应用可以导出为DSL,方便你在Dify工作区中导入查看整个应用的编排。点击 上传多文件,图文理解.yml下载。
创建应用时,选择导入DSL文件即可。

新建应用

新建ChatFlow应用。

重要节点

开始节点

开始节点设置

  • 编排区域右上角功能打开文件上传。设置最大上传文件数量为3,支持文件类型为文档图片
  • 用户在聊天框中上传文档图片文件,就会被赋值给sys.files变量。sys.filesArray[File]类型。

开始节点

筛选图片

由于开始节点中,用户上传了多种类型的文件,文档图片

所以需要列表操作节点将文档图片筛选出来,分别处理。

过滤条件是type = 图片,也就是筛选出类型为图片的文件。

筛选图片

注意

列表操作节点输出变量中有result 过滤结果,是一个数组类型,因为用户上传的文件中可能存在多个图片。所以筛选出的图片可能有多个。

这个应用,我们只上传了一张图片,所以只需要使用last_record 最后一条记录

筛选文档

筛选图片一样,使用列表操作节点,筛选出类型为文档的文件。

筛选文档

图片总结

这是一个LLM节点,由于需要理解图片,所以这个LLM节点需要选择支持vision视觉理解的多模态模型。我这里使用的是GPT-4o mini

图片总结

图片总结

文档提取器

在对文档使用LLM节点进行总结之前,需要一个文档提取器节点将File类型的文档中的内容提取出来,因为LLM节点并不能直接接收File类型的变量。

文档提取器

文档总结

文档总结

模版转换

模版转换节点将图片总结文档总结节点的结果进行汇总,便于输出结果。

文档总结

直接回复

直接回复


如需转载,请联系微信群主

加群:

扫描下方二维码加好友,添加申请填写“ai加群”,成功添加后,回复“ai加群”或耐心等待管理员邀请你入群