Dify文件上传，图片/文档理解

如需转载，请联系微信群主

Dify 0.10.1版本支持文件上传啦！🎉🎉🎉🎉🎉🎉

运行结果展示

运行结果

下载`DSL`

上传多文件，图文理解工作流应用可以导出为DSL，方便你在Dify工作区中导入查看整个应用的编排。点击上传多文件，图文理解.yml下载。
创建应用时，选择导入DSL文件即可。

新建应用

新建ChatFlow应用。

重要节点

开始节点

开始节点设置

编排区域右上角功能打开文件上传。设置最大上传文件数量为3，支持文件类型为文档和图片。
用户在聊天框中上传文档和图片文件，就会被赋值给sys.files变量。sys.files是Array[File]类型。

开始节点

筛选图片

由于开始节点中，用户上传了多种类型的文件，文档和图片。

所以需要列表操作节点将文档和图片筛选出来，分别处理。

过滤条件是type = 图片，也就是筛选出类型为图片的文件。

筛选图片

注意

列表操作节点输出变量中有result 过滤结果，是一个数组类型，因为用户上传的文件中可能存在多个图片。所以筛选出的图片可能有多个。

这个应用，我们只上传了一张图片，所以只需要使用last_record 最后一条记录。

筛选文档

和筛选图片一样，使用列表操作节点，筛选出类型为文档的文件。

筛选文档

图片总结

这是一个LLM节点，由于需要理解图片，所以这个LLM节点需要选择支持vision视觉理解的多模态模型。我这里使用的是GPT-4o mini。

图片总结

文档提取器

在对文档使用LLM节点进行总结之前，需要一个文档提取器节点将File类型的文档中的内容提取出来，因为LLM节点并不能直接接收File类型的变量。

文档提取器

文档总结

模版转换

模版转换节点将图片总结和文档总结节点的结果进行汇总，便于输出结果。

文档总结

直接回复

如需转载，请联系微信群主

加群：

扫描下方二维码加好友，添加申请填写“ai加群”，成功添加后，回复“ai加群”或耐心等待管理员邀请你入群

工作流

知识库

LangChain中文文档

基础知识

使用外部知识

LangGraph

LangGraph简介

机器人ChatBot

RAG

Chrome划词Ai扩展

Dify文件上传，图片/文档理解

运行结果展示

下载`DSL`

新建应用

重要节点

开始节点

筛选图片

筛选文档

图片总结

文档提取器

文档总结

模版转换

直接回复

基础知识

使用外部知识

LangGraph

LangGraph简介

机器人ChatBot

RAG

Dify文件上传，图片/文档理解 ​

运行结果展示 ​

下载DSL ​

新建应用 ​

重要节点 ​

开始节点 ​

筛选图片 ​

筛选文档 ​

图片总结 ​

文档提取器 ​

文档总结 ​

模版转换 ​

直接回复 ​

Dify文件上传，图片/文档理解

运行结果展示

下载`DSL`

新建应用

重要节点

开始节点

筛选图片

筛选文档

图片总结

文档提取器

文档总结

模版转换

直接回复