Appearance
Dify文件上传,图片/文档理解
如需转载,请联系微信群主
Dify 0.10.1版本支持文件上传啦!🎉🎉🎉🎉🎉🎉
运行结果展示

下载DSL
上传多文件,图文理解工作流应用可以导出为DSL,方便你在Dify工作区中导入查看整个应用的编排。点击 上传多文件,图文理解.yml下载。
创建应用时,选择导入DSL文件即可。
新建应用
新建ChatFlow应用。
重要节点
开始节点
开始节点设置
- 编排区域右上角
功能打开文件上传。设置最大上传文件数量为3,支持文件类型为文档和图片。 - 用户在聊天框中上传
文档和图片文件,就会被赋值给sys.files变量。sys.files是Array[File]类型。

筛选图片
由于开始节点中,用户上传了多种类型的文件,文档和图片。
所以需要列表操作节点将文档和图片筛选出来,分别处理。
过滤条件是type = 图片,也就是筛选出类型为图片的文件。

注意
列表操作节点输出变量中有result 过滤结果,是一个数组类型,因为用户上传的文件中可能存在多个图片。所以筛选出的图片可能有多个。
这个应用,我们只上传了一张图片,所以只需要使用last_record 最后一条记录。
筛选文档
和筛选图片一样,使用列表操作节点,筛选出类型为文档的文件。

图片总结
这是一个LLM节点,由于需要理解图片,所以这个LLM节点需要选择支持vision视觉理解的多模态模型。我这里使用的是GPT-4o mini。


文档提取器
在对文档使用LLM节点进行总结之前,需要一个文档提取器节点将File类型的文档中的内容提取出来,因为LLM节点并不能直接接收File类型的变量。

文档总结

模版转换
模版转换节点将图片总结和文档总结节点的结果进行汇总,便于输出结果。

直接回复

如需转载,请联系微信群主
加群:
扫描下方二维码加好友,添加申请填写“ai加群”,成功添加后,回复“ai加群”或耐心等待管理员邀请你入群