Appearance
Dify文件上传,图片/文档理解
如需转载,请联系微信群主
Dify 0.10.1
版本支持文件上传
啦!🎉🎉🎉🎉🎉🎉
运行结果展示
下载DSL
上传多文件,图文理解工作流
应用可以导出为DSL
,方便你在Dify
工作区中导入查看整个应用的编排。点击 上传多文件,图文理解.yml下载。
创建应用时,选择导入DSL
文件即可。
新建应用
新建ChatFlow
应用。
重要节点
开始节点
开始节点设置
- 编排区域右上角
功能
打开文件上传
。设置最大上传文件数量为3,支持文件类型为文档
和图片
。 - 用户在聊天框中上传
文档
和图片
文件,就会被赋值给sys.files
变量。sys.files
是Array[File]
类型。
筛选图片
由于开始节点
中,用户上传了多种类型的文件,文档
和图片
。
所以需要列表操作
节点将文档
和图片
筛选出来,分别处理。
过滤条件是type = 图片
,也就是筛选出类型为图片
的文件。
注意
列表操作
节点输出变量中有result 过滤结果
,是一个数组
类型,因为用户上传的文件中可能存在多个图片。所以筛选出的图片可能有多个。
这个应用,我们只上传了一张图片,所以只需要使用last_record 最后一条记录
。
筛选文档
和筛选图片
一样,使用列表操作
节点,筛选出类型为文档
的文件。
图片总结
这是一个LLM
节点,由于需要理解图片
,所以这个LLM
节点需要选择支持vision
视觉理解的多模态模型
。我这里使用的是GPT-4o mini
。
文档提取器
在对文档
使用LLM
节点进行总结之前,需要一个文档提取器
节点将File
类型的文档中的内容提取出来,因为LLM
节点并不能直接接收File
类型的变量。
文档总结
模版转换
模版转换
节点将图片总结
和文档总结
节点的结果进行汇总,便于输出结果。
直接回复
如需转载,请联系微信群主
加群:
扫描下方二维码加好友,添加申请填写“ai加群”,成功添加后,回复“ai加群”或耐心等待管理员邀请你入群