开源了 Chatfiles,上传你的文件,然后与之对话!构建自己的语料库!

2023-04-06 09:28:11 +08:00
 ligz

目前已实现的功能:

目前还没有公开使用的网站,我怕我的账单爆掉。构建语料库比较消耗 token ,大家可以用 5M 以下的文档试试看。

所以需要大家本地启动,使用起来比较简单,下载仓库,然后修改环境变量,docker compose up 即可!!

目前项目还在初期,大家可以多多提提 bug 。项目地址: https://github.com/guangzhengli/ChatFiles

附:不要再聊鸭头的事了....

7274 次点击
所在节点    程序员
66 条回复
LavaC
2023-04-06 09:38:27 +08:00
第一个想到的用途是把某群友的黑历史记录输进去然后给群机器人自由发挥
perfectlife
2023-04-06 09:39:34 +08:00
@LavaC 那这个就很强了
LavaC
2023-04-06 09:42:01 +08:00
@perfectlife 上一个注册的账号免费额度 4 月 1 就到期了,想升级 plus 发现不支持澳村的信用卡和借记卡,搞得有点没兴致。
ligz
2023-04-06 09:43:35 +08:00
@LavaC 能干的还是比较多的,例如上传书籍和文档,让它帮你总结或者你向它提问一些文档的内容。后续打算再加上多个文件构建同一个语料库的功能,看看能不能按照套路写作之类的。
bkmi
2023-04-06 09:45:54 +08:00
与文件对话是什么意思,是不是我把某个项目的使用文档喂给它,就可以问他项目相关的问题了
huyujievip
2023-04-06 09:48:10 +08:00
鸭头很好看,拿走了。手动狗头🐶
d873139022
2023-04-06 09:49:15 +08:00
上次看到这个鸭头就觉得很有意思,一眼认出楼主
ligz
2023-04-06 09:56:09 +08:00
@bkmi 是的,上传文档构建系统创建 embeddings ,然后可以问它文档相关的内容。
wenjie0032
2023-04-06 10:01:40 +08:00
借楼贴一下,也搞了个
https://github.com/daodao97/chatdoc
Waverly
2023-04-06 10:16:00 +08:00
反馈一下两个问题:
1. 命令应该是 docker-compose up 不是 docker-compose up
2. 平台好像有点不兼容:有以下报错
[+] Running 3/2
⠿ Network chatfiles_default Created 0.1s
⠿ Container chatfiles Created 0.2s
⠋ chatfiles The requested image's platform (linux/arm64/v8) does not match the detected host platform (linux/amd64) and no specific platform was requested 0.0s
⠿ Container chatfiles-ui Created 0.1s
⠋ chatfiles-ui The requested image's platform (linux/arm64/v8) does not match the detected host platform (linux/amd64) and no specific platform was requested 0.0s
Attaching to chatfiles, chatfiles-ui
chatfiles | standard_init_linux.go:228: exec user process caused: exec format error
chatfiles exited with code 1
chatfiles-ui | standard_init_linux.go:228: exec user process caused: exec format error
chatfiles-ui exited with code 1
learningman
2023-04-06 10:41:43 +08:00
@Waverly
docker compose up 是 docker-compose v2 的格式,v2 是 go 构建的,作为 docker 的插件。1 是 python 写的。该升级了。

不过 docker 镜像确实只有 linux/arm64/v8 的格式,op 是在树莓派上写代码吗。。。
ligz
2023-04-06 10:58:23 +08:00
@learningman 我用的是 MBP m1 pro....晚点我看看镜像格式问题,大家先直接用 npm run dev 起前端,用 python3 server.py 起后端...
Clash
2023-04-06 11:03:21 +08:00
能不能支持上传 markdown 文件?
能不能支持上传 文件夹?(文件夹下多个 md 、txt……文件)

这样就可以方便建自己的智能助理了
changdig
2023-04-06 11:05:21 +08:00
手动 build 一个 x64 镜像就行了
vsitebon
2023-04-06 11:11:48 +08:00
@Clash #12 这个读取是依赖于 langchain 实现的,它的 Loader 有引入 Markdown 的支持
FishBoneEK
2023-04-06 11:14:42 +08:00
Op 可以试试把后端抽出来啊,方便用户自己部署到自己的网站上,和前端适配
如果把文档和接口弄好点的话,应该会有很多人使用的
coderunI
2023-04-06 11:16:09 +08:00
输入小说模板啥的, 是不是就可以写小说了
falcon05
2023-04-06 11:17:03 +08:00
能上传代码文件分析 bug 吗?或者叫它重构
ligz
2023-04-06 11:20:28 +08:00
@FishBoneEK 后端是独立的,目前是用 flask 暴露了两个接口。可以直接用 docker 打包部署。
ligz
2023-04-06 11:22:30 +08:00
@falcon05 这种场景已经有专业队伍跑步进场了,github copilot x 或者 cursor: https://www.cursor.so/

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/930140

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX