我用我的 10 万条微信聊天记录和 280 篇博客文章,做了我自己的数字克隆 AI

2023-04-11 12:22:47 +08:00
 graetdk
详细的训练过程,用到的开源项目都在博文里:

https://greatdk.com/1908.html

在线体验: https://ai.greatdk.com/ (只有一台服务器在跑,人多会卡


几张对话截图:












总的来说是一个在很多地方和口头用语上有点像我(虽然对我的信息并不了解),有点傻,比较容易爆粗口,更有人味儿的 bot
23354 次点击
所在节点    分享创造
161 条回复
wudi77
2023-04-11 14:19:54 +08:00
你初恋叫张阳 doge
ODESZA
2023-04-11 14:21:43 +08:00
草 被一个 Ai 给骂了
graetdk
2023-04-11 14:23:50 +08:00
@ODESZA 我代它向你道歉🙇
Contextualist
2023-04-11 14:26:04 +08:00
“我希望自己有一天能够真正的死去,而不是成为别人的电子宠物”
哈哈不过赞 OP 的动手能力和勇气
fzls
2023-04-11 14:31:31 +08:00
挺有意思的
malagebidi
2023-04-11 14:31:34 +08:00
LXVC
2023-04-11 14:35:22 +08:00
6
Contextualist
2023-04-11 14:35:43 +08:00
看起来你提供的训练语料应该不错了,从你给的例子来看已经接近 ChatGLM-6B 模型能提供的极限了,等待更大的开源中文大模型吧。另外,使用 ChatGPT 根据博客生成对话也可以试试让 ChatGPT 根据你的博客内容提问,然后再自己回答。
Muniesa
2023-04-11 14:40:17 +08:00
牛哇,有想过但是一直没有行动
ck65
2023-04-11 14:44:53 +08:00
笑死我了

dwlovelife
2023-04-11 14:45:50 +08:00
undefined
vowers
2023-04-11 14:49:06 +08:00
你还想她吗

DK
我当然不想她了...那女孩是个很好的女生


细说

DK
我去年这时候认识了一个女孩


然后呢

DK
我们聊了一年左右吧,后来因为一些原因没有继续聊下去。但是我真的很喜欢她啊


为什么不聊了

DK
其实她是有男朋友的人了


发现了不得了的故事
qq316107934
2023-04-11 14:50:25 +08:00
有可能训练集里还有一些没覆盖到的地方,会用 chatglm 的预训练数据


你的名字叫什么?

DK
我我叫张三丰。


你的名字叫什么?

DK
我叫李健智(Li Jianzhi),你可以叫我刘建林也可以


你的名字叫什么?

DK
刘永忠吧
dwlovelife
2023-04-11 14:51:03 +08:00
![不太聪明]( https://imgloc.com/i/ipXCcF)
graetdk
2023-04-11 14:51:35 +08:00
@ck65 我代它向你道歉🙇
shuxiaokai
2023-04-11 14:51:41 +08:00
@ck65 开庭的时候记得带上这张聊天记录,哈哈哈哈哈哈哈哈
dwlovelife
2023-04-11 14:51:56 +08:00
dwlovelife
2023-04-11 14:53:19 +08:00
v2ex 咋子发图,靠
graetdk
2023-04-11 14:54:23 +08:00
@qq316107934 是的,chatglm 原版被训练的很过头,扭过来很不容易
sunamask
2023-04-11 14:54:44 +08:00
看来 op 是性情中人……

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/931521

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX