接着微信聊天记录词云之后又做了微信聊天记录年度统计

2022-01-04 09:43:19 +08:00
 liudaolunhuibl

接上文 的 https://www.v2ex.com/t/825496#reply7 元旦节又添加了微信聊天记录的年度统计: https://github.com/liudaolunboluo/WxChatRecordTool/tree/main/annual_records

预览时这样的: 今年,你和米粒儿一共有 321 天有过交流,你们一共互相发了 15306 条信息,你发给米粒儿发了 8306 条消息,米粒儿给你发了 7000 条消息。在 2021-02-07 这一天你们一共发了 325 条消息,在 2021-02-18 这一天你们在深夜 01:50:33 还在聊天

然后另外还可以生成本年度的词云

原理很简单,就是对导出的聊天记录的 json 做统计,几十行 python 代码而已,我也只是抛砖引玉

之前有人提到了导出工具的安全性这个没法保证,这个导出工具是我能找到的最方便的了,导出工具的原文是 https://zhuanlan.zhihu.com/p/32511173 在这里,知乎上的一位大佬做的,所以如果有人聊天记录里有敏感信息的可以谨慎使用这个导出工具。关于微信聊天记录其他导出方式我也试过了,比如说 mac 上的反向工程去获取微信本机数据库 sqlLite 上的密码好像现在已经用不了了。

3124 次点击
所在节点    分享创造
6 条回复
WeitingChen
2022-01-04 13:09:25 +08:00
聊天信息安全确实是个问题
binaryify
2022-01-04 14:23:11 +08:00
没啥用,微信聊天记录各种不同步,统计会不太准确
sandman511
2022-01-04 14:48:46 +08:00
挺好的 我的聊天记录很同步 应该会很准
关于安全方面,有聊天记录敏感信息的别用就是了
tediorelee
2022-01-04 17:02:17 +08:00
执行 python WxAnnualRecords.py /Users/xli1/Desktop/message.json /Users/xli1/Desktop 报错

File "WxAnnualRecords.py", line 14
SyntaxError: Non-ASCII character '\xe6' in file WxAnnualRecords.py on line 14, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details
tediorelee
2022-01-04 17:14:25 +08:00
@tediorelee 文件头加上编码格式解决了,但是运行还是报错,提示:

Traceback (most recent call last):
File "WxAnnualRecords. py", line 4, in <module>
import jieba
ImportError: No module named jieba

但是按照版本手动安装 pip3 install jieba==0.42.1 ,提示已经安装了

Defaulting to user installation because normal site-packages is not writeable
Requirement already satisfied: jieba==0.42.1 in /Users/xli1/Library/Python/3.8/lib/python/site-packages (0.42.1)
tediorelee
2022-01-04 17:50:07 +08:00
@tediorelee 没事了要用 python3

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/825997

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX