@
yodhcn #42
Y,性能不是大问题,最难的地方还是怎么提供一些个性化需求(说的不是皮肤)
sqlite 有两个好用的东西,其他数据库应该也有,没详细考究
1. || 连接符,拼接多个字段
2. 自定义函数,注册为 sqlite 函数,这个就好多事情可做了
说几个我遇到的难点吧,至今还没自己满意的解决方案
1. 举个例子
输入:严正花、严正华、严晶华……任一,如何“智能”搜到 严正化(这个是数据库中正确的名字)
意思是,用户输入是随意的,但数据是归一的,如何能做到两者合理匹配
为了这个搞个 AI 不值得,模糊匹配准确度又低
自驾网经常见到这样的帖子:这个女的叫什么?有什么番号? —— 以图搜车
岛国有个素人大全数据库的网站,那叫一个全啊,曾经用什么名字出现在哪个产品都能搜出来
2. 你只考虑了公众化的内容,个人服务有个很大的需求是自己的内容,例如各种自拍、生活记忆、旅行影像等等,这些就需要很强的自定义数据字段 —— 批量输入、单独输入、个性化标签、归类、自动识别(人脸?)……等等
举个例子:电话录音的整理
3. 文件改名、移动,尤其是跨盘移动
如果在管理软件内操作,如何处理大量文件 IO,有可能几百 G 移动哦(westworld 4K 一季就这个量了),自己写的话,不但不好使,出 BUG 可能性也极高
如果不是在管理软件内操作(例如用三方复制软件操作),如何方便又准确地,在移动操作后重新匹配数据
还有其他复杂问题,只是我需求比较狭窄,没遇到
反正搜索性能是小事,但优化肯定还是要做的,不能事小而不为,重点放在个性化的数据录入,以及备份恢复吧