计算机可以模拟“模糊的记忆”吗？

人类是有“模糊的记忆”的概念的，比如儿时玩伴，名字是叫王小二呢，还是张小四呢？五年没听过的老歌，是 111235 呢，还是 555724 呢？

那计算机如何模拟这种“模糊”的效果呢？计算机的记忆，无论是在硬盘里还是内存，似乎都是有或无二元对立的

select id, name from friends where meet_age_at=13;


id | name 
-- | --
1  | Harry Potter
2  | null

是因为计算机是数字信号，而生物是模拟信号吗？

dawn009

2018-09-04 14:38:58 +08:00

@PureWhiteWu #15 读取到的一段数据 IO 校验失败，说明已损坏。再次尝试读取，读取到的内容仍然校验失败，但和上一次有所不同。这段数据究竟是 000110 呢，还是 100101 呢？这是一段模糊的数据

newtype0092

2018-09-04 14:39:20 +08:00

相当于一个搜索算法吧，记忆中的儿时玩伴是一个对象，假设里面有姓、名、性别、年龄、样貌等等，都存在一个图里。
当你回想的时候，就是从一个点开始联想（搜索），假设先搜到“姓=马”，然后搜到“名长度=2 ”，然后“名[1]=梅”，这时候你不知道“名[0]”，就只是想起，我有个玩伴叫马什么梅？
想到一半头疼放弃，这是内存不够溢出了。
想到一半有别的事干扰，这是 cpu 被抢占了。
想很久没有结果，这是任务执行超时了。
记不起来具体是 a 还是 b，这是有脏数据不一致了。
这些都算模糊记忆吧。

menc

2018-09-04 14:42:25 +08:00

来看看 GAN，一种神经网络，对“人脸”这个概念的认识就是模糊的

menc

2018-09-04 14:44:24 +08:00

@menc ls 这个图像不像梦里的图？局部清晰，局部模糊，能看出大概模样，却又不完全真切。这就是模型生成的人脸，代表了模型对人脸的理解。

GAN 就是连续的而非离散的。

rogwan

2018-09-04 15:00:49 +08:00

人脑是怎么实现记忆的？学界已经搞清楚了吗

daocheng

2018-09-04 15:12:00 +08:00

推荐一本书《生命 3.0 》，里面的内容可能会有启发，我也正在读

vincenteof

2018-09-04 16:31:03 +08:00

如果你能形式化地定义出·模糊·，那基本上就可以

PureWhiteWu

2018-09-04 17:10:25 +08:00

@dawn009 不会是这样的，因为根本不存在校验，VCD 不支持数据校验，你可以先去了解一下底层的存储。读出来是什么数据，就会播放什么数据，不存在这次读出来是 10011 下一次读出来是 01010 的可能性，除非又遭到了损坏，而且计算机不会去重新读的，读出来是什么就播放什么，你之所以看到画面是花的，就是因为读出来的数据是混乱的错误的数据，但是计算机是不知道究竟是对是错的。
所以你的这个例子不正确，计算机不支持“模糊”。
你如果学过编译原理也应该知道，计算机所使用的任何一门语言都不能有二义性，否则就是不合规的。
从计算机最最最底层的，物理层面上来说，二进制不支持模糊。
除非是薛定谔的电位。

zdnyp

2018-09-04 17:48:23 +08:00

应该不存在“模糊记忆”，但是可以模糊的找回记忆（模糊检索）。

winglight2016

2018-09-04 18:17:43 +08:00

加权 lstm+dropout，比较接近模糊记忆这个概念了，不过只是模拟，大脑真正是怎么运转的，谁也说不清

Morriaty

2018-09-04 18:17:47 +08:00

@newtype0092 #22 还是有点不一样，对于计算机来说，要么同时找到“马冬梅、马春梅”，要么找到 null，而对于人来说，就停在“马什么梅”？

jfdnet

2018-09-04 19:01:28 +08:00

刚刚看了几集西部世界好像一开始说的就是这个

mmy1043

2018-09-04 19:50:17 +08:00

不知道楼主为什么要模拟模糊记忆，只提供一个想法吧。人的记忆中不经常被使用的内容会逐渐模糊甚至遗忘，但它们并没有消失，当你遇到一些特定的场景时能够再次回忆起那些记忆。因此可以为每一个信息设置一个权重，根据信息的调用次数来调整它，当权重过低是，对相应信息进行压缩，并留下一些特征，这样来模拟模糊记忆。

newtype0092

2018-09-04 22:00:32 +08:00

@Morriaty #31 并不是，你可能没看懂我说的，名字的三个字并不是存在同一块内存，找到一个就都找到了，他们之间的关系可能通过很复杂的路径连通，或者根本就不连通，需要通过别的节点才能找到。
假如搜索到名字的第二个字要 5s，搜索到第三个字要 n 天，你能保证计算机一直跑这个任务跑三天么？而且如果提前不知道 3 天能跑出来，只知道遍历一遍全量数据要好几年，你能一直等它遍历完么？
这还是内存够的情况下，如果不够那还需要调整算法使用其他辅助手段（类似边想边把线索记到小本本上）。
归根揭底人的记忆就是类似网络的，你能记不起来名字中的某个字，就说明这些字不是存储在一起的，每个独立的数据都是通过其他的数据线索串联起来。
比如姓马这个数据，就可以是通过多条不同的路径搜索到的
（小时候开学那天全班自我介绍->她嗓门很大->她大声的说我叫马 XX ）
（她长得很有特点->她脸很长->她正巧姓马）
路径可短可长，每个数据的关系可远可近，所以不存在要么找到完整名字，要么找到 null。

widewing

2018-09-04 22:19:21 +08:00

有啊，各种有损压缩算法了解一下，特别是基于深度网络的

innoink

2018-09-04 22:22:05 +08:00

多种结果的概率叠加=模糊

flyaway

2018-09-04 22:32:47 +08:00

神经网络大神 Hinton 在 30 多年前的一篇长文中就有过关于模糊记忆的论述。基本思想就是所有的记忆都是存储在一堆 units 中的，任何记忆的实体都可以表示为一些特殊 unit 被激活(一种 pattern)，不同记忆个体之间会有重叠的 units，这样就能模拟楼主所说的模糊记忆了。因为当一个新的实体被激活，其本质就是一堆 unit 被激活，这些 unit 可能又是其他实体的组成部分，这样就能发生「联想」记忆。从机器学习角度来说，这种模型天生就具有泛化性。但是我不确定人脑是否是采用同样的过程的。
Hinton 的文章在这里: http://web.stanford.edu/~jlmcc/papers/PDP/Volume%201/Chap3_PDP86.pdf
有兴趣的话可以看看。

顺便说一句，现在 NLP 中流行的 word embedding(将词表示成向量)就是基于 Hinton 的这篇文章的，几乎所有最前沿的模型都会用到 word embedding，大神的文章 30 年后依然有很强的建设性！

Cheez

2018-09-04 22:35:31 +08:00

当初因为人脑容量太小而已....相当于数据恢复。

dawn009

2018-09-05 01:26:46 +08:00

@PureWhiteWu 这个是你不了解了。VCD 卡盘常见吧，特别是用电脑播放 VCD 时。当年「超强纠错（其实是容错，跳过校验）」可是 VCD 机和 VCD 播放软件的主打广告语。

物理介质不是不「支持」模糊，反而恰恰因为容易出错，所以会有校验机制。换句话说，存储介质天生是「模糊」的，硬件和底层软件的设计需要能消除存储介质的不确定性，才能让上层软件跑在一个「确定」的系统之上。

特别强调一句，同一块数据，每次读取的值不一样，是个常见的现象。尤其是软盘、光盘等易受干扰的介质。

dartabe

2018-09-05 01:37:46 +08:00

LSTM 有个记忆单元会丢弃一些不想记住的东西

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/485933

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.