我以前队列是直接在内存里,程序停了又要重头开始。。。。
所以队列应该保存在数据库当中会好一点
|      1demoslam      2015-07-24 06:06:56 +08:00 看需求,正常爬虫存的数据库可以随便选。inverted index的存储可能要额外考虑其他的数据库 | 
|  |      2itfanr      2015-07-24 07:06:39 +08:00 via Android  2 leveldb   rocksdb | 
|  |      3shoumu      2015-07-24 09:17:38 +08:00 想用什么数据库就用什么数据库,等数据库性能遇到瓶颈了还能学学数据库的东西 | 
|  |      4Comdex      2015-07-24 09:53:31 +08:00 redis/mongodb | 
|  |      6mcwanderer      2015-07-24 12:01:28 +08:00 mongodb | 
|  |      7qw7692336 OP @mcwanderer  不说原因的都是耍流氓 | 
|      10zjq426      2015-07-24 17:43:07 +08:00 爬和解析分开,爬下来的rawdata直接存文件不好吗。。。 | 
|  |      11bengtuo      2015-07-24 18:39:34 +08:00 直接存文件 |