V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
ubear1991
V2EX  ›  问与答

请求一些资源,新闻网站或者是像 V2EX 这样的网站的用户访问记录

  •  
  •   ubear1991 · 2016-04-06 16:20:38 +08:00 · 1566 次点击
    这是一个创建于 2942 天前的主题,其中的信息可能已经有所发展或是发生改变。

    主要是做毕设所需,推荐系统。 因为算法需要训练,之前的数据都是我用 Python 伪造的。现在想要一点真实数据,看看算法效果。

    需要两种数据,一种是:

    • userid, itemid, [time] (有后面的访问时间更好, 没有也能用)
    • itemid, time(item 的创建时间,非访问时间)

    保证数据不会公开,仅用于算法测试。

    希望万能的 V 友能帮助一下。 谢谢!

    6 条回复    2016-04-07 00:58:17 +08:00
    lyragosa
        1
    lyragosa  
       2016-04-06 16:27:30 +08:00
    我觉得你还是伪造一些数据把……
    ubear1991
        2
    ubear1991  
    OP
       2016-04-06 16:42:39 +08:00
    @lyragosa 这个数据很难搞到么?
    ubear1991
        4
    ubear1991  
    OP
       2016-04-06 18:42:58 +08:00
    @xgowex

    谢谢你,但是并没有访问日志啊~
    doublleft
        5
    doublleft  
       2016-04-06 18:56:32 +08:00
    @ubear1991 里面不是有详细记录吗
    chinvo
        6
    chinvo  
       2016-04-07 00:58:17 +08:00
    第一种数据基本不肯能弄到,第二种数据可以采集包括 @xgowex 说的 51la 等统计服务的公开数据。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2997 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 08:10 · PVG 16:10 · LAX 01:10 · JFK 04:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.