V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
b7cn
V2EX  ›  PHP

表情网站找合作人

  •  
  •   b7cn · 2019-12-27 03:14:05 +08:00 · 8061 次点击
    这是一个创建于 390 天前的主题,其中的信息可能已经有所发展或是发生改变。
    由于没有程序基础,网站是边翻资料边做的,遇到的难题已经不容易翻到相关的资料来解决了。
    所以寻找一位 [热爱表情文化] 的大佬一起完善这个项目
    分工:我负责运营,您负责网站功能方面

    PS:可付工资,也可以合作一起做
    --------------
    目前遇到的瓶颈;
    表情数据 100w+
    表情包数据 4w+
    程序部署服务器 与 数据库服务器 。

    网站采用的是 CMS 扩展难,需要数据导出重构网站结构
    问题 1 .去重:会员投稿的表情存在重复 ;
    问题 2 .数据库:数据量大,动态页面调用数据库压力挺大的;
    问题 3 .会员体系以及交互等;
    问题 4. 响应式页面;
    57 条回复    2020-02-01 12:12:22 +08:00
    loliordie
        1
    loliordie   2019-12-27 05:27:59 +08:00
    你这需求 活脱脱就是"就差一个程序员了"

    我现在的公司技术需求上个跟你差不多 只不过是商品信息

    然后 DB 和 Stroage 加上一些零零散散的网络服务费用一个月 300+刀, 去重以及属性的预测是一个 5 人的机器学习小组出模型, 每天定时更新数据用的服务器一个月都要 500 刀了, 这还没算前端. 您倒是一拍脑门就做了, 考虑盈利点了么? 有投资人么? 没有的话用谁的钱来付运营费用?
    CallMeReznov
        2
    CallMeReznov   2019-12-27 07:59:57 +08:00 via Android
    07 年左右混论坛的时候有“截图党”
    就是利用电影截图回复贴子的
    最后甚至有一个专门搜图网站,搜关键字就会返回截图。

    现在表情包网站很多,但实际上都是垃圾站,刷流量用的
    根据表情关键字根本搜索不到任何东西。
    希望楼主能做好,并增加对 im 软件的导入接口之类的
    cobopanda
        3
    cobopanda   2019-12-27 08:02:30 +08:00
    有联系方式可以聊聊么
    dreamerlv3ex
        4
    dreamerlv3ex   2019-12-27 08:14:22 +08:00
    搜狗表情包不好使吗
    bytelee
        5
    bytelee   2019-12-27 08:47:15 +08:00
    一起聊一聊 微信: 1281494013
    Desiree
        6
    Desiree   2019-12-27 09:05:59 +08:00
    不靠谱
    CrisTao
        7
    CrisTao   2019-12-27 09:16:23 +08:00
    100w+的数据就算数据量大了么[狗头]
    nyfwan123
        8
    nyfwan123   2019-12-27 09:29:00 +08:00
    联系方式?
    bstsnail
        9
    bstsnail   2019-12-27 09:33:10 +08:00
    联系方式?
    littleylv
        10
    littleylv   2019-12-27 09:33:34 +08:00
    只差一个程序员系列
    aloyuu
        11
    aloyuu   2019-12-27 09:34:06 +08:00 via Android
    332801349 可以加
    Light3
        12
    Light3   2019-12-27 09:34:45 +08:00
    建议直接外包..
    肯定比这里的程序员便宜..
    wondayer
        13
    wondayer   2019-12-27 10:13:28 +08:00
    截图表情还好,好多玩偶类表情都有版权的,在微信上发不出去,如果私用商业化,想想吧
    leon0204
        14
    leon0204   2019-12-27 10:31:12 +08:00
    100w 也算数据
    jiangsw
        15
    jiangsw   2019-12-27 10:34:43 +08:00
    感兴趣 微信号 jsw273534957
    xiaobai987
        16
    xiaobai987   2019-12-27 11:26:05 +08:00
    表情包去重真是一大难点 关注了
    MAIQ
        17
    MAIQ   2019-12-27 11:28:35 +08:00
    前来围观
    wxl1380610
        18
    wxl1380610   2019-12-27 11:29:19 +08:00
    围观
    amdhcwte
        19
    amdhcwte   2019-12-27 11:39:52 +08:00
    问下日薪多少
    iamverylovely
        20
    iamverylovely   2019-12-27 12:21:56 +08:00
    一位太少了吧???
    ADME
        21
    ADME   2019-12-27 13:34:43 +08:00
    @dreamerlv3ex 就是就是,搜狗的斗图功能我感觉非常好用
    heasy
        22
    heasy   2019-12-27 13:34:48 +08:00
    我求数据。hhhh
    1239305697
        23
    1239305697   2019-12-27 13:37:38 +08:00
    表情包数据分享一下?
    chenlaocong
        24
    chenlaocong   2019-12-27 13:44:23 +08:00
    表情包会涉及侵权这种嘛
    Sapp
        25
    Sapp   2019-12-27 14:00:33 +08:00
    @CallMeReznov 怎么会不能搜到,我最近好几个表情包系列都是在网站找到了,比如搜 “还有我,我也要”,搜到的都是相关的,虽然确实没谷歌搜索那么准确,但是怎么也不能说“搜索不到任何东西”吧?
    b7cn
        26
    b7cn   2019-12-27 14:07:06 +08:00
    baiduyixia
        27
    baiduyixia   2019-12-27 14:07:07 +08:00
    @chenlaocong 表情包会涉及侵权这种嘛?同问
    b7cn
        28
    b7cn   2019-12-27 14:08:47 +08:00
    @loliordie 目前二台服务器,一台托管的每月二千左右,一台阿里的一年一千多。
    b7cn
        29
    b7cn   2019-12-27 14:12:11 +08:00
    @CrisTao 嘻嘻,对于新手来说挺大的了,解决它 还独立了一台服务器做数据库运算,才解决了搜索巨卡的问题。
    baiduyixia
        30
    baiduyixia   2019-12-27 14:12:16 +08:00
    @b7cn b7.cn 这个网站 吗
    b7cn
        31
    b7cn   2019-12-27 14:13:29 +08:00
    @nyfwan123
    @bstsnail
    邮箱: [email protected]_cn
    Q 194463855
    sparrww
        32
    sparrww   2019-12-27 14:14:11 +08:00
    聊聊? s388438
    b7cn
        33
    b7cn   2019-12-27 14:16:22 +08:00
    @wondayer
    @chenlaocong

    目前没有打算商业化,涉及到侵权 会立马删除掉。
    b7cn
        34
    b7cn   2019-12-27 14:18:15 +08:00
    @heasy
    @1239305697

    数据是这这些年请兼职和自己人工录入的信息。
    b7cn
        35
    b7cn   2019-12-27 14:18:31 +08:00
    @baiduyixia 嗯。
    b7cn
        36
    b7cn   2019-12-27 14:18:43 +08:00
    @sparrww 好的。
    rrfeng
        37
    rrfeng   2019-12-27 14:22:35 +08:00
    多少钱
    aalikes95
        38
    aalikes95   2019-12-27 14:33:07 +08:00
    看这个,几本是营利了,赚多少的问题 了
    kkkkkrua
        39
    kkkkkrua   2019-12-27 14:42:21 +08:00
    中指 中指 程序员工作 蘑菇头扇子 ??? 恶心 二师兄 我都要 强奸 强奸 强奸 强奸 孙悟空 好想看 想你想你睡不着 真任性

    这搜索真的大丈夫?
    b7cn
        40
    b7cn   2019-12-27 14:47:05 +08:00
    @kkkkkrua
    搜索还是在内测
    不好意思,有些词汇没有过滤完整
    heiheidewo
        41
    heiheidewo   2019-12-27 14:48:10 +08:00
    这个域名不错啊。但是现在搜狗输入法不是自带表情包么,为啥要去网站搜,然后复制表情呢?
    b7cn
        42
    b7cn   2019-12-27 14:53:27 +08:00
    @heiheidewo
    每个人需求不一样吧,大众需求外 还有一部分小众需求
    搜狗输入法确实不错,能满足大部分需求了。
    DX0
        43
    DX0   2019-12-27 15:04:32 +08:00
    看了一下你每个表情包创建的时间基本都是 5-10 秒一个
    还真像是手工创建的
    这个活动本身就像个表情包
    4yuan
        44
    4yuan   2019-12-27 15:07:14 +08:00
    感觉不靠谱
    sheyulili
        45
    sheyulili   2019-12-27 15:11:41 +08:00 via iPhone
    我曾经想做一个纯图片的社交软件,就是全部采用预设图片,最后感觉有点困难,没做下去
    b7cn
        46
    b7cn   2019-12-27 15:11:58 +08:00
    @DX0
    本来的想法是由大部分的会员提供表情包
    目前的状况是一位兼职再更新, 可能是先创建的表情包再做的上传吧。
    b7cn
        47
    b7cn   2019-12-27 15:13:12 +08:00
    @sheyulili 有个开源项目还不错 比较适合 你可以看看,或许可以继续做起来。https://github.com/yinxin630/fiora
    b7cn
        48
    b7cn   2019-12-27 15:27:16 +08:00
    @CallMeReznov
    嘻嘻 ,目前技术有限,采用的是人工。
    输入文字标题,再根据表情打标签,可以实现一部分比较难找到的表情被录入。

    (还因为人工录入效率低的事情,去查找相关资料,了解学习了一段时间的模型训练。)
    wenyiduo8
        49
    wenyiduo8   2019-12-27 17:36:49 +08:00
    @b7cn 百度收录不错,请问怎么 seo 的呢?
    realpg
        50
    realpg   2019-12-28 13:01:41 +08:00
    看到数据量和内容 还想去试试架构设计
    后来一看特么还要做前端 被劝退……
    zhiguang
        51
    zhiguang   2019-12-28 14:33:31 +08:00
    挺好,我也喜欢玩表情包,感觉有创意
    b7cn
        52
    b7cn   2019-12-28 23:38:47 +08:00
    @wenyiduo8 佛系。
    b7cn
        53
    b7cn   2020-01-03 00:50:35 +08:00
    等。
    b7cn
        54
    b7cn   2020-01-13 22:21:09 +08:00
    思路 1:去重 用 文件 md5 来对比去重会比较快一些;
    b7cn
        55
    b7cn   2020-01-13 22:27:30 +08:00
    记录去重问题 1: 前面存量的去重完毕后, 后续会员上传新的表情到{表情包}的话 如何进行快速的去重呢?
    思路:
    会员上传之后进入一个临时库?//会比较快的上传成功,如果实时对比的话 可能上传太慢了;
    后台{审核操作的时候} , 再进行对比入库操作 ?//既而产生一个问题,如果数据比较多的话 审核会很慢?
    b7cn
        56
    b7cn   2020-01-13 22:29:59 +08:00
    去重效率思路:
    图片文件进行分库
    1.不同文件名的图片分类=》不同文件大小 范围的图片分类=》 MD5 前缀一部分相同的分类
    这样索引对比的时候可能会快一些?
    baoshu
        57
    baoshu   353 天前 via iPhone
    去重,有个思路,上传图片的时候,就用 md5 对比下,是否有重复的,这样可以限制发布重复数据。
    另外如果 web 做的流量大,也可以开发下配套的小程序,我们之前有一款,这块也可以交流下,我们有自己技术的,百万数据不算什么的,优化难道应该不大的。
    关于   ·   帮助文档   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1174 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 21:27 · PVG 05:27 · LAX 13:27 · JFK 16:27
    ♥ Do have faith in what you're doing.