求助图片搜索的平台应该如何盈利

340 天前
 Thiece
技术原理上也没什么好隐瞒的,底层原理是 CLIP 的 Encoder 和 Faiss 的 Cosine similarity ;
在上层业务上,引入了新的结构优化了 CLIP 的 Text Encoder 部分,让文字搜索图片能有更前的语义到内容的关联性;

目前验证过效果较好的方面有:
1 、图片到图片搜索;
a 、支持残缺图片搜索原图;
b 、有较好的马赛克、偏色、模糊抗扰能力;
2 、文字到图片搜索;
a 、基于图片中内容特征进行搜索,如双马尾、黑丝、红色眼睛、银发;
b 、基于角色名字进行搜索;

可扩展的能力为通过图片搜索到该图片来自的剧集或者电影的时间帧(文字理论也行,但是数据库大了很难定位准确的帧)。
原理是把视频拆成了图片,然后通过内容感知来切分场景镜头,选出每个场景中标志性的几张图片;接下来的部分就和上面的流程是一样了。


基于以上的架构,它目前拥有以下的特性:
1 、如果想要搜索到这个内容,该内容源文件必须在服务器上,或曾经在服务器上(取决于是否要提供预览功能);
a 、可能会有版权风险;
b 、提供预览会对储存和带宽产生挑战;
2 、内容的泛用性搜索上挑战,需要针对每个资源站定制爬虫;
a 、如果没有改站点的爬虫,并把视频 /图片爬回至服务器,就无法制作该站点资源的搜索索引;
b 、这是一个可刑可拷的爬虫;
3 、Faiss 限制
a 、搜索索引需要载入到内存中才能运行,1G 运行内存大约可以索引 500k 张图片(未压缩情况下)
4 、模型限制
a 、虽然可以在纯 CPU 环境中跑吧,速度也还行,但是没试过高并发业务场景;
b 、如果在纯 CPU 环境中跑,Faiss 每次更新索引会随着数据的增加而线性增加;


商业化问题:
1 、服务器挺贵的,带 GPU 的服务器更贵了,然后还需要大运存;
2 、虽然不提供直接的资源服务吧,但是怎么看怎么觉得这个爬虫十分可拷;
3 、广告支撑不起一个月的服务器开支,付费搜索真的有人用吗;


目前的想法:
1 、先从 Pixiv 入手进行落地;


大家有更好的想法或者方向期望指点一下,目前这个项目有一种只考虑了技术实现没考虑工业落地的场景;
如果对这个项目有兴趣也可以联系我。
2171 次点击
所在节点    奇思妙想
29 条回复
lucybenz
337 天前
@Thiece 个人猜测 有图片素材库的个人和机构都有这个需求。 比如从事内容创作的个人和团队 不过只是猜测 没有数据支撑
elonmask
336 天前
@Thiece 没啥挑战的,不少人都做了啊
Thiece
336 天前
@elonmask
追求的不是 paper 是工业化落地
elonmask
334 天前
@Thiece 扯什么 paper 啊,我说的是把模型搞到 app 中做搜索。不是在电脑上做,离线单机的 clip 模型没多大,clip text 和 clip visual 量化之后总共才 200M ,我见过有人做了。
Thiece
334 天前
@elonmask
哦明白了,是我误解了,不过和你想的不太一样,我们没有使用完整的 CLIP ,只是使用 CLIP 的 embedding 部分。
包括文字搜索,也只是使用到输出 CLS Token 部分。

CLIP Base 做到 200M 甚至 100M 完全是有可能的。

目前与仅使用 CLIP 落地的项目还是不太一样的。
当然这并不是说我们不能做离线私有化部署,正如上面我对其人的回复中,优先做一个单机的的落地版本我占时还不清楚能够帮助到哪些人。如果在这方面你有更好的建议我们可以深入探讨。
st2udio
333 天前
手机上跑 clip 已经有 app 上架了,还是在 V 站上看到的。转成 CoreML 支持的模型也就几百 M ,商可。其他的可能主要是商业用途,比如去年我给我们公司的图片搜索功能换成了 Clip
74123gzy
312 天前
不知到,但搜图我肯定会直接想到 tineye ,然后就是谷歌百度啥的,这个我觉得普通人真入局不了
ldyisbest
168 天前
有 demo 了吗 体验下
Thiece
168 天前
@ldyisbest
没线上 demo ,基础版开源了,你可以本地跑;
有兴趣我们可以聊聊。
https://github.com/NTUYWANG103/clip-image-search

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/949034

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX