丑搜·中文独立博客全文搜索引擎(收录有 1K+ 博客)

2023-03-29 00:17:17 +08:00
 yzqzss

丑搜:https://uglysearch.othing.xyz

demo 性质,不保可用性

刚糊出来的灵车中文独立博客全文搜索引擎。
11 万篇中文独立博客文章,1.4k+ 独立博客(另有少量中文独立播客)。

搜索结果以匹配度排序,没有时间权重,这样更容易找到真正有价值的文章。如果你需要更精准的搜索结果,请发动你的小脑瓜。可以用 ";作者" 来筛选同作者的文章。数据库月度更新,如果你需要实时信息,请使用其他优美的搜索引擎。希望你能在这十几万篇文章里找到有用的东西。

键盘左右键可以翻页。可以展开显示 MarkDown 全文。


主要是这三年时间里,我的 RSS 订阅器慢慢积累到 11 万篇文章,所以自然而然蹦出了这个想法。试着把数据全导入到 MeiliSearch ,发现搜索结果还不错。于是昨天用 flask 无脑糊了个后端,然后如你所见,这就是成品 demo 了……

数据源是历年的 RSS 订阅积累,所以你会搜到一些已经消失的博客文章。

代码就不开源了,毕竟整个实现非常灵车,大部分东西都是现成的,没啥技术量。大概就是:

  1. 一个 Python 脚本从 FreshRSS 用的数据库里读文章的 HTML ;
  2. 随便找个现成的 HTML 转 MarkDown 的库,把 HTML 转成 MarkDown ;
  3. 把 MarkDown 喂给 MeiliSearch ;
  4. 用 flask 立个无脑后端对接 MeiliSearch ;
  5. 这个 demo 非常好看,且是无脑使用的 MeiliSearch ,故起名:丑搜。完。

弄完这个 demo ,我想到了这篇博文: 「软件工程是个面包机」。感谢前人的大量工作,咱才能在几十分钟内糊出这个能 work 的“搜索引擎包装”。当然,还不能忘了中文互联网上还是有很多一直保持内容输出的独立博客博主们。


2756 次点击
所在节点    分享创造
14 条回复
sunshower
2023-03-29 00:40:40 +08:00
不错 挺好的
leedarmau
2023-03-29 00:40:57 +08:00
界面的确需要优化一下。

其实我博客也接了 meilisearch ,功能都写好了,就是样式实在麻烦
damao2250
2023-03-29 12:15:30 +08:00
真不错
andyJado
2023-03-29 12:22:14 +08:00
真的很不错,但优雅你自己说了让我说什么?尾巴塞回去!
batilo
2023-03-29 12:26:45 +08:00
昨天就看到啦哈哈哈哈哈
4ct0rwyt
2023-03-29 12:32:17 +08:00
挺好的
yzqzss
2023-03-29 14:36:52 +08:00
#2 @leedarmau 还好我已经起名“丑搜”了,样式什么的都不需要管了,哈哈。
nothingisnothing
2023-03-29 17:12:29 +08:00
不错
hedwi
2023-03-29 21:23:31 +08:00
厉害了
yang2yang
2023-03-30 09:45:31 +08:00
理解为一个优质播客列表专属搜索引擎吗?
janyork
2023-03-30 17:43:51 +08:00
哈哈哈,我居然刷到了你这个
yzqzss
2023-03-30 18:01:49 +08:00
@yang2yang 嗯,独立博客和播客都有收录。(垃圾站不包括在内)
xinyana
2023-03-30 18:26:57 +08:00
不知道博主本人同意吗?
xinyana
2023-03-30 18:28:31 +08:00
不知道博主本人同意不?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/928000

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX