Github pages 拒绝百度爬虫怎么办?

2018-05-28 20:01:08 +08:00
 ihancheng

用 github pages 做了一个博客,这几天做了 seo 优化,谷歌和必应都已经收录了我的网站,但是百度死活不行。在百度站长平台抓取也总抓去失败(猜测应该是 github 拒绝百度爬虫访问造成的)。

那么问题来了,怎么才能在百度搜到我的博客呢?

10074 次点击
所在节点    问与答
48 条回复
Trumeet
2018-05-29 14:02:49 +08:00
GitHub 禁百度。建议还是别管百度了(
chuhemiao
2018-05-29 14:40:47 +08:00
github coding 双部署。
SpaceVim
2018-05-29 15:43:49 +08:00
我看了楼上所有的回答,其实很多回答是不正确的,GitHub 并没有禁用百度的索引。我是 spacevim 这个项目的维护者,你可以在百度搜 site:spacevim.org

其实关于网站的 seo 真心没必要折腾,如果你的质量写得好,有十个人替你转发一次,比得上百度上被搜到上百次。
ihancheng
2018-05-29 19:16:12 +08:00
coding 部署后,在百度站长工具成功抓取网页后,前 200K 部分内容:( coding 真的好讨厌……)

// var DATA = [
// {
// title: '岂能尽如人意,但求无愧于心',
// detail: '“服务”才是外包最大的竞争力。',
// },
// {
// title: '客户重要还是项目重要?',
// detail: '谁给钱谁重要。',
// },
// {
// title: '外包尾款迟迟收不回来,哥儿几个的工资哪儿找?',
// detail: '托管在码市上的钱跑不掉。',
// },
// {
// title: '不靠谱的外包可以做到让你心理崩塌。',
// detail: '理性分析,远离傻逼。',
// },
// {
// title: '程序员靠什么挣钱?',
// detail: '靠面对需求时的好脾气。'
// },
// {
// title: '你写过最漂亮的代码值多少钱?',
// detail: '需求方说了算。',
Foolt
2018-05-29 20:55:50 +08:00
github 没有禁百度,百度也没有禁 github,你用 site 命令搜索一下就就知道了。

百度收录不同谷歌和必应,百度收录比较慢,做多几个外链吧,比如说把文章转载到 CSDN 博客留下外链。
songxin
2018-06-22 11:05:36 +08:00
使用 Nginx 反向代理,伪造百度爬虫的 user agent 就行了。具体可以看
[Github Pages 百度索引收录工具]( https://3gods.com/baiduindex.html)
ihancheng
2018-06-22 12:23:35 +08:00
@songxin 很不错哦!感谢作者!👍
JennyWoW
2020-03-16 07:13:30 +08:00
CDN 基本是不管用的,Nginx 反向代理确实可以,如果没有服务器,看到有人提到 zeit.co ,百度收录很快 https://zpjiang.me/2020/01/15/let-baidu-index-github-page/

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/458461

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX