前言

网站在没有提交搜索引擎收录之前,直接搜索你网站的内容是搜不到的,只有提交搜索引擎之后,搜索引擎才能收录你的站点,通过爬虫抓取你网站的东西。

对于 百度搜索,如果你是部署在 GitHub Pages,那么你是无法被百度收录的,因为 GitHub 禁止了百度爬虫,有以下几种解决办法:

  1. 服务器部署 + 域名
  2. 部署到 Coding PagesGitee
  3. 利用vercel
  4. CDN
  5. 使用Nginx做反向代理

安装sitemap

sitemap:中文译为“站点地图”

站点地图是一种文件,您可以通过该文件列出您网站上的网页,从而将您网站内容的组织架构告知 Google 和其他搜索引擎。Googlebot 等搜索引擎网页抓取工具会读取此文件,以便更加智能地抓取您的网站。

  • hexo-generator-sitemap 【该包用于支持Google搜索引擎】
  • hexo-generator-baidu-sitemap 【该包用于支持百度搜索引擎】
1
2
npm install hexo-generator-sitemap --save
npm install hexo-generator-baidu-sitemap --save

根目录_config.yaml添加如下的配置,生成对应xml文件

1
2
3
4
5
# sitemap
sitemap:
path: sitemap.xml
baidusitemap:
path: baidusitemap.xml
1
hexo cl;hexo g

如何查看网站是否被收录

首先我们可以输入 site:域名 来查看域名是否被搜索引擎收录,如下图所示,表示没有收录:

image-20230504094127563

百度收录

百度注册

访问百度搜索资源平台官网,注册或者登陆百度账号,依次选择【用户中心】-【站点管理】

image-20230504094252967

点击【添加网站】,然后根据自己站点需求进行选择即可

image-20230504094417623

对验证网站,提供了两种验证方式:

  • 文件验证:下载给定的文件,将其放到本地主题目录 source 文件夹,然后部署上去完成验证
  • HTML 标签验证:一般是给一个 meta 标签,放到首页 <head></head> 标签之间即可完成验证

anzhiyu主题,建议选择HTML 标签验证,修改主题配置文件后推送即可即可

image-20230504095438640

image-20230504095539385

添加sitemap

地址为域名/baidusitemap.xml

image-20230504122341862

Bing收录

  1. 打开Home - Bing Webmaster Tools,登录,添加网站,网站验证
  2. 添加sitemap,域名/sitemap.xml,如https://blog.wpixiu.cn/sitemap.xml
  3. 效果展示

image-20230504133712744

不得不说,Bing真的快,一个小时收录搞定

Google收录

与Bing类似,Bing还可以通过导入谷歌搜索的收录直接完成收录(未具体操作过,可自行尝试)

image-20230504135131583

  • 添加sitemap,域名/sitemap.xml,如https://blog.wpixiu.cn/sitemap.xml

image-20230504135340659