正如我们在第1章中提到的,搜索引擎是回答机器。它们的存在是为了发现、理解和组织互联网的内容,以便为搜索者提出的问题提供最相关的结果。
为了显示在搜索结果中,您的内容首先需要对搜索引擎可见。这可以说是SEO难题中最重要的部分:如果找不到您的网站,您将永远无法出现在SERP(搜索引擎结果页面)中。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
搜索引擎是如何工作的?
搜索引擎通过三个主要功能工作:文章源自你的网络首码项目网-https://www.youranweb.com/150.html
- 爬行:在Internet上搜索内容,查看他们找到的每个URL的代码/内容。
- 索引:存储和组织在爬取过程中发现的内容。一旦页面在索引中,它就会在运行中显示为相关查询的结果。
- 排名:提供最能回答搜索者查询的内容,这意味着结果按最相关到最不相关排序。
什么是搜索引擎抓取?
爬行是搜索引擎派出一组机器人(称为爬虫或蜘蛛)来寻找新的和更新的内容的发现过程。内容可能会有所不同——它可以是网页、图像、视频、PDF等——但无论格式如何,内容都是通过链接发现的。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
搜索引擎机器人,也称为蜘蛛,从一个页面爬到另一个页面以查找新的和更新的内容。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
Googlebot从获取几个网页开始,然后按照这些网页上的链接查找新的URL。通过沿着这个链接路径跳跃,爬虫能够找到新内容并将其添加到名为Caffeine的索引中——一个包含已发现URL的庞大数据库——稍后当搜索者正在寻找该URL上的内容是很适合。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
什么是搜索引擎索引?
搜索引擎处理和存储他们在索引中找到的信息,这是一个包含他们发现的所有内容的巨大数据库,并且认为足以为搜索者提供服务。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
搜索引擎排名
当有人执行搜索时,搜索引擎会在他们的索引中搜索高度相关的内容,然后对这些内容进行排序,以期解决搜索者的查询。这种按相关性对搜索结果进行排序称为排名。一般来说,您可以假设网站排名越高,搜索引擎认为该网站与查询越相关。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
可以阻止搜索引擎爬虫访问您网站的部分或全部内容,或者指示搜索引擎避免将某些页面存储在其索引中。虽然这样做可能是有原因的,但如果您希望搜索者找到您的内容,您必须首先确保爬虫可以访问它并且可以索引。否则,它就像隐形一样好。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
在本章结束时,您将获得使用搜索引擎所需的上下文,而不是反对它!文章源自你的网络首码项目网-https://www.youranweb.com/150.html
在SEO中,并非所有搜索引擎都是平等的
许多初学者想知道特定搜索引擎的相对重要性。大多数人都知道Google拥有最大的市场份额,但针对Bing、Yahoo等进行优化有多重要?事实是,尽管存在30多个主要的网络搜索引擎,但SEO社区确实只关注谷歌。为什么?简短的回答是,谷歌是绝大多数人搜索网络的地方。如果我们将谷歌图片、谷歌地图和YouTube(谷歌的一个资产)包括在内,超过90%的网络搜索发生在谷歌上——这几乎是必应和雅虎加起来的20倍。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
爬行:搜索引擎能找到你的网页吗?
正如您刚刚了解到的,确保您的网站被抓取并编入索引是出现在SERP中的先决条件。如果您已经有一个网站,最好先查看索引中有多少页面。这将对Google是否正在抓取并找到您想要的所有页面以及您不想要的页面产生一些深刻的见解。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
检查索引页面的一种方法是“site:yourdomain.com”,这是一种高级搜索运算符。前往谷歌并在搜索栏中输入“site:yourdomain.com”。这将返回Google在其索引中针对指定站点的结果:文章源自你的网络首码项目网-https://www.youranweb.com/150.html
文章源自你的网络首码项目网-https://www.youranweb.com/150.html
在Google中搜索site:moz.com的屏幕截图,显示搜索框下方的结果数量。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
Google显示的结果数量(请参阅上面的“关于XX个结果”)并不准确,但它确实让您清楚地了解哪些页面已在您的网站上编入索引,以及它们当前在搜索结果中的显示方式。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
要获得更准确的结果,请监控和使用GoogleSearchConsole中的索引覆盖率报告。如果您目前没有免费的GoogleSearchConsole帐户,您可以注册一个。使用此工具,您可以为您的站点提交站点地图,并监控实际已将多少提交的页面添加到Google的索引等。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
如果您没有出现在搜索结果中的任何位置,可能有以下几个原因:文章源自你的网络首码项目网-https://www.youranweb.com/150.html
- 您的网站是全新的,尚未被抓取。
- 您的网站未链接到任何外部网站。
- 您网站的导航使机器人很难有效地抓取它。
- 您的网站包含一些称为爬虫指令的基本代码,这些代码会阻止搜索引擎。
- 您的网站因垃圾邮件策略而受到Google的处罚。
告诉搜索引擎如何抓取您的网站
如果您使用GoogleSearchConsole或“site:domain.com”高级搜索运算符,发现您的一些重要页面从索引中丢失和/或您的一些不重要页面被错误地编入索引,您可以进行一些优化实施以更好地指导Googlebot如何抓取您的网络内容。告诉搜索引擎如何抓取您的网站可以让您更好地控制索引中的内容。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
MozPro可以识别您网站的可抓取性问题,从阻止Google的关键抓取工具问题到影响排名的内容问题。立即免费试用并开始解决问题:文章源自你的网络首码项目网-https://www.youranweb.com/150.html
大多数人都在考虑确保Google可以找到他们的重要页面,但很容易忘记您可能不希望Googlebot找到某些页面。这些可能包括内容稀少的旧URL、重复URL(例如电子商务的排序和过滤参数)、特殊促销代码页、登台或测试页面等。文章源自你的网络首码项目网-https://www.youranweb.com/150.html
要引导Googlebot离开您网站的某些页面和部分,请使用robots.txt。
机器人.txt
Robots.txt文件位于网站的根目录(例如https://www.sinasz.cn/robots.txt),并建议您的网站搜索引擎应该和不应该抓取哪些部分,以及它们抓取您网站的速度,通过特定的robots.txt指令。
Googlebot如何处理robots.txt文件
- 如果Googlebot找不到某个网站的robots.txt文件,它会继续抓取该网站。
- 如果Googlebot发现某个网站的robots.txt文件,它通常会遵守建议并继续抓取该网站。
- 如果Googlebot在尝试访问网站的robots.txt文件时遇到错误并且无法确定该文件是否存在,它将不会抓取该网站。
优化抓取预算!
抓取预算是Googlebot在离开之前将在您的网站上抓取的平均网址数,因此抓取预算优化可确保Googlebot不会浪费时间抓取您不重要的页面,而可能会忽略您的重要页面。抓取预算在拥有数万个URL的大型网站上最为重要,但阻止抓取工具访问您绝对不关心的内容绝不是一个坏主意。只需确保不要阻止爬虫访问您添加了其他指令的页面,例如规范或noindex标记。如果Googlebot在某个页面上被阻止,它将无法看到该页面上的说明。
并非所有网络机器人都遵循robots.txt。不怀好意的人(例如,电子邮件地址抓取工具)构建不遵循此协议的机器人。事实上,一些不良行为者使用robots.txt文件来查找您的私人内容所在的位置。尽管阻止爬虫访问诸如登录和管理页面等私人页面似乎是合乎逻辑的,这样它们就不会出现在索引中,但将这些URL的位置放在可公开访问的robots.txt文件中也意味着有恶意的人可以更轻松地找到它们。最好对这些页面进行NoIndex并将它们关在登录表单后面,而不是将它们放在您的robots.txt文件中。
您可以在我们学习中心的robots.txt部分中阅读有关此内容的更多详细信息。
在GSC中定义URL参数
一些网站(最常见于电子商务)通过将某些参数附加到URL来使相同的内容在多个不同的URL上可用。如果您曾经在网上购物,您可能已经通过过滤器缩小了搜索范围。例如,您可以在亚马逊上搜索“鞋子”,然后按尺码、颜色和款式细化您的搜索。每次优化时,URL都会略有变化:
https://www.example.com/products/women/dresses/green.htmhttps://www.example.com/products/women?category=dresses&color=greenhttps://example.com/shopindex.php?product_id=32&highlight=green+dress&cat_id=1&sessionid=123$affid=43
Google如何知道向搜索者提供哪个版本的URL?Google在自己确定代表URL方面做得很好,但是您可以使用GoogleSearchConsole中的URL参数功能来告诉Google您希望他们如何处理您的页面。如果您使用此功能告诉Googlebot“不抓取带有____参数的URL”,那么您实际上是在要求对Googlebot隐藏此内容,这可能会导致这些页面从搜索结果中删除。如果这些参数创建重复页面,这就是您想要的,但如果您希望这些页面被索引,则不理想。
爬虫能找到你所有的重要内容吗?
现在您已经了解了一些确保搜索引擎抓取工具远离您的不重要内容的策略,让我们了解可以帮助Googlebot找到您的重要页面的优化。
有时,搜索引擎将能够通过抓取找到您网站的某些部分,但其他页面或部分可能由于某种原因而被遮挡。确保搜索引擎能够发现您想要索引的所有内容,而不仅仅是您的主页,这一点很重要。
问问自己这个问题:机器人可以爬过你的网站,而不仅仅是爬到它上面吗?
一个用木板封起来的门,代表一个可以爬到但不能爬过的站点。
您的内容是否隐藏在登录表单后面?
如果您要求用户在访问某些内容之前登录、填写表格或回答调查,搜索引擎将不会看到这些受保护的页面。爬虫肯定不会登录。
您是否依赖搜索表单?
机器人不能使用搜索表单。有些人认为,如果他们在他们的网站上放置一个搜索框,搜索引擎将能够找到访问者搜索的所有内容。
文本是否隐藏在非文本内容中?
不应使用非文本媒体形式(图像、视频、GIF等)来显示您希望被索引的文本。虽然搜索引擎在识别图像方面做得越来越好,但不能保证他们能够阅读和理解它。最好在网页的<HTML>标记中添加文本。
搜索引擎可以跟随您的网站导航吗?
正如爬虫需要通过来自其他站点的链接来发现您的站点一样,它也需要您自己站点上的链接路径来引导它从一个页面到另一个页面。如果您有一个希望搜索引擎找到的页面,但它没有与任何其他页面链接,那么它就像不可见一样好。许多网站都犯了一个严重错误,即以搜索引擎无法访问的方式构建导航结构,从而阻碍了它们在搜索结果中列出的能力。
爬虫如何找到链接到的页面的描述,而在您的站点导航中未链接到的页面作为孤岛存在,无法发现。
常见的导航错误可能会阻止爬虫查看您的所有网站:
- 拥有显示与桌面导航不同结果的移动导航
- 菜单项不在HTML中的任何类型的导航,例如启用JavaScript的导航。谷歌在抓取和理解Javascript方面做得更好,但它仍然不是一个完美的过程。确保某些内容被Google找到、理解和索引的更可靠的方法是将其放入HTML中。
- 个性化,或向特定类型的访问者显示独特的导航而不是其他人,可能看起来像是在隐藏搜索引擎爬虫
- 忘记通过导航链接到您网站上的主页-请记住,链接是爬虫跟踪到新页面的路径!
这就是为什么您的网站必须具有清晰的导航和有用的URL文件夹结构的原因。
你有干净的信息架构吗?
信息架构是在网站上组织和标记内容以提高用户效率和可查找性的实践。最好的信息架构是直观的,这意味着用户不必费力思考就可以浏览您的网站或查找某些内容。
你在使用站点地图吗?
站点地图就是它听起来的样子:您网站上的URL列表,爬虫可以使用这些URL来发现和索引您的内容。确保Google找到您的最高优先级页面的最简单方法之一是创建一个符合Google标准的文件并通过GoogleSearchConsole提交。虽然提交站点地图并不能取代对良好站点导航的需求,但它肯定可以帮助爬虫找到通往所有重要页面的路径。
如果您的站点没有任何其他站点链接到它,您仍然可以通过在GoogleSearchConsole中提交您的XML站点地图来将其编入索引。不能保证他们会在索引中包含提交的URL,但值得一试!
爬虫在尝试访问您的URL时是否会出错?
在抓取您网站上的URL的过程中,抓取工具可能会遇到错误。您可以转到GoogleSearchConsole的“抓取错误”报告来检测可能发生这种情况的URL-此报告将向您显示服务器错误和未找到的错误。服务器日志文件也可以向您显示这一点,以及其他信息的宝库,例如爬网频率,但由于访问和剖析服务器日志文件是一种更高级的策略,我们不会在初学者指南中详细讨论它,尽管您可以在此处了解更多信息。
在您可以对爬网错误报告做任何有意义的事情之前,了解服务器错误和“未找到”错误非常重要。
4xx代码:当搜索引擎爬虫由于客户端错误而无法访问您的内容时
4xx错误是客户端错误,这意味着请求的URL包含错误的语法或无法实现。最常见的4xx错误之一是“404–未找到”错误。这些可能是由于URL拼写错误、页面被删除或重定向损坏,仅举几个例子。当搜索引擎遇到404时,他们无法访问该URL。当用户点击404时,他们可能会感到沮丧并离开。
5xx代码:当搜索引擎爬虫由于服务器错误而无法访问您的内容时
5xx错误是服务器错误,表示网页所在的服务器未能满足搜索者或搜索引擎访问该页面的请求。在GoogleSearchConsole的“抓取错误”报告中,有一个专门针对这些错误的选项卡。这些通常是因为对URL的请求超时,因此Googlebot放弃了该请求。查看Google的文档以了解有关修复服务器连接问题的更多信息。
值得庆幸的是,有一种方法可以告诉搜索者和搜索引擎您的页面已移动-301(永久)重定向。
创建自定义404页面!
通过添加指向您网站上重要页面的链接、网站搜索功能甚至联系信息来自定义您的404页面。这应该可以降低访问者在遇到404时跳出您的网站的可能性。
将一个页面重定向到另一个页面的描述。
假设您将页面从example.com/young-dogs/移动到example.com/puppies/。搜索引擎和用户需要一个从旧 URL 到新 URL 的桥梁。该网桥是 301 重定向。
当您执行 301 时: | 当您不实施 301 时: | |
---|---|---|
链接资产 | 将链接权益从页面的旧位置转移到新 URL。 | 如果没有 301,来自先前 URL 的权限不会传递到新版本的 URL。 |
索引 | 帮助 Google 查找页面的新版本并将其编入索引。 | 仅在您的网站上存在 404 错误不会损害搜索性能,但是让排名/被交易的页面 404 可能会导致它们从索引中掉出来,而排名和流量也会随之而来——哎呀! |
用户体验 | 确保用户找到他们正在寻找的页面。 | 允许访问者点击死链接会将他们带到错误页面而不是预期页面,这可能会令人沮丧。 |
301状态代码本身意味着页面已永久移动到新位置,因此请避免将URL重定向到不相关的页面——旧URL的内容实际上并不存在的URL。如果一个页面正在针对某个查询进行排名,而您将其301转到具有不同内容的URL,则它的排名位置可能会下降,因为使其与该特定查询相关的内容不再存在。301功能强大——负责任地移动URL!
您还可以选择302重定向页面,但这应该保留用于临时移动以及传递链接公平性不那么重要的情况。302有点像绕道而行。您暂时通过特定路线吸引流量,但不会永远这样。
注意重定向链!
如果Googlebot必须经过多次重定向,它可能很难到达您的页面。谷歌称这些为“重定向链”,他们建议尽可能限制它们。如果您将example.com/1重定向到example.com/2,然后决定将其重定向到example.com/3,最好消除中间人并将example.com/1重定向到example.com/3。
一旦您确保您的网站针对可抓取性进行了优化,接下来的工作就是确保它可以被索引。
索引:搜索引擎如何解释和存储您的页面?
一旦您确保您的网站已被抓取,接下来的工作就是确保它可以被编入索引。没错——仅仅因为您的网站可以被搜索引擎发现和抓取并不一定意味着它将存储在他们的索引中。在前面关于抓取的部分中,我们讨论了搜索引擎如何发现您的网页。索引是您发现的页面的存储位置。爬虫找到一个页面后,搜索引擎会像浏览器一样呈现它。在此过程中,搜索引擎会分析该页面的内容。所有这些信息都存储在其索引中。
一个在图书馆里存放书籍的机器人。
继续阅读以了解索引的工作原理以及如何确保您的网站进入这个非常重要的数据库。
我可以查看Googlebot抓取工具如何查看我的网页吗?
是的,您网页的缓存版本将反映Googlebot上次抓取它的快照。
谷歌以不同的频率抓取和缓存网页。更成熟、更知名的网站,如https://www.nytimes.com等频繁发帖的网站将比RogertheMozbot的小众网站http://www.rogerlovescupcakes更频繁地被抓取。.(如果它是真的……)
您可以通过单击SERP中URL旁边的下拉箭头并选择“缓存”来查看页面的缓存版本:
在SERP中查看缓存结果的位置的屏幕截图。
您还可以查看站点的纯文本版本,以确定您的重要内容是否被有效地抓取和缓存。
页面是否曾从索引中删除?
是的,页面可以从索引中删除!可能会删除URL的一些主要原因包括:
- URL正在返回“未找到”错误(4XX)或服务器错误(5XX)–这可能是意外的(页面已移动且未设置301重定向)或故意的(页面已被删除并404ed以便将其从索引中删除)
- 该URL添加了一个noindex元标记-站点所有者可以添加此标记,以指示搜索引擎从其索引中省略该页面。
- 该URL已因违反搜索引擎的网站管理员指南而受到人工处罚,因此已从索引中删除。
- 该URL已被阻止抓取,并在访问者访问该页面之前添加了所需的密码。
如果您认为您网站上以前在Google索引中的页面不再显示,您可以使用URL检查工具了解该页面的状态,或使用具有“请求索引”功能的FetchasGoogle向索引提交单个URL。(奖励:GSC的“获取”工具还有一个“渲染”选项,可让您查看Google如何解释您的页面是否存在任何问题)。
告诉搜索引擎如何索引您的网站
机器人元指令
元指令(或“元标签”)是您可以向搜索引擎提供的关于您希望如何处理您的网页的指令。
您可以告诉搜索引擎爬虫“不要在搜索结果中将此页面编入索引”或“不要将任何链接权益传递给任何页面链接”。这些指令通过HTML页面的<head>中的机器人元标记(最常用)或通过HTTP标头中的X-Robots-Tag执行。
机器人元标记
漫游器元标记可在网页HTML的<head>中使用。它可以排除所有或特定的搜索引擎。以下是最常见的元指令,以及您可以应用它们的情况。
index/noindex告诉引擎是否应该抓取页面并将其保存在搜索引擎的索引中以进行检索。如果您选择使用“noindex”,则表示您希望将页面从搜索结果中排除在外。默认情况下,搜索引擎假定它们可以索引所有页面,因此没有必要使用“index”值。
- 什么时候可以使用:如果您尝试从Google的网站索引中修剪精简页面(例如:用户生成的个人资料页面),但您仍然希望访问者可以访问它们,您可能会选择将页面标记为“noindex”。
follow/nofollow告诉搜索引擎页面上的链接是应该被关注还是不被关注。“关注”会导致机器人跟随您页面上的链接并将链接资产传递到这些URL。或者,如果您选择使用“nofollow”,搜索引擎将不会跟随或传递任何链接权益到页面上的链接。默认情况下,假定所有页面都具有“关注”属性。
- 什么时候可以使用:当你试图阻止页面被索引以及阻止爬虫跟踪页面上的链接时,nofollow通常与noindex一起使用。
noarchive用于限制搜索引擎保存页面的缓存副本。默认情况下,引擎将保留其已编入索引的所有页面的可见副本,搜索者可以通过搜索结果中的缓存链接访问。
什么时候可以使用:如果您经营一个电子商务网站并且您的价格经常变化,您可能会考虑使用noarchive标签来防止搜索者看到过时的价格。
以下是元机器人noindex、nofollow标签的示例:
<!DOCTYPE html><html><head><meta name="robots" content="noindex, nofollow" /></head><body>...</body></html>
此示例将所有搜索引擎排除在索引页面和跟踪任何页面链接之外。如果您想排除多个爬虫,例如googlebot和bing,可以使用多个机器人排除标记。
元指令影响索引,而不是爬网
Googlebot需要抓取您的网页才能查看其元指令,因此如果您试图阻止抓取工具访问某些网页,则元指令不是这样做的方法。必须抓取机器人标签才能得到尊重。
X-Robots-标签
x-robots标签用于URL的HTTP标头中,如果您想大规模阻止搜索引擎,则比元标签提供更多的灵活性和功能,因为您可以使用正则表达式、阻止非HTML文件并应用站点范围的noindex标签.
例如,您可以轻松排除整个文件夹或文件类型(如moz.com/no-bake/old-recipes-to-noindex):
<Files ~ “\/?no\-bake\/.*”> 标头集 X-Robots-Tag “noindex, nofollow”</Files>
机器人元标记中使用的衍生物也可以用于X-Robots-Tag。
或特定文件类型(如PDF):
<Files ~ “\.pdf$”> 标题集 X-Robots-Tag “noindex, nofollow”</Files>
有关元机器人标签的更多信息,请浏览Google的机器人元标签规范。
WordPress提示:
在仪表板>设置>阅读中,确保未选中“搜索引擎可见性”框。这会阻止搜索引擎通过您的robots.txt文件访问您的网站!
了解影响抓取和索引的不同方式将帮助您避免常见的陷阱,这些陷阱会阻止您的重要页面被发现。
排名:搜索引擎如何对URL进行排名?
搜索引擎如何确保当有人在搜索栏中输入查询时,他们会得到相关的结果作为回报?该过程称为排名,或按与特定查询最相关到最不相关对搜索结果进行排序。
排名的艺术诠释,三只狗漂亮地坐在第一、第二和第三名的基座上。
为了确定相关性,搜索引擎使用算法、过程或公式,通过该过程或公式以有意义的方式检索和排序存储的信息。这些算法多年来经历了许多变化,以提高搜索结果的质量。例如,谷歌每天都会对算法进行调整——其中一些更新是细微的质量调整,而另一些则是为解决特定问题而部署的核心/广泛算法更新,例如Penguin解决链接垃圾邮件。查看我们的Google算法更改历史记录,了解可追溯到2000年的已确认和未确认的Google更新列表。
为什么算法变化如此频繁?谷歌只是想让我们保持警惕吗?虽然谷歌并不总是透露他们为什么这样做的细节,但我们知道谷歌在进行算法调整时的目标是提高整体搜索质量。这就是为什么在回答算法更新问题时,谷歌会回答类似这样的话:“我们一直在进行质量更新。”这表明,如果您的网站在算法调整后遭受损失,请将其与Google的质量指南或搜索质量评估指南进行比较,两者都非常能说明搜索引擎想要什么。
搜索引擎想要什么?
搜索引擎一直想要同样的事情:以最有用的格式为搜索者的问题提供有用的答案。如果这是真的,那么为什么现在的SEO似乎与过去几年不同?
从某人学习一门新语言的角度来考虑它。
起初,他们对语言的理解非常初级——“SeeSpotRun”。随着时间的推移,他们的理解开始加深,他们学习语义——语言背后的含义以及单词和短语之间的关系。最终,通过足够的练习,学生对语言的了解足以甚至理解细微差别,并且能够为甚至模糊或不完整的问题提供答案。
当搜索引擎刚刚开始学习我们的语言时,通过使用实际上违反质量准则的技巧和策略来玩弄系统要容易得多。以关键字填充为例。如果您想为“有趣的笑话”之类的特定关键字排名,您可以在页面上多次添加“有趣的笑话”一词,并将其加粗,以期提高该词的排名:
欢迎来到有趣的笑话!我们讲世界上最有趣的笑话。有趣的笑话既有趣又疯狂。你有趣的笑话在等着你。坐下来阅读有趣的笑话,因为有趣的笑话可以让你快乐和有趣。一些有趣的最喜欢的笑话。
这种策略带来了糟糕的用户体验,人们不是因为有趣的笑话而大笑,而是被烦人的、难以阅读的文字轰炸。它在过去可能有效,但这绝不是搜索引擎想要的。
链接在SEO中的作用
当我们谈论链接时,我们可能意味着两件事。反向链接或“入站链接”是指向您网站的其他网站的链接,而内部链接是您自己网站上指向您的其他页面(在同一网站上)的链接。
入站链接和内部链接如何工作的描述。
链接历来在搜索引擎优化中发挥了重要作用。很早以前,搜索引擎需要帮助确定哪些URL比其他URL更值得信赖,以帮助他们确定如何对搜索结果进行排名。计算指向任何给定站点的链接数量有助于他们做到这一点。
反向链接的工作方式与现实生活中的WoM(口碑)推荐非常相似。让我们以假设的咖啡店Jenny'sCoffee为例:
- 来自他人的推荐=权威的良好标志
示例:许多不同的人都告诉过你珍妮的咖啡是城里最好的
- 来自你自己的推荐=有偏见,所以不是权威的好兆头
示例:珍妮声称珍妮的咖啡是城里最好的
- 来自不相关或低质量来源的推荐=不是一个好的权威标志,甚至可能让您被标记为垃圾邮件
示例:珍妮花钱请从未去过她的咖啡店的人告诉别人它有多好。
- 没有推荐=权限不明确
示例:Jenny'sCoffee可能不错,但您一直找不到任何有意见的人,因此您无法确定。
这就是创建PageRank的原因。PageRank(谷歌核心算法的一部分)是一种链接分析算法,以谷歌创始人之一拉里佩奇的名字命名。PageRank通过测量指向它的链接的质量和数量来估计网页的重要性。假设网页越相关、重要和值得信赖,它获得的链接就越多。
您从高权威(可信)网站获得的自然反向链接越多,您在搜索结果中排名更高的几率就越大。
内容在SEO中的作用
如果他们没有将搜索者引导到某些东西,那么链接将毫无意义。那就是满足!内容不仅仅是文字;它是搜索者消费的任何东西——有视频内容、图像内容,当然还有文本。如果搜索引擎是回答机器,那么内容就是引擎提供这些答案的方式。
任何时候有人执行搜索,都会有数千个可能的结果,那么搜索引擎如何决定搜索者会找到哪些有价值的页面?确定您的页面对给定查询的排名的很大一部分是您页面上的内容与查询意图的匹配程度。换句话说,这个页面是否与被搜索的词匹配并有助于完成搜索者试图完成的任务?
由于对用户满意度和任务完成的关注,没有严格的基准来说明您的内容应该多长、应该包含多少次关键字或您在标题标签中放置的内容。所有这些都可以影响页面在搜索中的表现,但重点应该放在将阅读内容的用户身上。
今天,有数百甚至数千个排名信号,前三名保持相当一致:指向您网站的链接(用作第三方可信度信号)、页面内容(满足搜索者意图的高质量内容)和排名大脑。
什么是RankBrain?
RankBrain是Google核心算法的机器学习组件。机器学习是一种计算机程序,它通过新的观察和训练数据随着时间的推移不断改进其预测。换句话说,它一直在学习,因为它一直在学习,所以搜索结果应该不断改进。
例如,如果RankBrain注意到排名较低的URL比排名较高的URL为用户提供了更好的结果,那么您可以打赌RankBrain会调整这些结果,将相关性更高的结果移到更高的位置,并将相关性较低的页面作为副产品降级。
一张显示结果如何变化的图像,并且其波动性足以在数小时后显示不同的排名。
与搜索引擎的大多数事情一样,我们并不确切知道RankBrain是由什么组成的,但显然,谷歌的人也不知道。
这对SEO意味着什么?
由于Google将继续利用RankBrain来推广最相关、最有用的内容,因此我们需要比以往任何时候都更加专注于满足搜索者的意图。为可能登陆您页面的搜索者提供最好的信息和体验,您已经迈出了在RankBrain世界中表现出色的第一步。
参与度指标:相关性、因果关系还是两者兼而有之?
对于谷歌排名,参与度指标很可能是部分相关性和部分因果关系。
当我们说参与度指标时,我们指的是代表搜索者如何通过搜索结果与您的网站互动的数据。这包括以下内容:
- 点击次数(来自搜索的访问)
- 页面停留时间(访问者在离开页面之前在页面上花费的时间)
- 跳出率(用户仅查看一页的所有网站会话的百分比)
- Pogo-sticking(点击一个自然结果,然后快速返回SERP以选择另一个结果)
许多测试,包括Moz自己的排名因素调查,都表明参与度指标与更高的排名相关,但因果关系一直受到激烈争论。良好的参与度指标是否仅表明排名较高的网站?还是网站排名靠前是因为它们拥有良好的参与度指标?
谷歌所说的
虽然他们从未使用过“直接排名信号”一词,但谷歌已经明确表示他们绝对使用点击数据来修改特定查询的SERP。
根据Google前搜索质量主管UdiManber的说法:
“排名本身会受到点击数据的影响。如果我们发现,对于一个特定的查询,80%的人点击#2,只有10%的人点击#1,一段时间后我们会发现#2可能是人们想要的,所以我们会切换它。”
前谷歌工程师EdmondLau的另一条评论证实了这一点:
“很明显,任何合理的搜索引擎都会在自己的结果中使用点击数据来反馈给排名,以提高搜索结果的质量。如何使用点击数据的实际机制通常是专有的,但谷歌很明显它使用点击数据及其专利系统,如排名调整的内容项目。”
由于谷歌需要维护和提高搜索质量,参与度指标似乎不可避免地不仅仅是相关性,但谷歌似乎没有将参与度指标称为“排名信号”,因为这些指标用于提高搜索质量,而单个URL的排名只是其中的一个副产品。
哪些测试证实了
各种测试已经证实,谷歌将调整SERP顺序以响应搜索者的参与:
- RandFishkin的2014年测试在让大约200人点击SERP中的URL后,将排名第7的结果上升到排名第一的位置。有趣的是,排名提升似乎与访问链接的人的位置无关。在许多参与者所在的美国,排名位置飙升,而在谷歌加拿大、谷歌澳大利亚等页面上的排名仍然较低。
- 拉里·金(LarryKim)对排名靠前的页面及其在RankBrain前后的平均停留时间进行的比较似乎表明,谷歌算法的机器学习组件降低了人们不会花费太多时间的页面的排名位置。
- DarrenShaw的测试也显示了用户行为对本地搜索和地图包结果的影响。
- 由于用户参与度指标显然用于调整SERP的质量,并将位置变化列为副产品,因此可以肯定地说SEO应该针对参与度进行优化。参与度不会改变您网页的客观质量,而是相对于该查询的其他结果而言,您对搜索者的价值。这就是为什么在您的页面或其反向链接没有更改后,如果搜索者的行为表明他们更喜欢其他页面,则排名可能会下降。
- 就网页排名而言,参与度指标就像一个事实检查器。链接和内容等客观因素首先对页面进行排名,然后如果Google做得不对,参与度指标会帮助Google进行调整。
搜索结果的演变
当搜索引擎缺乏今天的复杂性时,“10个蓝色链接”一词被创造出来来描述SERP的扁平结构。每次执行搜索时,Google都会返回一个包含10个自然结果的页面,每个结果都采用相同的格式。
10个蓝色链接SERP的屏幕截图。
在这个搜索领域,保持第一名是SEO的圣杯。但后来发生了一些事情。谷歌开始在他们的搜索结果页面上添加新格式的结果,称为SERP功能。其中一些SERP功能包括:
- 付费广告
- 精选片段
- 人们也问盒子
- 本地(地图)包
- 知识面板
- 附加链接
谷歌一直在添加新的。他们甚至尝试了“零结果SERP”,在这种现象中,知识图谱中只有一个结果显示在SERP上,下面没有结果,除了“查看更多结果”的选项。
这些功能的添加引起了一些最初的恐慌,主要有两个原因。一方面,其中许多功能导致有机结果在SERP上被进一步推低。另一个副产品是,更少的搜索者点击有机结果,因为更多的查询正在SERP本身上得到回答。
那么谷歌为什么要这样做呢?这一切都可以追溯到搜索体验。用户行为表明不同的内容格式可以更好地满足某些查询。请注意不同类型的 SERP 功能如何匹配不同类型的查询意图。
查询意图 | 可能触发的 SERP 功能 |
---|---|
信息性 | 精选片段 |
一个答案的信息 | 知识图/即时答案 |
当地的 | 地图包 |
事务性的 | 购物 |
我们将在第3章中详细讨论意图,但就目前而言,重要的是要知道答案可以以多种格式传递给搜索者,以及您如何构建内容会影响它在搜索中出现的格式。
本地化搜索
像谷歌这样的搜索引擎拥有自己的本地企业列表专有索引,并从中创建本地搜索结果。
如果您正在为具有客户可以访问的物理位置的企业(例如:牙医)或旅行以访问其客户的企业(例如:管道工)执行本地SEO工作,请确保您声明、验证和优化免费的Google我的商家信息。
在本地化搜索结果方面,谷歌使用三个主要因素来确定排名:
- 关联
- 距离
- 突出
关联
相关性是本地企业与搜索者所寻找的内容的匹配程度。为确保商家尽其所能与搜索者相关,请确保商家信息填写完整且准确。
距离
Google使用您的地理位置来更好地为您提供本地搜索结果。本地搜索结果对邻近度极为敏感,邻近度指的是搜索者的位置和/或查询中指定的位置(如果搜索者包括一个)。
有机搜索结果对搜索者的位置很敏感,但很少像在本地包结果中那样明显。
突出
以知名度为一个因素,谷歌正在寻求奖励在现实世界中知名的企业。除了企业的线下知名度外,Google还会参考一些在线因素来确定本地排名,例如:
评论
本地企业收到的Google评论数量以及这些评论的情绪对其在本地搜索结果中排名的能力有显着影响。
引文
“企业引文”或“企业列表”是在本地化平台(Yelp、Acxiom、YP、Infogroup、Localeze等)上对本地企业“NAP”(名称、地址、电话号码)的网络引用。.
本地排名受本地商业引用的数量和一致性的影响。谷歌从各种来源中提取数据,以不断构成其本地商业指数。当Google发现对企业名称、位置和电话号码的多个一致引用时,它会加强Google对该数据有效性的“信任”。然后,这导致谷歌能够以更高的信心展示业务。Google还使用来自网络上其他来源的信息,例如链接和文章。
有机排名
SEO最佳实践也适用于本地SEO,因为Google在确定本地排名时还会考虑网站在自然搜索结果中的位置。
在下一章中,您将学习有助于Google和用户更好地理解您的内容的页面最佳实践。
[奖金!]本地参与
尽管Google并未将其列为本地排名因素,但参与度的作用只会随着时间的推移而增加。谷歌通过整合真实世界的数据(如热门访问时间和平均访问时长)不断丰富本地搜索结果...
“热门访问时间”的屏幕截图导致本地搜索。
...甚至为搜索者提供了提出业务问题的能力!
问题和答案的屏幕截图导致本地搜索。
毫无疑问,现在本地结果比以往任何时候都更受现实世界数据的影响。这种交互性是搜索者如何与本地企业互动和响应的方式,而不是像链接和引用这样的纯粹静态(和可游戏)信息。
由于谷歌希望为搜索者提供最好的、最相关的本地企业,因此他们使用实时参与度指标来确定质量和相关性是非常有意义的。
您不必了解Google算法的来龙去脉(这仍然是一个谜!),但现在您应该对搜索引擎如何查找、解释、存储和排名内容有一个很好的基本知识。有了这些知识,让我们学习如何在第3章(关键字研究)中选择您的内容所针对的关键字!

评论