设为首页 | 收藏本站欢迎来到卓越网络免费免备案CDN加速,DDoS和CC攻击防御,高防CDN管理平台!

已阅读

如何处理电商网站SEO重复内容

作者:cdnfine      来源:cdnfine      发布时间:2019-05-13

无论是电子商务网站,还是其他类型的网站,重复内容或薄内容都很容易给网站自然排名带来灾难性后果。为了解决这个痛点,以下将会通过实例的方式,给大家深入讲解电子商务网站常见的各种重复内容场景,为SEO人员提供一个丰富的指南。

重复内容的定义

内容,是谷歌三大排名因素之一。自从熊猫算法更新以来,谷歌一直都很重视页面内容的质量,特别是重复内容和薄内容。谷歌内容指南对重复内容的定义为:

重复内容通常是指网域内或网域间与其他内容完全匹配或大致类似的大量内容。大多数情况下,重复内容本身不具有欺骗性。非恶意性重复内容可能包括:

  • 能够生成用于移动设备的常规和简化网页的论坛

  • 通过多个不同网址显示或链接的存储项

  • 网页的可打印版本

除非重复内容看上去意在欺骗用户以及操纵搜索引擎结果,否则,我们不会对含有重复内容的网站采取措施。

虽然谷歌不对重复内容惩罚,但是不鼓励创建重复内容,毕竟重复内容的页面质量得分也不会高,而且很多的无意义的重复内容会浪费谷歌的抓取配额。

内部重复内容

由于技术和编辑的原因,电子商务网站内部存在多种形式的重复内容,特别是大型网站,由于历史原因,有些重复内容处理起来特别头痛,以下会用实例的方式做深入讲解。

内部技术重复内容

以下几种形式重复内容实例,是由于电子商务网站内容管理系统(CMS)本身或者相关代码的技术原因造成的。推荐阅读:《cdn加速如何找准用户内容消费需求?

非规范化网址

规范化网址,指的是帮助搜索引擎选择页面最合适的网址作为标准的版本(或者说主推的版本)。但是由于技术或营销推广的原因会导致各种非规范化的网址,比如,做站外(联盟,社交,红人)推广时,会在网址末尾附加一个广告参数来跟踪流量来源(即 ?a_aid =,?utm_source=等)。还有,在产列表排序功能中,添加不同排序参数到网址的末尾(即 ?order=,?sort=等)。另外,同一款产品有多个颜色、尺寸时,页面内容除了颜色、尺寸外,并无其他差异时(即?color=,?size=等)。这些情况都可以在页面里面配置Canonical 标签指向规范花网址(放在<head>中)来阻止搜索引擎抓取重复的页面。

网址类型 非规范化网址 规范化网址
社交跟踪网址 http://www.example.com/cell-phone/?utm_source=facebook http://www.example.com/cell-phone/
已排序的网址 http://www.example.com/cell-phone/?order=high-price http://www.example.com/cell-phone/
同一款产品有多个颜色 http://www.example.com/huawei-p30/?color=black(主推)
http://www.example.com/huawei-p30/?color=red
http://www.example.com/huawei-p30/?color=black

 

会话ID

许多电子商务网站使用网址中的会话ID(即 ?sessionid=)来跟踪用户行为。这会导致跟原本网址重复。其中一种解决方法,就是可以使用Cookie来跟踪用户会话,而不是将会话ID代码附加到网址的末尾。但是,如果会话ID一定要附加到网址的末尾,则可以将会话ID网址canonical指向原本网址来解决此问题。或者可以将会话ID的页面meta robots设置为noindex,follow,但如果有人将会话ID链接做站外推广,则会导致页面权重的流失。又或者通过robots.txt文件将会话ID网址全部禁止抓取,当然这样做有可能会影响到抓取预算。例:
User-agent: *
Disallow: *?sessionid=*

购物车页面

当用户将产品添加到购物车并查看其购物车时,大多数CMS系统都有购物车页面管理这些产品。这样的页面其实对于搜索引擎毫无意义,可以直接通过robots.txt文件禁止谷歌的抓取,或者通过meta robots配置 noindex,nofollow来源禁止谷歌抓取及跟踪链接。

站内搜索结果页

通常电子商务网站都有站内搜索的功能,方便用户搜索到需要的产品,当时用户搜索词很多情况下是比较宽泛,且搜索词各种各样。会产生大量相关度不高、重复内容的页面。前谷歌员工的Matt Cutts明确表示,用户不希望在谷歌搜索结果看到网站内部的搜索结果(来源)。这是电子商务网站很常见的问题。这种问题,可以将站内搜索结果页面设置为“noindex,follow”来解决。或者直接通过robots.txt文件禁止谷歌的抓取,这种方法简单有效。不然很容易导致谷歌熊猫算法的排名惩罚。

产品评论页

电子商务网站通常都是用评论的功能。很多网站,会创建单独的“评论页面”来托管相对应产品的所有评论,但是会有相同的一部分(一般不显示全部,而是显示前10/15条等)评论显示在产品页面上。这样就会导致产品页下评论跟相应的产品评论页面之间内容部分重复。

这样情况将产品评论页最好canonical指向相对应的产品页。当然要保留“评论页”也不是不可以,但要满足两个条件,1、评论页的评论等相关内容展示跟产品页评论展示要有足够的差异化,2、足够多原创的评论内容。

一般的情况不建议单独创建评论页面,2019年3月21日谷歌站长Twitter官方声明“用户喜欢单页内容”(见下图)。由此可见,将单个页面做强、内容更加有深度对搜索引擎或用户都更有意义。实际上,自从2011年谷歌熊猫更新开始,谷歌就开始逐步注重单个页面内容质量,特别是2014年熊猫4.0算法更新后,之前靠大量质量不高的页面做关键词排名,已经落入了下风,应专注于将页面做强。

如何处理电商网站SEO重复内容

来源:https://twitter.com/googlewmc/status/1108726443251519489


带WWW与不带WWW网址

虽然电子商务发展了这么多年,但是还是有不少电子商务网站,会存在不带www(http://example.com)与带www(http://www.example.com)的两版本的网址,这样就会造成大量的重复页面。因此,选其中一个作为首选版本是重要的,并且301重定向到首选的版本,建议将带www版本作为首选版本,因为带www版本已经是用户习惯本看到了,这样会对用户更可信(与其说用户是上帝,不如说用户就喜欢找茬),而电子商务网站又涉及到金钱交易,这就更重要了。另外,你也可以到谷歌网站站长后台设置首选域来解决此问题。

网址末尾的斜杠“/”

由于技术原因,在网址末尾额外附加上斜杠时,都会返回跟原网址重复的内容,这个问题是很容易不注意到的,这种情况可以将其中一个版本网址301重定向到另外一个版本的网址来解决。如果是新建的网站,可以将其中之一返回404。

HTTPS网址

为了保护用户隐私信息(如密码,交易银行卡等),电子商务网站都配置了https版本的网址,这样就会导致与http版本内容重复,将http版本301重定向到https版本即可。

总之,技术原因造成重复页面是电子商务网站很重要的问题,特别是对于大型网站,技术造成重复内容尽可能在技术源头解决,不然会像定时炸弹,随时爆炸,后患无穷,你想想看,还有那些不良竞争对手日夜想着黑你啊。

内部“编辑”重复内容

产品之间共用相同的内容

许多电子商务网站,在相同类目或相似产品中,都会加入一段相同文字描述介绍,有些电商网站目的为了做灰度SEO,来增加页面长尾关键词。这样其实对于搜索引擎很不友好,对用户也不友好,这些相同的描述可以直接删除,或者修改成原创的对用户有意义的内容。特别是对于垂直的中小型电子商务网站,没有足够权重来源(无大量外链或产品支撑等)去跟大的电子商务网站竞争,更应该做好原创的内容,还有页面设计风格、布局等也尽量原创,文字各处细节也尽量差异化、有新意。

类别页面

电子商务网站上的类别页面通常仅包含产品标题和图片。页面上基本没什么实质的文字内容。解决这个问题的常见方法是在类别页面的顶部添加一段原创的描述(不是底部,搜索引擎给予内容的权重较小)。当然有些电商网站在顶部增加了筛选条件,或者图片广告等,这样就会占据了一定空间,这样产品就会往下展示了,特别是对于移动端来说,手机屏幕太小,这样导致用户无法第一时间(或第一屏)看到想要的产品,对用户有可能不友好。这种情况下可以将这段文字描述添加到网页底部。通常100-300字的文字描述长度即可,但不仅限于这个长度,可以将产品往深度去挖掘内容,讲好故事,将产品的情感带给用户,以便拓展更多的长尾词,带来更多自然流量关键词排名的机会。

外部重复内容

电子商务网站互相之间存在的重复内容一直以来都是痛点,特别是中小型电商网站与平台类型电商网站(amazon, aliexpress,ebay等)之间,更是如此。由于谷歌还是主要以外链链接因素来计算排名的(或如Moz DA值),因此通常网站的外链过少时,且存在外部重复内容时,很难获取到好的自然关键词排名。以下会深入讲一些常见的外部重复内容的形式,帮助大家找到更好的方向做好搜索营销优化。

供应商的产品描述

很多电子商务网站会直接复制产品供应商提供的产品说明,并将它们放在自己的产品页面上时,这样就会直接降低页面的质量。在搜索引擎的算法分析中,这些网站没有为用户提供任何独特的价值,因此他们会优先选择对大型电商网站(拥有更强大,更高质量的外链链接)进行排名,虽然他们也可能使用相同的网站产品描述。解决此问题的唯一方法是开始重写现有产品的描述,同时确保上传新品时也要使用原创的产品描述。

根据个人的经验,对于某些产品的生命周期比较短,更新迭代比较快,它们会很快就会进入缺货状态,这样的产品简要写下产品原创描述就好了。保障整个项目的投资回报率。还有,重写那些即将要下架的产品,或者确保新品使用原创的产品描述,这样新品的原创描述就会拥有完整的生命周期,两者相比,通常前者的投资回报更低。这些是在规划产品描述重写项目时重点考虑的事项。

除了产品描述外,增加产品页面原创度的其他方式还包括图片,视频和用户生成的评论。这些也是很值得优化的。

内部测试网站

为了保证产品功能正常上线,一般开发团队会提供内部测试网站提供测试检查。这样就会跟实际网站完全重复,这种下面几种方式就很好解决了:

  • 给测试网站每个页面添加meta robots“nofollow,follow”标签。

  • 在测试站点的robots.txt文件中添加“Disallow:/”命令,来完全禁止搜索引擎的抓取。

  • 通过设置登录密码访问测试网站。

  • 只允许内部IP访问测试网站。
     

产品在多个平台上复用

大部分公司,除了自己本身的电子商务网站外,通常也会将产品扩展到第三方电商网站(如amazon, ebay, aliexpress等),来扩大公司的销售机会。这样就会导致不同域名之间产品内容重复。通常,第三方电商网站权重更高,导致产品在自己网站的自然搜索排名比在第三方网站上更低。

这个问题的解决方案是:确保提供给第三方网站的产品描述与电子商务网站上的产品描述不同。建议将供应商的产品描述提供给第三方电商网站,并为您自己的电子商务网站重写更好,更独特的产品描述。在内容方面,始终为自己的网站提供优势。别正面硬刚,猥琐发育。

联盟计划

如果你的电子商务网站提供联盟计划,确保不要将自己网站的产品说明分发给你的合作公司。建议向合作公司提供你的供应商产品说明。为了保障自己网站产品描述原创,请确保没有关联公司或第三方供应商使用你正在使用的相同描述。在与其他公司和其他供应商合作时,请考虑将其添加到你的合同条款中,这样确保法律保障。

内容策划

内容策划是查找、创建故事并发布文章与读者互动的过程。这些故事可以来自互联网上的任何地方 – 从博客到社交媒体。

由于策划的内容素材都来自网络的各个地方,因此帖子包含部分重复内容(即使它只是重复的标题)也是很自然的。而且大多数博客文章也借用摘录和引用。

同样,谷歌搜索引擎并不认为这是垃圾内容。

只要你提供的内容都是经过全新视角来重新诠释的,谷歌就不会将此内容重复视为恶意的,所以你也不用担心必须添加rel canonical标记。

记住这一句话:少量的精品转载或引用 + 大部分原创 = 原创。

内容分发

电子商务网站,在做内容营销推广时,一般都会将同一篇文章、视频、图片等分发到多个网站上,这就意味着发布的文章会有几个重复内容的副本。虽然这些都是重复内容,当是只要你以引流量、带动销售为目的营销推广(即能带给我们一定流量,推广文章的网站权重较高),这种情况下,谷歌就不会认为这些是恶意的重复内容。另外,在多个文章副本中标注原始作者,并在适当的地方加上锚文本(即原始内容的片段)链接会原始页面,这样会更好得降低谷歌认为你在做恶意重复内容的嫌疑。

被其他人窃取内容

通常,不少低质量的搜索引擎网站会窃取你网站上面的产品内容,甚至一些竞争对手直接镜像你的网站(俄罗斯、印度阿三就爱干这事),以便通过广告产生流量并带动销售。这有可能对你自己网站的搜索引擎信任度产生负面影响,搜索引擎很能认为你们是一伙的,或者认为是你自己搞的鬼,虽然搜索引擎在识别垃圾网站方面做得很好了,有可能认为你不是在刻意做排名,但还是会有误伤的。

谨慎点,还是要处理下,最好的处理方法是向Google提交DMCA投诉,或向Bing提交知识产权侵权,以便提醒这两个搜索引擎注意此问题,并最终将这些网站从搜索结果中删除。

注意:内容必须是你自己的。如果你使用的是供应商的产品说明,则可能很难说服搜索引擎认为窃取你内容的网站侵犯了你的版权。当然,如果窃取你内容的网站,连你网站的导航、网站品牌、设计风格等整体都在使用,这样会更容易胜诉。

薄内容

所谓薄内容页面,意思就是内容很少或者无内容的页面。在2014年谷歌熊猫4.0算法更新时,ebay也是因为薄内容问题受到谷歌严重惩罚。如下所示

如何处理电商网站SEO重复内容

左侧导航有138个锚文本链接,长度达到5个滚动屏幕长度,而且列表只有一个产品。

有兴趣的可以研究下:熊猫4.0:为什么eBay刚刚失去了80%自然排名。

电子商务网站一般只有1~3个产品的类别页面都算是薄内容,这其实对于用户体验也不好,如果存在大量这些页面将会受到搜索引擎的惩罚。可以在页面上设置meta robots“noindex,follow”来处理此问题。或者直接用robots文件禁止抓取,这样可以节省搜索引擎的抓取配额。

Keywords: 免费CDN加速 免备案CDN加速 高防CDN加速