《大型网站SEO优化实践》学习分享
本文主要内容源自2013年阿里技术嘉年华中阿里巴巴周文君分享《大型网站SEO优化实践》。学习过后,受益匪浅,特作笔记,经常回顾吸收学习。
大型网站SEO的特点&优势&挑战
特点
页面数量巨大
SEO流量高,长尾流量占比大
数以百计的Web应用
跨团队、多团队协作
优势
页面内容丰富,数量多(UGC)
域名初始权重高
无需刻意进行link building,用户会主动帮忙进行链接建设和推广
网站安全及性能优化由专业团队负责
挑战
用户内容如何更好地匹配用户搜索Query(如:博文、帖子)
如何更好的挖掘、整合用户内容,生成更有价值网页
SEO优化方案竞彩遭遇用户体验冲突,KPI冲突
Web应用SEO定位
SEO需结合产品定位及产品核心价值(寻找价值关键词)
SEO流量预估(内容特点、页面数量,按照同类产品的索引量与SEO流量比值来进行预估,如:页面数*收录率 : SEO流量 = 200:1 ~ 10:1)
注重品牌效应
营销活动(营销活动期间做好相关优化,SEO具有时效性)
大型网站SEO基本策略
SEO技术研究
SEO元素周期表
The Periodic Table Of SEO Success Factors
Now Updated: The Periodic Table Of SEO Success Factors
Mobile: A New Element For The Periodic Table Of SEO Success Factors
优化初期三板斧
URL规范化:URL规范化是大型网站SEO优化的根本,解决得是搜索引擎网页库,索引库,URL库中的Key问题。URL规范化影响着网站核心资源被抓取及索引效率,权重等
页面元素优化:页面元素优化决定着未来流量上升的高度;Title&Description,不同的场景,采用不同的模板;H,P,B,Strong标签,图片alt属性,页面无效链接添加rel=”nofollow”等
提升核心资源被抓取效率:优化初期应优先关注收录率,而非排名及流量(70%比较合理)
新URL规范化+robots禁止策略简单粗暴,非常有效
优化中后期应注重的三点
URL规范旧状
URL规范旧状:多域名;全静态化,全动态化,半静态化等多套URL规范;URL层级太深;URL解析代码复杂冗余,性能低,维护成本高。
问题与挑战
参数全静态化,本质还是动态化,SEO效果差;跟前端工程师合作效率低,如:JS拼接静态URL问题;URL中特殊字符解析问题,如%2F(/),%4E(N);form表单提交产生多余的301跳转,增加前端性能负担(20ms左右)。
URL规范化问题对策(搜索引擎)
noidex,nofollow标签;301跳转;canonical标签;webmaster可设置动态参数处理方式
我们如何解决?
提升网站核心资源被爬去效率
引导爬虫抓取网站核心资源:站点扁平结构,实施难,重点优化面包屑;sitemap每日全量更新,补充Spider URL库;页面部分推荐模块异步改同步加载,核心资源URL部署到权重高的页面
减少无效URL的抓取:robots.txt禁止无效URL被抓取及被索引;通过noindex meta标签禁止URL被索引(百度暂不支持);nofollow的使用
提升网站抓取量:避免搜索引擎官方爬虫被安全软件拦截;逐步上调站长平台抓取压力,及时更新死链sitemap
大型网站SEO优化中后期应注意的三点
专注Query分析:Search Query = Search Requirement;用户搜索的query是否match页面Title中的关键词;词库分库分档
调排名:准侧,对排在第二及第三页的关键词,重点分析调优。三页以后的关键词,投入产出比较低
研究anti-spam:坚持白帽,杜绝黑帽;研究anti-spam防止不正确优化被判作弊
全站SEO效果监控
日志分析脚本
定时分析
Email分析报告
图形化报表
统计SEO基本指标数据(分产品线,分搜索引擎)
SEO统计报表
构建傻瓜数据平台
全站SEO效果监控
SEO爬虫分析
SEO收录及反链分析
SEO基本指标统计
排名监控
核心关键词核心应用每日排名
竞争对手排名监控
第三方数据
搜索引擎开放的监控数据:百度站长平台,Google、Bing Webmaster
第三方统计工具
Do Everything with Tools
搜索引擎提供的SEO工具
页面Title&Description优化工具
链接分析工具
流量监控工具
页面诊断分析工具
移动WAP的SEO优化
自主适配:根据user-agent自主适配到WAP页面
标注meta声明:name=”mobile-agent”
开放适配协议:百度站长平台提交开放适配协议,以适配协议为准
Doctype声明:Doctype声明有助于搜索引擎识别该页面是否合适手机浏览。WAP页协议:xhtml/wml/html5
SEO领域体系化建设
大公司SEO项目合作方式及挑战
参考资料:
《大型网站SEO优化实践》学习分享的更多相关文章
- 大型网站seo优化之行业网站seo优化具体操作思路
第一部分:站内优化 第二部分:站外优化 第三部分:内容建设 第四部分:网站完善 一.站内优化 1.站内结构优化 2.内链策略 3.站内细节优化 4.网站地图设置 5.关键词竞争度分析 5.关键词部 ...
- 大型网站SEO优化策略框架
- 网站SEO优化问答精选【转载】
在接触seo的过程中,大家都会碰到很多这样或那样的问题,特别是一些seo新手由于知识有限会经常到很多地方问一些网站优化的问题,做seo时间慢慢变长之后,知识会慢慢地积累,之前的问题也会慢慢的都被解答. ...
- 网站SEO优化问答精选
1.百度每更新一次,网站的收录就减少很多,但是我每天都增加伪原创的内容啊? 这个问题大多数是因为网站权重导致百度不够重视你:另外就是文章质量度不高,没有可读性或是原创度太低,尽管百度会收录,但是经过一 ...
- 【百度】大型网站的HTTPS实践(二)——HTTPS加密算法介绍
大型网站的HTTPS实践(二)——HTTPS加密算法介绍 原创 网络通信/物联网 作者:AIOps智能运维 时间:2018-11-09 15:09:43 358 0 前言 在上一篇文章中,我们简要 ...
- 【百度】大型网站的HTTPS实践(一)——HTTPS协议和原理
大型网站的HTTPS实践(一)——HTTPS协议和原理 原创 网络通信/物联网 作者:AIOps智能运维 时间:2018-11-09 15:07:39 349 0 前言 百度于2015年上线了全站 ...
- 网站SEO优化之添加Sitemap文件。
Sitemap.xml 故名思意就是站点地图文件,可以指引Google spider 收录相应网页.正确地使用Google Sitemap,可以确保让Google spider 不遗漏网站内的任何页面 ...
- 大型网站系统架构实践(五)深入探讨web应用高可用方案
从上篇文章到这篇文章,中间用了一段时间准备,主要是想把东西讲透,同时希望大家给与一些批评和建议,这样我才能有所进步,也希望喜欢我文章的朋友,给个赞,这样我才能更有激情,呵呵. 由于本篇要写的内容有点多 ...
- 大型网站系统架构实践(六)深入探讨web应用集群Session保持
原理 在第三,四篇文章中讲到了会话保持的问题,而且还遗留了一个问题,就是会话保持存在单点故障, 当时的方案是cookie插入后缀,即haproxy指负责分发请求,应用服务自行保持用户会话,如果应 用服 ...
随机推荐
- UTC时间与北京时间
经常混淆于此,特地研究了一下,记录在此以备忘. 整个地球分为二十四时区,每个时区都有自己的本地时间.在国际无线电通信场合,为了统一起见,使用一个统一的时间,称为通用协调时(UTC, Universal ...
- T4模板_T4基本结构
T4文本模板由 指令块.文本块.控制块 组成. 一. 指令块(MSDN文本模板指令) 指令块以@开头,基本的指令块包括<#@ template #> .<#@ parameter# ...
- JPEG图像压缩算法流程详解
JPEG图像压缩算法流程详解 JPEG代表Joint Photographic Experts Group(联合图像专家小组).此团队创立于1986年,1992年发布了JPEG的标准而在1994年获得 ...
- CentOS7无法使用tab补全功能??
Centos7在使用最小化安装的时候,没有安装自动补全的包,需要自己手动安装. yum -y install bash-completion 或者你可以安装一些初始化的包组 yum -y groupi ...
- sublimeText3的一些操作记录
# 给绿色版的sublimeText3添加右键菜单,其中@=“Sublime Text 3” 是右键展示的文字, 后面的icon是图标将下面代码保存为.reg文件执行 Windows Registry ...
- 用python和unittest编写app自动化测试用例
import unittest import webdriver import time class Test(unittest.TestCase): @classmethod def setUpCl ...
- Multi-class Classification相关
标签(空格分隔): 毕业论文 (OS: 最近在做关于多类分类的综述,但是搜索出来好多方向搞得自己云里雾里的,好吧,又是在下孤陋寡闻了.还是那句话,不知道不可怕,但一直不知道就很尴尬了.) one-cl ...
- c++11 函数模板的默认模板参数
c++11 函数模板的默认模板参数 #define _CRT_SECURE_NO_WARNINGS #include <iostream> #include <string> ...
- (转)enable_from_this方法的使用与陷阱
转自http://blog.chinaunix.net/uid-442138-id-2122464.html enable_from_this 的使用与实现原理说明: shared_from_ ...
- Linux内核分析实验三----跟踪分析Linux内核的启动过程
一.Linux内核源代码介绍 1.根目录 arch/x86目录下的代码是我们重点关注的,arch中包括支持不同CPU的源代码. init目录下包含内核启动相关的代码,如main.c(start_ker ...