seo.adoc 6.8 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252
  1. // tag::main[]
  2. == SEO
  3. * SEO 优化网站,长期;
  4. * SEM 买排名,短期;
  5. SEM :见效快、范围广、操作简单、季节性;但贵、波动大、恶意点击(模仿真实IP搜索点击指定竞价广告,让你造成预算快速消耗或广告提前下线)
  6. === SEO 查询
  7. https://seo.chinaz.com
  8. https://www.aizhan.com
  9. === 网站主动收录
  10. 地址:
  11. * baidu: https://ziyuan.baidu.com
  12. * 360: https://zhanzhang.baidu.com
  13. * sogou: https://zhanzhang.baidu.com
  14. 注意:
  15. * 链接提交尽量全
  16. * 站点类型是否有移动
  17. * 备案号提交
  18. === 关键词优化
  19. 权重:title > description > meta keywords
  20. ==== 来源:
  21. * 行业、业务
  22. * 竟对关键词
  23. * 关键词热度
  24. * 百度推广 - 关键词规划师
  25. * 站长工具 - SEO - 关键词挖掘
  26. * 爱站网
  27. * 百度指数
  28. ==== 导航优化
  29. * 层级控制 3层内
  30. * 包含关键词
  31. ==== 标签优化
  32. * title 标签,权重第一
  33. ** 产品名 - keyword1-keyword2-keyword3 【分隔符:'|'、','、'-'】
  34. ** 长度控制 64 字符,< 3个关键词
  35. ** 搜索结果标题
  36. * keywords,权重第三
  37. ** 长度控制 64 字符,< 5个关键词
  38. ** 不展示,面向搜索引擎
  39. * description,权重第二
  40. ** 描述这个网站干嘛的,包含关键词
  41. ** 紧扣标题,包含 title 中的关键词
  42. ** 长度控制 128 字符
  43. ** 搜索结果简介
  44. === 页面布局
  45. ==== 关键词布局
  46. * 布局:F 型布局,避免单图、竖型
  47. * 关键词密度:关键词出现次数/总文字
  48. ** 2%-8%,建议 6%
  49. ** 工具:站长工具-关键词密度分析
  50. * 关键词分布
  51. ** 第一段开头50-150个字中需包含一次关键字,可以加粗部分关键词
  52. ** 正文中需要包含2-3次关键词或者近义词
  53. ** 文章结尾包含一次关键词
  54. * 小技巧
  55. ** 利用长尾词优化,由2-3个词组成,甚至是短语,先尝试占领长尾词排行
  56. ==== 网站结构
  57. 一般 2-5 层,如 3层
  58. * 3次点击可以到达网页任何页面
  59. * 搜索引擎抓取3级可以抓到所有页面
  60. 重要的是离主页的层次,而非物理文件层次
  61. * 主页
  62. ** 频道
  63. *** 栏目
  64. **** 内容
  65. 每层都有:标题、关键字、描述
  66. ==== logo优化
  67. * logo处添加H1标签
  68. * 在logo的a标签处添加title属性,填写主关键词
  69. ==== 内链优化
  70. 域名必须完全一致,建议有面包屑导航,带关键字
  71. * 任何页面回首页
  72. * 链接到上一级各个页面,如内容页链接到所有的栏目
  73. * 链接到同层级页面,如文章1 -> 文章2
  74. ==== 四处一词
  75. 同一个关键词在 title、keywords、description 标签中出现,也要在超链接中出现,并链接到相关页面,首次出现可加粗显示
  76. === 代码注意
  77. ==== <h> 标签
  78. * h1-h6 依次减弱
  79. * h1 / h2 不建议在一个页面中同时使用
  80. * h1 / h2 建议包含关键词
  81. * h1 / h2 建议只出现依次
  82. * h3/4/5 不建议使用
  83. * h6 可用于友情链接,降低友情链接对页面关键词的影响
  84. ==== <strong> 标签
  85. * 不要太频繁
  86. * 尽量只是关键词使用
  87. * 网站标题 / 文章小标题
  88. ==== <img> 标签 alt
  89. * 保持与图片相关,利于搜索引擎识别图片信息
  90. * 长度控制,64
  91. ==== Nofollow
  92. 当超级链接中出现nofollow标签时,搜索引擎不考虑此链接的权重,也不参与排名
  93. * 写在meta标签上,告诉爬虫不要抓取网页上的外部和内部链接;<meta name="robots” content="nofollow” />
  94. * 写在超链接a标签中,告诉爬虫不要抓取特定的链接
  95. * 网站链上垃圾网站会降低权限,对可以的第三方链接使用nofollow标签
  96. * 网站版权、备案、站外链接都应该加nofollow标签
  97. ==== robots.txt
  98. 存放在根目录下的文本文件,告诉爬虫哪些内容可否索引,也可以将不希望爬虫索引的内容放进此文件
  99. * 引导搜索引擎蜘蛛爬取
  100. ** 指定栏目或内容
  101. ** 抓取网站地图
  102. * 屏蔽页面
  103. ** 死链、404错误页面
  104. ** 无意义无内容页面
  105. ** 重复页
  106. ** 不想被收录的页面
  107. ** 较大的文件,如图片、视频等节约宽带提升速度
  108. ===== 语法及通配符
  109. * User-agent: 定义搜索引擎;
  110. * Disallow: 定义禁止蜘蛛爬取的页面或目录;
  111. * Allow: 定义允许蜘蛛爬取的页面或目录;
  112. * $ 匹配url结尾的字符;
  113. * * 匹配0个或多个任意字符;
  114. https://blog.csdn.net/qq_36129701/article/details/104789902
  115. ==== Sitemaps
  116. * 通知爬虫哪些网页是可以爬取的
  117. * 此文件通常是xml格式
  118. * 每个网址包含一个父标记条目,一个子标记条目
  119. * 网址应该以http开头,少于2048个字符
  120. * 可以通过各个站长平台提交,也可以将地址放在 robots.txt 文件中;在 robots.txt 最后一行添加 http://www.yours.com/sitemap.xml
  121. ==== 解决死链
  122. * 使用工具如 Xenu 找出死链
  123. * pl.soshoulu.com/webspeed.aspx 可以帮助找,如非 404 页面
  124. * robot 文件屏蔽死链,在搜索引擎的站长工具,提交死链页面
  125. ==== URL 优化
  126. url常见不规范种类
  127. * 同一页面链接不统一;
  128. * 静态化url设置错误;
  129. * 静态和动态url共存;
  130. * 加密网址https和未加密网址http同时存在;
  131. * url中有端口;
  132. * 在url后面添加跟踪代码,如trace,click跟踪;
  133. url不规范造成的问题:
  134. * 分散页面权重,不利于排名;
  135. * 干扰搜索引擎,影响url收录;
  136. * 重复页面过多,搜索引擎可能认为有作弊嫌疑;
  137. * 浪费资源和宽带;
  138. ===== 做法
  139. * 链接保持统一
  140. * 使用canonical标签,解决 url 不同的重复页面
  141. ** 在 http://www.example.com/standerd?timestamp=12345 里添加 <link rel="canonical" href="http://www.example.com/standerd" />
  142. ** 注意添加的链接不要绑定端,避免 PC 关联到移动端情况
  143. ** 尽量使用绝对链接,而非相对
  144. ** 一个页面中只设置一个canonical标签
  145. ** 网站更换域名时,服务器不支持重定向的情况下,可以使用canonical标签
  146. * 制作xml网站地图规范化网址,提交搜索引擎;
  147. * 301重定向
  148. ==== 301 使用
  149. 场景:
  150. * 网站的旧内容过期并被删除掉
  151. * 具有链接和流量的无效URL
  152. * 更换了主机托管公司
  153. * 网站更换程序,排版、url 变动
  154. * URL规范化
  155. ** 如主页可通过 abc.com、abc.com/index.html、www.abc.com、www.abc.com/index.html,只维护一个,其他301
  156. [NOTE]
  157. ====
  158. 网页a积累的权重将被转移到网页b,会损失一部分权重(当两个页面内容相同时)
  159. ====
  160. [IMPORTANT]
  161. ====
  162. 302、js跳转 都属于作弊手段,尽量少用,仅建议在 404 延迟自动回首页使用
  163. ====
  164. === 搜索引擎收录
  165. *查询*: 'site:' + <域名>
  166. === 异常情况
  167. 网页 404 / 500 展示页面,页面包含链接,来源 / 回首页(302) / 热门页面链接等
  168. 不要使用重定向将404页面跳转到首页,用户体验极差,可考虑 5s 后
  169. 有些打不开的页面返回码并非404,需将状态码设置成404;
  170. 图片 404 使用默认图片
  171. css/js 404 使用本地缓存代替 cdn
  172. // end::main[]