彻底一次性解决内容收录问题
搜索引擎的工作原理 输出结果前面还有3个步骤,如果网站需要被搜索到,那么必须知道你的站存在,抓取,——过滤,目前中国400万个网站,以亿计算的数据。百度认为有价值的建立索引,既收录——当用户搜索关键词时,就输出结果。抓取——过滤——索引(收录)——输出。抓取的前提是知道链接的存在?2个方式:1主动提交 sitemap 网站地图提交到站长平台。2被动抓取 发外链引蜘蛛,很多人发的是首页的链接。qq空间不能发外链,因为蜘蛛进不去。
主动提交和被动抓取,哪个好?2者没区别。
知道你的站为什么不抓取?
一 这个域名曾经有问题 如果以前被k过,是需要经过一定考核期。即使知道存在,就还不会抓。考核期4-6周。上线一个页面也不收录。域名做个调查,先把域名在百度或谷歌查下,证明有人用过。
二 不是不抓,而是来不了。域名转化成ip,转化成相应的服务器,dns解析,域名转为ip,找到ip所在服务器进行访问,如果dns做了手脚,或者空间商做手脚,导致蜘蛛没法抓。空间商屏蔽蜘蛛,是会产生压力。20天或者十几天新站开始收录。验证百度站长平台。受到百度站长平台信息提醒。网站对搜索引擎进行全站封禁。换个空间,马上就收录。
搜索引擎对网站抓取的频率 百度站长平台里面压力反馈,抓取压力即搜索引擎在单位时间内对一个去都没有去网站服务器访问的频率和总次数。 如果0,证明没去。压力值716,只能证明搜索引擎去,但是去哪些页面不知道。如果去了,只去首页,或你想被收录的页面都没去,没访问到内页。
服务器日志 看访问哪些页面。有独立的服务器,vps可以自己搞。(光年日志分析)真假蜘蛛 蜘蛛不一定是真的。站长工具对网站查询时,也会产生假蜘蛛。
a 、看日志,需要判断真假蜘蛛,有些人对网站采集,也会产生假蜘蛛。
b 、如果网站是动态程序,伪静态,日志记录的路径都是动态的,不会记录伪静态,纯静态的可以直接看。伪静态很难分析路径。
通过日志,就能看到哪些页面没爬。
有些页面爬,有些页面没爬?原因如下:
1、权限设置 robots
2、结构问题 爬取困难
404也是去爬 nofollow 不传递权重,但是能爬 路径深不影响爬取
3、信用度 供 求b2b 审核 垃圾信息太多 爬回的页面过滤 分类整理 筛选 ,建立索引。怎样过滤 ?第一剔除空页面和无意义的页面。整个页面是flash 登陆页面 注册页面 或产品页面就是一张图片,则有的是空页面,无意义的。这样的是没有必要被收录的,例如关于我们 、
第二 判断页面价值得分。达到收录标准 ,本身得分的高与低,1、这些取决于网站本身权重的高与低。信用度高。站内页面要不要收录,取决与本身权重高低。权重高,收录很容易,标准也降低很多。2 页面的质量得分 内容是否原创,还是复制。稀缺程度,SEO博客 PAGE SPEED怎样安装的内容,放到博客中,对网站的客户有用。星火计划鼓励原创。原创会加分,并且很好排名。在原本内容上添加附加内容和价值。
第三 内页是否有外部链接。外部链接可以对内页投票,就更好的达到收录标准。页面保留下来,就建立索引。能查到,能不能排到前面?需要seo的操作排名。
想要自己写的描述被抓,想做的关键词尽量的出现在描述里面。sei培训放到描述里面,关键词放到描述里面,这样抓取几率就大。
快照是一个页面的备份版本,当访问不到页面,通过快照看信息。搜索引擎的索引数据库
a5 seo那个词是23号建立的,24号进行计算的,运算也是需要时间的,就会出现时间差。同样的页面一个是23 一个是24号,同样的一个结果,广州23 深圳24,地域出现这样的情况,搜索引擎的服务器有很多,不同的区域,统一数据需要时间。
自然性链接,需求页面的主题是什么?相关的需求及问题,小的标题要有吸引力,要让客户看下去的理由,吸引用户快速定位他想要的东西,层次清晰。
标题 切词选词有技巧。产品页面质量,产品页面是否有转化率,其他的技术文章依据需求做些,产品页面是核心的转化页面。
关键词 标题 优化来说 标题不匹配关键词
转化率页面 引导 直接性需求 底部做推荐性链接是没有用的。PV 转化
站内的优化 用户需求 排名机会 核心的页面 产品 页面的质量 转化 产品 标题 自然性链接