DeDeCms织梦系统采集要知道的那些事
1.采集的文章质量不是很高
天下文章一大抄这句话在采集的时候体会更深。当你整理采集过来的文档的时,发现很多很多是标题党,有些标题主要关健词顺序稍稍变一下,或者换上类似词。但文档内容都是一样的,当然,其中有可能是某些词字体不一样,有一些段落不一样,还有一些字体着色不一样。所以采集来1000篇文章,能留下来的超过100篇文章那算你走运了。
我是怎样处理呢? 以前不懂,只知道采集,采集完后就导入数据生成文档更新首页就OK了。现在我是大部份全都删掉,小部份也换换标题来祸害百度和网友
2.采集的文章被百度收录的百分比不高。
采集的文章被百度收录的程度,跟网站的权重跟文章的质量有关。我的网站权重不高。往往每天采集1000文章百度收录100篇就不再收录了.。
我的应对办法:既然不能控制网站权重,就控制采集的文章数量。几天采集下来,一般也评估出了百度收录的大概范围。所以你每天弄个100篇,往往百度就收录80篇。
3.采集的很多老文章怎样让百度收录。
我自己的小聪明就是修改发表时间让百度以为这些文档是近期发布的。不知有没有什么后果,反正我目前的效果是很好的