首页 > 常见问题 >如何防止自己网页的内容被采集
资讯内容

相关词条:防止采集,网站采集,有讯软件,网页采集,网页信息采集

如何防止自己网页的内容被采集

防止采集第一种方法:在文章的头尾加上随机不固定的内容。网站采集者在采集时,通常都是指定一个开始位置和一个结束位置,截取中间的内容。

 

比如你的文章内容是"有讯软件信息网",则随机内容的加入方法:

 

<div id="xxx">随机内容1+六月星软件信息网+随机内容2</div>

注:随机内容1和随机内容2每篇文章只要随机显示一个就可以了.

 

防止采集第二种方法:在文章正文页面插入重复特征头尾代码的注释。

文章列表加随机不同的链接标签,比如<a href="" class="xxx"><a class="xxx" href=''>,当然,这个可以用正则去掉,但足于对付通用的CMS采集系统了.

<!--<div id="xxx_文章ID">-->

其它标题或内容...

<!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">

随机内容1欢迎有讯软件信息网随机内容2

<--</div>--></div><--</div>-->

即:正文头尾或列表头尾添加<!--重复特征代码-->

 

防采集第三种方法:加在文章列表的随便链接样式。

目的是让采集的人无法抓到列表链接规律,无法批量进行采集.





有讯软件致力于为客户定制专业的数据采集软件及服务,主要包括:网页采集,网页信息采集,网页数据采集,网络数据采集,信息采集软件,数据采集软件,网页采集器,软件定制,爬虫采集,专业数据采集。