网站采集者在采集时,通常都是指定头尾特征从哪到哪过滤.我们这里讲的第一种方法:文章头尾加随机广告,当然随机广告是不固定的。
比如你的文章内容是"校内网涂鸦代码",则随机广告的加入方法:
<div id="xxx">随机广告1欢迎访问校内网涂鸦代码站随机广告2</div>
注:随机广告1和随机广告2每篇文章只要随机显示一个就可以了.
防采集第二种方法:在文章正文页面插入重复特征头尾代码的注释。文章列表加随机不同的链接标签,比如<a href="",<a class="dds" href=''
当然,这个可以用正则去掉,但足于对付通用的CMS采集系统了。。
<!--<div id="xxx_文章ID">-->
其它标题或内容...
<!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">
随机广告1欢迎访问4399com小游戏站随机广告2
<--</div>--></div><--</div>-->
防采集第三种方法:加在文章列表的随便链接样式。
即:正文头尾或列表头尾添加<!--重复特征代码-->
原理是让采集的人无法抓到列表链接规律,无法批量进行采集.
请看:
<a href="xxx.html">标题一</a>
<a alt="xxx" href="xxx.html">标题二</a>
<a href='xxx.html'>标题三</a>
<a href=xxx.html>标题四</a>
如果你把三种方法全部加上,我想一定能让想采集的人头疼半天而放弃的..
如果你还问,如何防止别人复制采集呢?要做到这一点容易,把你的网站的网线拔了,自己给自己看就好了.
更新日志
- 小骆驼-《草原狼2(蓝光CD)》[原抓WAV+CUE]
- 群星《欢迎来到我身边 电影原声专辑》[320K/MP3][105.02MB]
- 群星《欢迎来到我身边 电影原声专辑》[FLAC/分轨][480.9MB]
- 雷婷《梦里蓝天HQⅡ》 2023头版限量编号低速原抓[WAV+CUE][463M]
- 群星《2024好听新歌42》AI调整音效【WAV分轨】
- 王思雨-《思念陪着鸿雁飞》WAV
- 王思雨《喜马拉雅HQ》头版限量编号[WAV+CUE]
- 李健《无时无刻》[WAV+CUE][590M]
- 陈奕迅《酝酿》[WAV分轨][502M]
- 卓依婷《化蝶》2CD[WAV+CUE][1.1G]
- 群星《吉他王(黑胶CD)》[WAV+CUE]
- 齐秦《穿乐(穿越)》[WAV+CUE]
- 发烧珍品《数位CD音响测试-动向效果(九)》【WAV+CUE】
- 邝美云《邝美云精装歌集》[DSF][1.6G]
- 吕方《爱一回伤一回》[WAV+CUE][454M]