织梦dedecms采集文章时过滤规则有哪些

92建站   2021-05-23   收藏本文

本文介绍了织梦dedecms采集文章时过滤规则有哪些,不少专业养站的朋友手上有几十个网站,要是合站人工写文章显示没法实现,所以采集文章对于这些人来说是必行之道。采集文章就要有过滤规则,下面的教程说的就这方面的内容。不过92建站还是建议大家不要采集文章,对SEO来说不好。

以前92建站介绍过采集过滤规则的方法,下面再和大家说说织梦dedecms采集文章时过滤规则的写法。

织梦dedecms的过滤规则写起来不是很难,规则如下:

代码示例:

{dede:trim}要过滤的内容{/dede:trim}

如果要过滤的内容很简单,完全可以把过滤规则直接写在“{dede:trim}”和“{/dede:trim}”之间。

对于比较复杂的情况,请考虑使用正则,你懂的,正则表达式,那是相当强劲的。

以下是一些过滤规则的例子,供大家参考。

1、采集中去除内容里的超链接:

代码示例:

{dede:trim}<a([^>]*)>{/dede:trim}

{dede:trim}</a>{/dede:trim}

假如要将所有超链接内容都去除,规则是:

代码示例:

{dede:trim}<a([^>]*)>([^<]*)</a>{/dede:trim}

这两个规则的不同通过下面代码来解释

例如文章代码中包含着如下内容:

<a href="#">超链接</a>

通过第一个规则,采集结果是:超链接

2、过滤广告

对于广告来说,过滤规则就得针对html中看到的内容使用规则了,例如某些广告仅仅是引用某个JS文件,例如

代码示例:

<script src=’/plus/ad_js.php?aid=4′ language=’javascript’></script>

这样的规则只需

代码示例:

{dede:trim}<script(.*)>{/dede:trim}

{dede:trim}</script>{/dede:trim}

如果某些广告的内容是JS代码写在<script></script>区间里的,例如GG的广告,那么过滤规则应该是:

代码示例:

{dede:trim}<script>(.*)</script>{/dede:trim}

上面就是织梦采集过滤规则的介绍,若有疑问可以找小编进一步探讨交流~

展开