帝国cms采集常用技巧

1、过滤文章内容的链接:

广告过滤正则设置:“<a [!--ad--]>,</a>”

2、同上得出,过滤font之类的标签:

广告过滤正则:“<font[!--ad--]>,</font>”,其他依此类推。

3、同一链接的页面如何重复采集:

到“管理采集节点”那清空节点即可重复采集已入库的页面。

4、采集内容分页正则说明:

如果是全部列表式,则只需看第一页的页面HTML代码。

常见问题

1、提示信息:Warning: preg_replace() [function.preg-replace]: Compilation failed: range out of order in character class at offset 83 in

答:你的采集正则变量名写错导致,请检查你的正则变量。

猜你喜欢
比较深意的两个字的名字 经典两个字的网名简洁有深意
娃娃菜放冰箱能放多久 娃娃菜放冰箱可以放多久
喝酒后睡觉好还是不好 睡觉时喝酒好不好
床上有蚂蚁怎么办用什么方法能治 床上有蚂蚁怎么办用什么方法能治好
芭比Q什么意思网络流行语 芭比q在网络流行语中是什么意思
2022泗水万紫千红度假区五一活动 泗水县万紫千红度假村
2022武汉海昌极地海洋乐园双十一优惠门票汇总
禄劝图书馆开馆公告 禄劝图书馆开馆公告栏

很赞哦! ()