http://www.killcigs.com

                                                                  【波兰好运彩】dedecms采集规则怎么编写-DEDECMS

                                                                  织梦系统作为一个比较常用的文章系统,相对来说操作比较容易。在众多功能中,采集系统可能对于部分新手来说可能是比较头疼,比如采集区域设置不对、采集规则具体编辑不正确、采集后空白等问题。今天我们就从比较容易遇到的几个问题来详细讲解下。

                                                                  首先我们先登录后台,分别点击采集--采集节点管理,进入采集管理设置界面

                                                                  1.jpg

                                                                  这里有两个可以选择,一个是修改原先的节点(主要是之前设置错误导致采集不了或者其他设置),一个是直接新增节点,大部分以新增节点为主,点击,然后下一步,选择“普通文章”确认。

                                                                  2.jpg

                                                                  然后填写节点名称(建议是和栏目相关的名称,避免导入的时候出错),这个按实际填就可以了。然后第一个重点:目标页面编码 。这个是一定要填写目标网页的编码,非自己网页的。查看方法:打开目标网站随便一个页面,空白地方右键-查看源代码(编码一般在前几行[)

                                                                  3.jpg

                                                                  然后是填写列表规则,一种是批量生成网址,一般适用于规律比较强的或者需要采集是从上到下的。比如我们是以这个栏目目标的:

                                                                  第一页列表:http://youqubu.cn/tansuo/list_5_1.html

                                                                  第二页列表:http://youqubu.cn/tansuo/list_5_2.html。

                                                                  这个列表规则最重要的是找相同和不同点,相同点填上去,不同点用匹配符号补充,就是变量。其实这个一对比我们可以知道,http://youqubu.cn/tansuo/list_5_ .html这里都是一样的,所以变量就是1.2.3.4.。。所以匹配的网址是:

                                                                  http://youqubu.cn/tansuo/list_5_(*).html。

                                                                  4.jpg

                                                                  )

                                                                  另一种是列表规则是手工指定列表网址,这个就比较通俗了。就是把你所有需要采集的列表页填写上去。(比较适合只采集某几页或者变量比较多的页面)

                                                                  注意:很多网站的栏目首页是以http://xxx.xx/xxx/这样的形式展示的,可以对比以上我们发现,少了后面的变量项。所以找到有变量项的方法是:点击这个列表的下一页,如果还弄不清楚就再点击下一页,对比列表的第二和第三页,我们可以同样发现步骤四的变量项。

                                                                  5.jpg

                                                                  这一步是获取该列表下文章的全部地址,我们要从列表页中获取全部的文章页地址。我们还是以:http://youqubu.cn/tansuo/list_5_1.html列表为例。复制该列表下第一篇文章的标题,然后列表页空白处右键--查看源代码,按ctrl+F查找,粘贴刚刚复制的标题,定位到该文字源代码中的位置。其实这个是有一定规律的。然后我们查找源代码中哪部分代码是唯一的并且能够包含列表所有文章地址的(注意:开始代码查找应该从列表第一篇文章标题开始往上找,结束代码查找应该从列表第一篇文章标题开始往下找)。通过这个源代码可,知。开始代码:<ul class="text_list_x">和结束代码:<div class="pages"> 能够包含所有的文章列表,并且代码是唯一的

                                                                  郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

                                                                  上一篇:华为第三批EMUI 9.1公测招募开启:Mate 9/Pro、P10/Plus等机型 - EMUI 9.1,华为
                                                                  下一篇:没有了