好得很程序员自学网
  • 首页
  • 后端语言
    • C#
    • PHP
    • Python
    • java
    • Golang
    • ASP.NET
  • 前端开发
    • Angular
    • react框架
    • LayUi开发
    • javascript
    • HTML与HTML5
    • CSS与CSS3
    • jQuery
    • Bootstrap
    • NodeJS
    • Vue与小程序技术
    • Photoshop
  • 数据库技术
    • MSSQL
    • MYSQL
    • Redis
    • MongoDB
    • Oracle
    • PostgreSQL
    • Sqlite
    • 数据库基础
    • 数据库排错
  • CMS系统
    • HDHCMS
    • WordPress
    • Dedecms
    • PhpCms
    • 帝国CMS
    • ThinkPHP
    • Discuz
    • ZBlog
    • ECSHOP
  • 高手进阶
    • Android技术
    • 正则表达式
    • 数据结构与算法
  • 系统运维
    • Windows
    • apache
    • 服务器排错
    • 网站安全
    • nginx
    • linux系统
    • MacOS
  • 学习教程
    • 前端脚本教程
    • HTML与CSS 教程
    • 脚本语言教程
    • 数据库教程
    • 应用系统教程
  • 新技术
  • 编程导航
    • 区块链
    • IT资讯
    • 设计灵感
    • 建站资源
    • 开发团队
    • 程序社区
    • 图标图库
    • 图形动效
    • IDE环境
    • 在线工具
    • 调试测试
    • Node开发
    • 游戏框架
    • CSS库
    • Jquery插件
    • Js插件
    • Web框架
    • 移动端框架
    • 模块管理
    • 开发社区
    • 在线课堂
    • 框架类库
    • 项目托管
    • 云服务

当前位置:首页>CMS系统>Dedecms
<tfoot draggable='sEl'></tfoot>

包含临沂织梦自带采集怎么设置的词条

很多站长朋友们都不太清楚临沂织梦自带采集怎么设置,今天小编就来给大家整理临沂织梦自带采集怎么设置,希望对各位有所帮助,具体内容如下:

本文目录一览: 1、 dede织梦的采集怎么用啊? 2、 php高手,dedecms(织梦)系统怎么弄才能做到(定时自动采集)求指导……谢谢…… 3、 织梦dede采集方法教程 dede织梦的采集怎么用啊?

采集侠是第三方插件,要配合织梦自带的采集比较好用,免费版的采集侠一个栏目只能绑定一个采集

很好用的,在后台采集里面添加采集规则,然后到采集侠里面绑定采集规则

修改文章模板,引入js,就可以触发采集了,只有有人访问你的网站就可以自动采集

php高手,dedecms(织梦)系统怎么弄才能做到(定时自动采集)求指导……谢谢……

这个系统是PHP写的,虽然PHP可以写计划任务的程序,但是他需要有人访问站点进行触发执行,否则他自己不会执行。

织梦dede采集方法教程

方法/步骤

1、首先我们打开织梦后台点击

采集——采集节点管理——增加新节点

2、这里我们以采集普通文章为例,我们选择普通文章,然后确定

3、我们进入了采集的设置页面,填写节点名称,就是给这个新节点取个名字,这里你可以任意填写。

然后打开你想要采集的文章列表页,打开链接这个页面,右键——查看源文件

找到目标页面编码,就在charset后面

4、页面基本信息其他的一般就不用管了,填完了如图

5、现在我们来填写列表网址获取规则

看看文章列表第一页的地址jianzhanxinde/list_49_1.html

对比第二页的地址jianzhanxinde/list_49_2.html

我们发现了他们除了49_后面的数字不一样,其他的都一样,所以我们可以这样写

/jianzhanxinde/list_49_(*).html

就是把1换成了(*)

因为这里只有2页,所以我们就填从1到2

每页递增当然是1了,2-1...是等于1吧

这里我们就填写完了

6、可能大家采集的有些列表没有规则,那就只有手工指定列表网址了,如图

7、每行写一个页面地址

列表规则写完了,我们就开始写文章网址匹配规则了,回到文章列表页

右键查看源文件

找到区域开始的HTML,就是找文章列表开始的标志。

8、我们很容易的找到了如图中的“新闻列表”

。从这里开始,后面就是文章列表里

我们再找文章列表结束的HTML

9、就是这个了,一个很容易找到的标志

如果链接中含有图片:

不处理

采集为缩略图

这里根据自己的需要选择

对区域网址进行再次筛选:

(使用正则表达式)

必须包含:

(优先级高于后者)

不能包含:

打开源文件,我们可以很清楚的看到,文章链接都是以.html结束的

所以,我们在必须包含后面填.html

如果遇到有些列表很麻烦,还可以填写后面的不能包含

8、我们点击保存设置进入下一步,可以看到我们获得的文章网址

看到这些就是对的了,我们保存信息进入下一步设置内容字段获取规则

我们看看文章有没有分页,随便进入一篇文章看看。。我们看到这里的文章没有分页

所以这里的我们就默认了

9、我们现在来找文章标题等等

随便进入一篇文章,右键查看源文件

看看这些

10、依照源码填写

11、我们再来填写文章内容的开始,结束

和上面的一样,找到开始和结束标志

12、开始:

12、结束:

13、你想过滤文章中的什么内容就到过滤规则里写吧,比如要过滤文章中的图片

选择常用规则

14、再勾选IMG,然后确定

15、这样我们就把正文中的图片过滤了

设置完毕后点保存设置并预览

这样一个采集规则就写好了,很简单吧有些网站很难写,可要多下点功夫了哦

16、我们点保存并开始采集——开始采集网页

一会的功夫就采集完了

17我们看看我们采集到的文章

18、看来是成功了,我们导出数据吧

关于临沂织梦自带采集怎么设置的介绍到此就结束了,不知道本篇文章是否对您有帮助呢?如果你还想了解更多此类信息,记得收藏关注本站,我们会不定期更新哦。

查看更多关于包含临沂织梦自带采集怎么设置的词条的详细内容...

声明:本文来自网络,不代表【好得很程序员自学网】立场,转载请注明出处:http://haodehen.cn/did121823
更新时间:2022-11-21   阅读:43次

上一篇: html怎么引用动图 html怎么引用图片

下一篇:.html怎么查看源代码 查看网页源代码的方法

相关资讯

最新资料更新

  • 1.详解解决织梦dede:title字数限制的两种方法
  • 2.dedecmsV5.5图片水印及图集手工上传无法加水印
  • 3.dede调用全站的最新文章加快新文章的快速收录
  • 4.dedecms首页调用随机文章及自动更新功能实例
  • 5.DEDECMS 扩展标签和dede自定义标签实现方法
  • 6.适合企业站的织梦常用标签大全(自己整理)
  • 7.详解DeDeCMS织梦手机版网站首页如何更新
  • 8.织梦Dedecms在循环列表中获取会员信息的方法
  • 9.给Dedecms文章列表分页标题加上序号的方法示例
  • 10.dedecms织梦实现中英文分页功能方法步骤
  • 11.dedecms增加文章自定义属性的方法介绍
  • 12.dedecms结合jQuery实现汇率自动调整
  • 13.dedecms v5.7提示php.ini register_globals must is Off
  • 14.Dedecms实现自动统计当前栏目文档总数的方法
  • 15.DedeCMS图集中缩略图不显示的解决方法
  • 16.dedecms5.7 ask模块现404的解决方法
  • 17.DEDE模板中如何运行php脚本和变量在需要操作数据库字段时
  • 18.DEDECMS教程:上/下一篇文章标题长度的截取方法
  • 19.DEDECMS最为常用的分页标签及分页样式代码
  • 20.Dedecms图集上传zip压缩包解压图片顺序不对问题的解决方法

CopyRight:2016-2025好得很程序员自学网 备案ICP:湘ICP备09009000号-16 http://haodehen.cn
本站资讯不构成任何建议,仅限于个人分享,参考须谨慎!
本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。

网站内容来源于网络分享,如有侵权发邮箱到:kenbest@126.com,收到邮件我们会即时下线处理。
网站框架支持:HDHCMS   51LA统计 百度统计
Copyright © 2018-2025 「好得很程序员自学网」
[ SiteMap ]