今天是: + 登录 + 注册 + 控制面板 + 加入收藏 + 设为首页 + +
  →采集系统演示  →娱乐社区演示站    →BT下载   站内搜索
顾客至上,信誉第一 首页 · 新闻公告 · 下载中心 · 帮助中心 · 产品购买 · 主机空间 · 网络学院 · 技术论坛 · 网站建设
推荐下载
SK信息采集+风讯CMSV4.0 Sp5整
SK信息采集(科汛CMS)整合版3.3
SK信息采集系统V3.3版(单机版)
SK信息采集系统V3.2版 
SK信息采集系统(单机)版V3.1 B
SK信息采集整合(科汛CMS)插件V
SK产品
 
技术文章
SK信息采集安装教程(单机版)
图片采集规则操作演示
sk信息采集3.0视频教程
SK信息采集系统简介
信息采集方案
新闻采集帮助
SK采集基本使用帮助
购买指南
购买步骤
汇款方式
功能对比
产品报价
版本历史
联系我们
购买咨询QQ:软件购买咨询询留言
技术服务QQ:技术服务
手机:(0)13860892492(购买咨询)
电话: 0596-2821043(售后技术服务)
联系邮箱:skxiu2006@sina.com
友情链接

  科汛网络  风讯CMS   网行天下
  中国站长  中国2399分类网

当前位置:SK网络 >> 帮助中心 >> 正文
SK采集基本使用帮助

一、使用指南-----属性设置

 

二、使用指南-----项目管理
点此在新窗口浏览图片
点此在新窗口浏览图片
1、添加项目:

(1)基本设置

       1. 项目名称:起个看一眼就明白的名称,如:IT世界-业界新闻(来自IT世界的业界新闻)。

        2.所属栏目:采集的新闻属于哪个栏目。          

        3.所属专题:采集的新闻属于哪个专题。

        4.目标文档编码:采集目录网页所用的编码。

        5.远程列表URl:采集网页的网址。

        6.是否列表分页采集:

               书一般都有目录吧?列表就像一本书的目录,目录可以有一页,也可以有很多页,列表也一样。
         (1)批量生成
    如有些列表是这种形式:
    第一页http://www.it.com.cn/news/cyxw/yejie/index_1.html
    第二页http://www.it.com.cn/news/cyxw/yejie/index_2.html
    第三页http://www.it.com.cn/news/cyxw/yejie/index_3.html

    那么可以这设置:{$ID}是必须的

    原字符串:http://www.it.com.cn/news/cyxw/yejie/index_{$ID}.html

    生成范围:1--3

    结果程序会生成:http://www.it.com.cn/news/cyxw/yejie/index_1.html

    http://www.it.com.cn/news/cyxw/yejie/index_2.html

    http://www.it.com.cn/news/cyxw/yejie/index_3.html

    这样的几个列表页面

    (2)手动添加

     输入一页网址后按回车再输入另一页,如此反复可以输入多个网址。

        7.采集图片保存地址: 图片保存到本地的目录地址 后面必须带"/"符号

      8、新闻设置:
            立即发布:自动审核采集数据。
            图片保存:选中的话,如果采集的新闻正文中有图片,图片保存到本地。
            倒序采集:选中的话,如果采集的新闻时从最尾页开始采集。

        7.标签过滤:

            这里是常见的要过滤的html标签。
            广告过滤:如果没有选择,那么过滤设置中的过滤将不起作用,下一版中将去掉。
            IFRAME:如--<IFRAME SRC="广告地址">,比较常见的广告代码。
            OBJECT:如--<Object 代码>代码</Object>,注意--有些正文中有Flash动画、又有这个广告代码,此时推荐使用过滤功能。
            s cript :如--<s cript LANGUAGE="Javas cript1.1" SRC="广告地址"></s cript>,常见的广告代码。
            FONT    :如--<font style="font-size:12px;line-height:150%;">,常用于去掉文字的大小、颜色等属性。
            A          :如--<a href="http://pic.scuta.net">查看更多图片</a>,常用于去掉文字、图片上的链接,但不会去掉“查看更多图片”。

2、 第一步
点此在新窗口浏览图片

        1.列表开始/结束标记:

               平面上的两点确定一条直线,学过几何吧?用在这里是一样的道理,开始/结束标记可以确定你要采集的新闻,有的这里没有设置好结果采集到其它新闻去了。
               比如这是某一列表页面的主要部分代码:
                <table width="98%" border="0" cellspacing="0" cellpadding="3">
                  <tr>
                       <td align="left" valign="top"><br>

                           <a href="News.asp?id=1" target=_blank>新闻标题</a><br>
                           <a href="News.asp?id=2" target=_blank>新闻标题</a><br>
                           ....省略
                           <a href="News.asp?id=50" target=_blank>新闻标题</a>
                       </td>
                 </tr>
              </table>

     红色部分就是我们要的列表开始标记和结束标记,是不是把你想要的新闻夹在中间了?按照这样的取法可以选择好多对开始标记和结束标记,也就是说它们并不是唯一的。但是它们又是相对唯一的,这里的唯一是指,开始标记在第一条新闻以上的代码中唯一,结束标记在开始标记到结束标记之间的是唯一的。
        2.链接开始/结束标记:
                           <a href="News.asp?id=1" target=_blank>新闻标题</a><br>
2、 第二步
点此在新窗口浏览图片

        1.正文设置

    标题、正文、作者、来源、是否正文分类设置、关键字及正文分页设置同上,不想重复,这里就不说了。

        2.采样测试

    正确采样后完成添加操作。   

   

三、使用指南-----历史记录
      历史记录,记录的是所采集过的新闻网址,保留着该新闻的采集状态,也是判断一条新闻是否重复采集的重要依据。

      成功记录:成功采集并保存到动易的数据库中。

      失败记录:采集失败,但动易数据库中没有相关新闻。

      失效记录:动易的数据库中已删除该新闻(不包括失败记录)

   

发表评论】【告诉好友】【打印此文】【收藏此文】【关闭窗口
[2006年07月22日]   来源:本站原创     【字体: 】【双击滚屏
上一篇:没有了 下一篇:新闻采集帮助
 
Copyright © 2006-2008 Skxiu.com

 版权所有 © 2006-2008 SK网络 www.skxiu.com 闽ICP备 06016779号