软件介绍

多模板自适应采集

此项功能是新2独有的。
对于大型网站的综合类栏目的内容页面,往往都是版面种类丰富。(典型的如阿里巴巴、慧聪中的二级企业网站,多大门户网站非新闻板块等等)。此时如果是设置一个模板,是无法采集完整的。如果需要完整采集数据,就需要针对该板块出现的不同页面版面风格,分别建立一套自定义模板,这样才有可能采集完整。
实际采集中,自始至终都是单一版面风格页面的场合,越来越少,存在多版面的场合越来越多、越来越复杂,数据采集的完整性也就越来越困难。

多模板采集

新2独有的多模板功能,可以针对实际需要,新增足够多的模板,来确保采集结果数据的100%完整。采集结果数据的“完整度”,是衡量一个采集软件成熟度的基本特征之一,但往往被忽视。
新2在采集运行时,会将所有定义的模板和采集目标页面,做一个相似度的分析,并按相似度做一个排序。按相似度排序后的顺序,逐个进行模板匹配,直到匹配成功。
如上图所示,列表的右上方有个按钮“模板均失败时改用自动解析模式”。此功能是确保在意外遗漏的情况下,启用系统的自动分析功能,来做一个最终的补救。

新2独有的部分高级功能分项阐述

电话:021-51601615

手机:13916186547

服务时间:周一至周五(09:00-18:00)

邮箱:123jlxie@163.com

友情链接:

Copyright @ 2011 All Rights Reserved 新2网址信息科技有限公司 沪ICP备16048952号-4