发布日期:2023-06-01浏览次数:0
首先,在打开火车采集器后,我们需要选择要设置标签的采集任务。在任务列表中,选择需要设置标签的任务,右键点击,选择“编辑任务”即可进入采集任务编辑页面。
接下来,在左侧的“设置”栏目中,选择“标签设置”选项。在标签设置页面中,可以看到标签列表及其对应的采集字段。我们可以根据需要添加、删除、编辑标签,并将其与相应的采集字段关联起来。
在添加标签的过程中,我们可以根据需要设置标签的名称、标签类型、标签值等参数。其中标签类型包括文本、数字、日期等类型,而标签值则可以根据具体需求自行输入或通过JS代码获取。
在删除标签时,需要注意的是,如果某个标签与多个采集字段关联在一起,则删除该标签可能会影响其他采集字段的正常采集。因此,建议在删除标签前先检查其关联情况,确保不会影响其他采集字段的正常采集。
除了添加、删除、编辑标签外,我们还可以通过拖拽的方式调整标签的显示顺序,以便更好地管理和使用标签。
在设置标签时,还需要注意以下几点:
1. 合理命名:标签的命名应该具有明确的语义,避免出现歧义。例如,“标题”标签应该命名为“article_title”,而不是简单地命名为“title”。
2. 合理分配:采集任务中的每个字段都应该分配合适的标签,以便于统一管理和分类。如果一个字段没有对应的标签,那么它就不会被采集器正常采集。
3. 合理组合:不同的标签可以组合使用,以达到更好的采集效果。例如,在采集网页列表时,可以使用“链接”、“标题”、“描述”等标签组合,从而更全面地采集网页信息。
在标签设置完成后,我们可以点击“保存”按钮保存设置,并按需进行其它相关设置。设置完成后,我们可以运行采集任务进行测试,以确保标签设置的准确性和有效性。