如何使用批量编辑中的自动爬虫抓取采集源的相关信息?
发表于:2020年07月21日 15:08:36更新于:2020年07月21日 15:09:23
有时候采集源中包含特殊信息,如:货号,运费等信息,旺销王在采集过程中有时候不会给您提供完善的采集结果
此时您可以通过下面的方法自定义采集爬虫配置,并将相关信息采集到您的自定义字段中
场景介绍
1、您可以通过采集源网站货号来将其存储到产品字段中
2、您可以通过采集源网站的运费从而换算倒推重量等
如何配置?
下面举例如何采集17网货号为例,如何采集该产品中的“货号”值
首先,在“高级”菜单中增加自定义字段如“17网货号”
并在批量编辑中,选择“自定义字段”
效果展示:
自定义字段有何用?
可以方便用来查找
在采集项目中输入下面的文本即可
<div class="parameter-left">|</a>
REGEX:<.+?>|
REPLACE:货|
REPLACE:空号|
REPLACE: |
TRIM
命令符号介绍
一般替换
以 REPLACE: 作为前缀,查找内容 | 替换内容
如:
REPLACE: 男|女
意思是将凡是结果中的男都改为女
REPLACE: 替换
REGEX: 正则替换
TRIM 前后去空格换行等
JSON:JS脚本识别JSON内容返回属性值(仅供程序员使用)