粒元RPA-贴近业务的数字员工
首页
下载中心
联系我们
首页
下载中心
联系我们
数据抓取
复制页面
新手引导
安装向导
软件操作自动化
手机自动化-安卓手机端配置
与Excel的交互
数据的表达
三大逻辑:判断、等待与循环
应用搭建的基本概念
应用搭建的一般流程
搭建一个网页自动化流程
界面功能板块介绍
功能介绍
应用编辑相关
全局变量
添加资源文件
子流程
流程参数
运行日志
元素库
元素捕捉
应用运行相关
应用运行的方式
指令文档
条件判断
IF元素存在(win)
IF文件夹存在
IF文件存在
IF窗口存在
IF元素可见(web)
End IF
Else IF
Else
循环
For次数循环
while条件循环
无限循环
循环相似元素(win)
循环子元素(web)
循环相似元素(web)
ForEach列表循环
继续下一次循环
退出循环
循环结束
等待
等待文件
等待元素(win)
等待元素(web)
等待
网页自动化
获取下拉框选项(web)
点击元素(web)
设置下拉框(web)
获取已打开的网页对象
填写输入框(web)
鼠标悬停在元素上(web)
获取元素信息(web)
关闭网页
打开网页
桌面软件自动化
填写输入框(win)
点击元素(win)
获取窗口对象
运行或打开
鼠标悬停在元素上(win)
获取元素信息(win)
关闭软件窗口
截屏
手机自动化
点击元素
等待元素
获取元素信息
填写输入框
获取设备信息
获取相似元素列表(手机)
发送文本到剪切板(手机)
启动app
终止app
屏幕截图
唤醒屏幕
锁定屏幕
文件同步
点击按键
获取元素对象(手机)
执行shell命令
回到首页
获取手机剪切板文本
触摸滑动
鼠标键盘
获取鼠标当前位置
键盘输入
鼠标点击
滚动鼠标滚轮
移动鼠标
办公文档
Excel表格
打开Excel
释放Excel
获取当前激活的Excel对象
删除Excel行
拷贝粘贴Excel内容
拷贝sheet页
读取Excel内容
写入内容至Excel工作表
循环Excel内容
保存/另存Excel
PDF
导出新PDF文档
合并PDF文档
PDF提取表格
PDF提取图片
PDF提取文本
数据处理
设置变量
打印日志
设置随机数
文本操作
获取文本长度
追加新文本
截取一段文本
补齐文本至指定长度
删除文本两端的空格
文本分割成列表
列表聚合成文本
改变文本的大小写
从文本中提取内容
文本替换
列表操作
获取列表长度
反转列表
列表随机排序
列表排序
清空列表
列表插入一项
删除列表一项
修改列表指定位置项的值
获取列表指定位置项
过滤列表中的多项
获取两个列表的相同项
合并列表
列表去重
字典
删除字典键值 对
设置键值对
获取键值
获取字典值列表
获取字典键名列表
日期时间
时间戳转换为日期时间
日期时间转换为时间戳
获取时间间隔
转换到日期时间
增加/减少时间
获取当前日期时间
csv读写
数据写入CSV
读取CSV数据
操作系统
文件
写入文件
读取文件
拷贝文件
获取文件列表
删除文件
文件重命名
文件夹
获取系统文件夹路径
打开文件夹
获取文件夹列表
文件夹重命名
拷贝文件夹
清空文件夹
删除文件夹
创建文件夹
网络
http
Http下载
Http请求
群通知
企业微信群通知
钉钉群通知
飞书群通知
邮件
获取邮件
发送邮件
流程/应用
调用应用
删除自定义数据
终止应用
读取自定义数据
保存自定义数据
获取资源文件路径
调用流程
退出流程
人工智能AI
配置AI引擎
卡证识别
票据识别
其他
Try
Catch
Finally
End Try
实战案例
社交平台
【微信】按指定时间发送指定文件夹内容到微信朋友圈
【微信/企业微信】批量添加好友
【微信/企业微信】批量发送消息
【微信】删除单向好友
【微信】批量发送模板消息
【抖音】直播间自动发送弹幕
【抖音】自动批量发布视频
微博百度热搜收集
电商
【京东】商品差评抓取
生活服务
支付宝会员签到领取积分
支付宝账单下载
支付宝下载饮品优惠券信息
数据抓取
行业数据抓取 - 进口棉价格
企业流程提效
财务小帮手 - 票据的自动整理
个人提效
基金筛选
小红书app缓存清除
首页
下载中心
联系我们
首页
下载中心
联系我们
数据抓取
复制页面
行业数据抓取 - 进口棉价格
一、背景
#
期货研究员做研究时,需要大量的数据支撑。这些数据来源都是各个行业网站,有些网站会提供连续的数据,能够很方便的导出使用,但是有些网站提供的数据不是连续性的,是通过日报或者文章每天定时公布当天的数据,此时就需要研究员每天固定时间点去网站摘录,而这些网站数量较多或者需要摘抄的指标较多时,就需要花费大量的时间精力。
这里我们采用“粒元数字员工”做了一个简单的自动化采集流程,每日定时采集数据,并且可以根据需要进行补充采集漏采的数据。
下面是执行效果:
二、流程梳理
#
1.
按照指定网站打开网站,这里以进口棉价格为例,进口保价数据地址:
https://www.cncotton.com/#/list?name=%E8%BF%9B%E5%8F%A3%E6%A3%89%E6%8A%A5%E4%BB%B7
2.
判断当日数据是否有更新,有更新则点击进入当日数据详情,没有则结束流程,等待下次抓取
3.
根据所需指标采集原始数据,这里采集国际棉花价格指数(SM)、国际棉花价格指数(M)、美国C/A棉、美国C/A棉、美国E/MOT棉、澳棉、巴西棉、乌兹别克斯坦棉、西非棉、印度棉、美国E/MOT M 1-3/32″级棉这几个指标
4.
处理采集下来的数据
5.
写入Excel保存
三、流程编辑
#
1、打开网站
2、判断最最新文章日期
3、网页原始数据抓取
4、数据处理,把所需的指标从原始数据里面提取出来,并规范化输出
5、数据写入Excel
四、补采流程
#
采集任务每日定时运行,数据有可能因为延迟公布、网络异常、系统运行异常等原因没有采集到,所以我们需要一个补充采集的流程,根据设置定的时间段,自动采集时间段所有的数据并输出存储到Excel。
1. 关键逻辑判断如下:
2. 需要补采时,在运行参数中“是否补采”设置为“是”,并设定补采时间段即可运行补采逻辑
五、总结
#
这种数据采集可以写python脚本抓取,但是如果网站出现变动或者增加指标时,需要调整修改脚本,而且还要部署环境,不便研究员操作。如果采用“粒元RPA”采集,通过拖拽操作即可完成采集配置,设置定时任务定期执行,即可满足需求。
目前研究员朋友试用之后表示,他负责的3个品种,42个网站的数据抓取,他配置了其中的10个,这10个原来每天需要花将近1个小时的时间,现在只用鼠标点点,检查下抓取下来的数据,大约3分钟不到。他已经开始给他同事推广了,太省事了~
此流程已上架有需要可领取试用,领取链接:
https://www.cxplan.cn/sso/share-app/637813169683742720
。
扫码加入 粒元RPA交流群
在这里,获得 粒元RPA 使用上的任何帮助,快速上手让你的工作效率得到大幅提升
扫码加入粒元RPA交流群
修改于
2026-02-24 04:00:41
上一页
支付宝下载饮品优惠券信息
下一页
财务小帮手 - 票据的自动整理