标题3:了解用户界面自动化
UiPath 中用户界面自动化的关键概念包括:“用户界面自动化”活动、活动属性、定位方法、输入和输出方法、录制器、对象存储库和计算机视觉。
“用户界面自动化”活动:
- 理解: 这些是 UiPath 用于与应用程序界面交互的基本构建块。它们就像“命令”一样,告诉机器人要做什么。
- 分类:
- 容器活动: 用于组织其他活动,并定义操作的范围。例如
Attach Browser
,Attach Window
,Open Application
等。它们的作用类似于“容器”,包含了其他活动的执行上下文。 - 输入活动: 模拟用户的输入行为,例如
Type Into
,Click
,Check
,Select Item
等。它们负责将数据或指令“输入”到应用程序中。 - 输出活动: 从 UI 元素中提取数据,例如
Get Text
,Get Attribute
,Get OCR Text
等。它们负责从应用程序中“输出”数据。 - 同步活动: 用于控制自动化流程的执行顺序和时机,例如
Delay
,Element Exists
,Wait Element Vanish
,Wait For Ready
等。它们确保操作在正确的时间执行。
- 容器活动: 用于组织其他活动,并定义操作的范围。例如
- 重要性: 掌握各种活动的用途和特性,是构建复杂自动化流程的基础。
活动属性:
理解: 每个活动都有自己的属性,这些属性决定了该活动如何执行操作。
作用:
- 定位目标元素: 例如,使用
Selector
属性指定要操作的 UI 元素。 - 设置输入内容: 例如,使用
Text
属性指定Type Into
活动要输入的文本。 - 配置超时时间: 例如,使用
TimeoutMS
属性设置等待元素出现的最大时间。 - 调整活动行为: 例如,使用
ClickType
属性指定Click
活动的点击方式(例如,CLICK_SINGLE
,CLICK_DOUBLE
)。
- 定位目标元素: 例如,使用
重要性: 正确配置活动属性是确保活动正常执行的关键。
补充:可以在 UiPath Studio 的 “属性” 面板中找到和修改这些属性。
定位方法:
- 理解: 这些方法决定了机器人如何找到它需要与之交互的 UI 元素。
- 类型:
- 选择器 (Selectors): 上面详细解释过了,这是最常用的方法,利用 XML 片段来定位元素。
- 锚点 (Anchors): 用于解决元素位置不稳定的问题,通过定位相对稳定的元素来定位目标元素。
- 图像识别: 通过图像匹配来定位元素,适用于难以使用选择器的场景 (例如,虚拟桌面)。
- 计算机视觉: 基于 AI 模型识别 UI 元素,可以不需要选择器。
- OCR: 用于从图像或 PDF 中提取文本
- 重要性: 选择合适的定位方法可以提高自动化流程的稳定性。
输入和输出方法:
- 理解: 这描述了机器人与 UI 元素交互的技术类型。
- 输出方法 (从 UI 元素提取数据):
- 获取文本: 最常用的方法,用于从文本元素中提取文本。
- 获取属性: 用于提取元素的属性值(例如,
href
链接,src
图片路径等)。 - 获取 OCR 文本: 用于从图像或 PDF 中提取文本。
- 输入方法 (与 UI 元素交互):
- 点击: 模拟点击操作。
- 输入文本:** 在文本框中输入文本。
- 选中/取消选中: 操作复选框。
- 选择项目: 从下拉列表中选择选项。
- 发送快捷键: 模拟键盘按键操作。
- 设置文本: 设置元素的文本内容(可能不适用于所有元素)。
- 模拟输入: 使用
Simulate
输入方法可以更快地输入文本,但可能不兼容某些应用程序。 - 窗口消息输入: 通过直接向窗口发送消息实现输入,通常在后台运行。
- 重要性: 了解不同的方法可以帮助你选择适合特定场景的技术。
录制器和向导:
- 理解: 这些是 UiPath 中用于简化自动化流程创建的工具。
- 作用: 录制器可以记录你在屏幕上的操作,并将其转换为 UiPath 活动序列。向导可以引导你完成特定的自动化任务。
- 类型:
- 基本录制: 记录鼠标点击和键盘输入。
- 桌面录制: 适用于桌面应用程序的录制。
- Web 录制: 适用于 Web 应用程序的录制。
- 重要性: 录制器可以帮助你快速创建基本自动化流程,但你仍然需要手动调整录制结果,并对其进行改进。
对象存储库:
- 理解: 这是 UiPath 中一个用于存储和管理 UI 元素的对象库。
- 作用:
- 提高复用性: 可以将常用的 UI 元素存储为对象,并在多个自动化流程中复用。
- 提高可维护性: 当 UI 发生变化时,只需要修改存储库中的对象,所有使用该对象的流程都会自动更新。
- 提高可靠性: 可以使用对象存储库创建可靠的选择器,减少错误。
- 重要性: 对象存储库是大型自动化项目和团队协作的必备功能。
AI 计算机视觉:
- 理解: 这是 UiPath 基于人工智能的 UI 自动化技术。
- 作用:
- 无需选择器: 可以直接识别屏幕上的 UI 元素,不需要手动创建选择器。
- 处理复杂界面: 适用于传统方法难以处理的复杂界面,例如虚拟桌面
- 重要性: 这是未来 UI 自动化的趋势,可以帮助你构建更加智能和强大的自动化流程。
设计体验:
新式活动仅在容器中有效,而传统活动则可被配置为在没有容器的情况下工作。
新式活动将在堆栈选项“选取器”、“模糊****选取器”和**“图像**”中循环,以确定最可靠的选项。这种定位技术被称为“**统一定位方法”。
两种体验的不同之处在于:
- **活动:**两种体验都提供不同的活动,但您可以筛选“活动”窗格,以查看非默认体验中的活动。
- **活动属性:**新式活动和传统活动之间的属性略有不同。
- **定位方法:**新式体验使用“统一目标”(“选取器”、“模糊选取器”和“图像”的堆积)和“原生文本”,而传统体验主要使用“选取器”。
- 输入方法:新式体验使用“硬件事件”、“发送窗口消息”、“模拟”和“Chromium API”,而传统体验则使用“硬件事件”、“发送窗口消息”、“模拟”。
- **录制器:**新式体验提供简化的录制解决方案,其中包含两个录制器,而传统录制器则提供六个录制器。
- **抓取向导:**新式体验提供“表格数据提取”向导,而传统则提供“数据抓取”和“屏幕抓取”向导。
- 对象存储库:对象存储库仅适用于新式设计体验。
Chromium API 是一种基于 Devtools 协议的浏览器自动化输入方法。该方法完全兼容 Chrome 或 Edge 等基于 Chromium 的浏览器。基本上,该方法可处理在 Chromium 浏览器中执行的任何网站或应用程序。它适用于以下活动:
- 使用应用程序/浏览器
- 单击
- 输入信息
- 悬停
- 键盘快捷方式