BsKPLu的小库

标题3：了解用户界面自动化

UiPath 中用户界面自动化的关键概念包括：“用户界面自动化”活动、活动属性、定位方法、输入和输出方法、录制器、对象存储库和计算机视觉。

“用户界面自动化”活动：
- 理解: 这些是 UiPath 用于与应用程序界面交互的基本构建块。它们就像“命令”一样，告诉机器人要做什么。
- 分类：
  - 容器活动： 用于组织其他活动，并定义操作的范围。例如 Attach Browser, Attach Window, Open Application 等。它们的作用类似于“容器”，包含了其他活动的执行上下文。
  - 输入活动： 模拟用户的输入行为，例如 Type Into, Click, Check, Select Item 等。它们负责将数据或指令“输入”到应用程序中。
  - 输出活动： 从 UI 元素中提取数据，例如 Get Text, Get Attribute, Get OCR Text 等。它们负责从应用程序中“输出”数据。
  - 同步活动： 用于控制自动化流程的执行顺序和时机，例如 Delay, Element Exists, Wait Element Vanish, Wait For Ready 等。它们确保操作在正确的时间执行。
- 重要性: 掌握各种活动的用途和特性，是构建复杂自动化流程的基础。
活动属性：
- 理解: 每个活动都有自己的属性，这些属性决定了该活动如何执行操作。
- 作用:
  - 定位目标元素： 例如，使用 Selector 属性指定要操作的 UI 元素。
  - 设置输入内容： 例如，使用 Text 属性指定 Type Into 活动要输入的文本。
  - 配置超时时间： 例如，使用 TimeoutMS 属性设置等待元素出现的最大时间。
  - 调整活动行为： 例如，使用 ClickType 属性指定 Click 活动的点击方式（例如，CLICK_SINGLE, CLICK_DOUBLE）。
- 重要性: 正确配置活动属性是确保活动正常执行的关键。
  补充：可以在 UiPath Studio 的 “属性” 面板中找到和修改这些属性。
定位方法：
- 理解: 这些方法决定了机器人如何找到它需要与之交互的 UI 元素。
- 类型：
  - 选择器 (Selectors): 上面详细解释过了，这是最常用的方法，利用 XML 片段来定位元素。
  - 锚点 (Anchors): 用于解决元素位置不稳定的问题，通过定位相对稳定的元素来定位目标元素。
  - 图像识别： 通过图像匹配来定位元素，适用于难以使用选择器的场景 (例如，虚拟桌面)。
  - 计算机视觉： 基于 AI 模型识别 UI 元素，可以不需要选择器。
  - OCR: 用于从图像或 PDF 中提取文本
- 重要性: 选择合适的定位方法可以提高自动化流程的稳定性。
输入和输出方法：
- 理解: 这描述了机器人与 UI 元素交互的技术类型。
- 输出方法 (从 UI 元素提取数据):
  - 获取文本: 最常用的方法，用于从文本元素中提取文本。
  - 获取属性: 用于提取元素的属性值（例如，href 链接，src 图片路径等）。
  - 获取 OCR 文本: 用于从图像或 PDF 中提取文本。
- 输入方法 (与 UI 元素交互):
  - 点击: 模拟点击操作。
  - 输入文本:** 在文本框中输入文本。
  - 选中/取消选中: 操作复选框。
  - 选择项目: 从下拉列表中选择选项。
  - 发送快捷键: 模拟键盘按键操作。
  - 设置文本: 设置元素的文本内容（可能不适用于所有元素）。
  - 模拟输入： 使用 Simulate 输入方法可以更快地输入文本，但可能不兼容某些应用程序。
  - 窗口消息输入: 通过直接向窗口发送消息实现输入，通常在后台运行。
- 重要性: 了解不同的方法可以帮助你选择适合特定场景的技术。
录制器和向导：
- 理解: 这些是 UiPath 中用于简化自动化流程创建的工具。
- 作用: 录制器可以记录你在屏幕上的操作，并将其转换为 UiPath 活动序列。向导可以引导你完成特定的自动化任务。
- 类型：
  - 基本录制： 记录鼠标点击和键盘输入。
  - 桌面录制： 适用于桌面应用程序的录制。
  - Web 录制： 适用于 Web 应用程序的录制。
- 重要性: 录制器可以帮助你快速创建基本自动化流程，但你仍然需要手动调整录制结果，并对其进行改进。
对象存储库：
- 理解: 这是 UiPath 中一个用于存储和管理 UI 元素的对象库。
- 作用:
  - 提高复用性： 可以将常用的 UI 元素存储为对象，并在多个自动化流程中复用。
  - 提高可维护性： 当 UI 发生变化时，只需要修改存储库中的对象，所有使用该对象的流程都会自动更新。
  - 提高可靠性： 可以使用对象存储库创建可靠的选择器，减少错误。
- 重要性: 对象存储库是大型自动化项目和团队协作的必备功能。
AI 计算机视觉：
- 理解: 这是 UiPath 基于人工智能的 UI 自动化技术。
- 作用:
  - 无需选择器： 可以直接识别屏幕上的 UI 元素，不需要手动创建选择器。
  - 处理复杂界面： 适用于传统方法难以处理的复杂界面，例如虚拟桌面
- 重要性: 这是未来 UI 自动化的趋势，可以帮助你构建更加智能和强大的自动化流程。

设计体验：

新式活动仅在容器中有效，而传统活动则可被配置为在没有容器的情况下工作。

新式活动将在堆栈选项“选取器”、“模糊****选取器”和**“图像**”中循环，以确定最可靠的选项。这种定位技术被称为“**统一定位方法”。

两种体验的不同之处在于：

**活动：**两种体验都提供不同的活动，但您可以筛选“活动”窗格，以查看非默认体验中的活动。
**活动属性：**新式活动和传统活动之间的属性略有不同。
**定位方法：**新式体验使用“统一目标”（“选取器”、“模糊选取器”和“图像”的堆积）和“原生文本”，而传统体验主要使用“选取器”。
输入方法：新式体验使用“硬件事件”、“发送窗口消息”、“模拟”和“Chromium API”，而传统体验则使用“硬件事件”、“发送窗口消息”、“模拟”。
**录制器：**新式体验提供简化的录制解决方案，其中包含两个录制器，而传统录制器则提供六个录制器。
**抓取向导：**新式体验提供“表格数据提取”向导，而传统则提供“数据抓取”和“屏幕抓取”向导。
对象存储库：对象存储库仅适用于新式设计体验。

Chromium API 是一种基于 Devtools 协议的浏览器自动化输入方法。该方法完全兼容 Chrome 或 Edge 等基于 Chromium 的浏览器。基本上，该方法可处理在 Chromium 浏览器中执行的任何网站或应用程序。它适用于以下活动：

使用应用程序/浏览器
单击
输入信息
悬停
键盘快捷方式