Skip to content

标题3:了解用户界面自动化

UiPath 中用户界面自动化的关键概念包括:“用户界面自动化”活动、活动属性、定位方法、输入和输出方法、录制器、对象存储库和计算机视觉。

  1. “用户界面自动化”活动:

    • 理解: 这些是 UiPath 用于与应用程序界面交互的基本构建块。它们就像“命令”一样,告诉机器人要做什么。
    • 分类:
      • 容器活动: 用于组织其他活动,并定义操作的范围。例如 Attach Browser, Attach Window, Open Application 等。它们的作用类似于“容器”,包含了其他活动的执行上下文。
      • 输入活动: 模拟用户的输入行为,例如 Type Into, Click, Check, Select Item 等。它们负责将数据或指令“输入”到应用程序中。
      • 输出活动: 从 UI 元素中提取数据,例如 Get Text, Get Attribute, Get OCR Text 等。它们负责从应用程序中“输出”数据。
      • 同步活动: 用于控制自动化流程的执行顺序和时机,例如 Delay, Element Exists, Wait Element Vanish, Wait For Ready 等。它们确保操作在正确的时间执行。
    • 重要性: 掌握各种活动的用途和特性,是构建复杂自动化流程的基础。
  2. 活动属性:

    • 理解: 每个活动都有自己的属性,这些属性决定了该活动如何执行操作。

    • 作用:

      • 定位目标元素: 例如,使用 Selector 属性指定要操作的 UI 元素。
      • 设置输入内容: 例如,使用 Text 属性指定 Type Into 活动要输入的文本。
      • 配置超时时间: 例如,使用 TimeoutMS 属性设置等待元素出现的最大时间。
      • 调整活动行为: 例如,使用 ClickType 属性指定 Click 活动的点击方式(例如,CLICK_SINGLE, CLICK_DOUBLE)。
    • 重要性: 正确配置活动属性是确保活动正常执行的关键。

      补充:可以在 UiPath Studio 的 “属性” 面板中找到和修改这些属性。

  3. 定位方法:

    • 理解: 这些方法决定了机器人如何找到它需要与之交互的 UI 元素。
    • 类型:
      • 选择器 (Selectors): 上面详细解释过了,这是最常用的方法,利用 XML 片段来定位元素。
      • 锚点 (Anchors): 用于解决元素位置不稳定的问题,通过定位相对稳定的元素来定位目标元素。
      • 图像识别: 通过图像匹配来定位元素,适用于难以使用选择器的场景 (例如,虚拟桌面)。
      • 计算机视觉: 基于 AI 模型识别 UI 元素,可以不需要选择器。
      • OCR: 用于从图像或 PDF 中提取文本
    • 重要性: 选择合适的定位方法可以提高自动化流程的稳定性。
  4. 输入和输出方法:

    • 理解: 这描述了机器人与 UI 元素交互的技术类型。
    • 输出方法 (从 UI 元素提取数据):
      • 获取文本: 最常用的方法,用于从文本元素中提取文本。
      • 获取属性: 用于提取元素的属性值(例如,href 链接,src 图片路径等)。
      • 获取 OCR 文本: 用于从图像或 PDF 中提取文本。
    • 输入方法 (与 UI 元素交互):
      • 点击: 模拟点击操作。
      • 输入文本:** 在文本框中输入文本。
      • 选中/取消选中: 操作复选框。
      • 选择项目: 从下拉列表中选择选项。
      • 发送快捷键: 模拟键盘按键操作。
      • 设置文本: 设置元素的文本内容(可能不适用于所有元素)。
      • 模拟输入: 使用 Simulate 输入方法可以更快地输入文本,但可能不兼容某些应用程序。
      • 窗口消息输入: 通过直接向窗口发送消息实现输入,通常在后台运行。
    • 重要性: 了解不同的方法可以帮助你选择适合特定场景的技术。
  5. 录制器和向导:

    • 理解: 这些是 UiPath 中用于简化自动化流程创建的工具。
    • 作用: 录制器可以记录你在屏幕上的操作,并将其转换为 UiPath 活动序列。向导可以引导你完成特定的自动化任务。
    • 类型:
      • 基本录制: 记录鼠标点击和键盘输入。
      • 桌面录制: 适用于桌面应用程序的录制。
      • Web 录制: 适用于 Web 应用程序的录制。
    • 重要性: 录制器可以帮助你快速创建基本自动化流程,但你仍然需要手动调整录制结果,并对其进行改进。
  6. 对象存储库:

    • 理解: 这是 UiPath 中一个用于存储和管理 UI 元素的对象库。
    • 作用:
      • 提高复用性: 可以将常用的 UI 元素存储为对象,并在多个自动化流程中复用。
      • 提高可维护性: 当 UI 发生变化时,只需要修改存储库中的对象,所有使用该对象的流程都会自动更新。
      • 提高可靠性: 可以使用对象存储库创建可靠的选择器,减少错误。
    • 重要性: 对象存储库是大型自动化项目和团队协作的必备功能。
  7. AI 计算机视觉:

    • 理解: 这是 UiPath 基于人工智能的 UI 自动化技术。
    • 作用:
      • 无需选择器: 可以直接识别屏幕上的 UI 元素,不需要手动创建选择器。
      • 处理复杂界面: 适用于传统方法难以处理的复杂界面,例如虚拟桌面
    • 重要性: 这是未来 UI 自动化的趋势,可以帮助你构建更加智能和强大的自动化流程。

设计体验:

新式活动仅在容器中有效,而传统活动则可被配置为在没有容器的情况下工作。

新式活动将在堆栈选项“选取器”、“模糊****选取器”和**“图像**”中循环,以确定最可靠的选项。这种定位技术被称为“**统一定位方法”。

两种体验的不同之处在于:

  • **活动:**两种体验都提供不同的活动,但您可以筛选“活动”窗格,以查看非默认体验中的活动。
  • **活动属性:**新式活动和传统活动之间的属性略有不同。
  • **定位方法:**新式体验使用“统一目标”(“选取器”、“模糊选取器”和“图像”的堆积)和“原生文本”,而传统体验主要使用“选取器”。
  • 输入方法:新式体验使用“硬件事件”、“发送窗口消息”、“模拟”和“Chromium API”,而传统体验则使用“硬件事件”、“发送窗口消息”、“模拟”。
  • **录制器:**新式体验提供简化的录制解决方案,其中包含两个录制器,而传统录制器则提供六个录制器。
  • **抓取向导:**新式体验提供“表格数据提取”向导,而传统则提供“数据抓取”和“屏幕抓取”向导。
  • 对象存储库:对象存储库仅适用于新式设计体验。

Chromium API 是一种基于 Devtools 协议的浏览器自动化输入方法。该方法完全兼容 Chrome 或 Edge 等基于 Chromium 的浏览器。基本上,该方法可处理在 Chromium 浏览器中执行的任何网站或应用程序。它适用于以下活动:

  • 使用应用程序/浏览器
  • 单击
  • 输入信息
  • 悬停
  • 键盘快捷方式