此页面由 Cloud Translation API 翻译。

Dataflow 作业图

Dataflow 监控界面可提供每个作业的图形表示：即作业图。作业图表还提供了作业摘要、作业日志以及流水线中每个步骤的相关信息。

如需查看作业的作业图，请执行以下步骤：

在 Google Cloud 控制台中，依次前往 Dataflow > 作业页面。

转到作业
选择一个作业。
点击作业图标签页。

在流水线的作业图中，每个方框表示流水线中的一个转换。每个方框都包含转换名称和一些有关作业状态的信息，其中包括以下内容：

正在运行：相应步骤正在运行
已加入队列：FlexRS 作业中的步骤已加入队列
成功：该步骤已成功完成
已停止：由于作业停止，该步骤已停止
未知：该步骤未能报告状态
失败：该步骤未能完成

默认情况下，作业图页面会显示图表视图。如需以表形式查看作业图，请在作业步骤视图中选择表视图。表视图以不同的格式包含相同的信息。表视图在以下场景中非常有用：

您的作业有许多阶段，使作业图难以浏览。
您希望按特定属性对作业步骤进行排序。例如，您可以按实际用时对表进行排序，以识别速度缓慢的步骤。

基本作业图

流水线代码：

Java

  // Read the lines of the input text.
  p.apply("ReadLines", TextIO.read().from(options.getInputFile()))
     // Count the words.
     .apply(new CountWords())
     // Write the formatted word counts to output.
     .apply("WriteCounts", TextIO.write().to(options.getOutput()));

Python

(
    pipeline
    # Read the lines of the input text.
    | 'ReadLines' >> beam.io.ReadFromText(args.input_file)
    # Count the words.
    | CountWords()
    # Write the formatted word counts to output.
    | 'WriteCounts' >> beam.io.WriteToText(args.output_path))

Go

  // Create the pipeline.
  p := beam.NewPipeline()
    s := p.Root()
  // Read the lines of the input text.
  lines := textio.Read(s, *input)
  // Count the words.
  counted := beam.ParDo(s, CountWords, lines)
  // Write the formatted word counts to output.
  textio.Write(s, *output, formatted)

作业图：

图 1：显示的 WordCount 流水线的代码及 Dataflow 监控界面中生成的执行图。

复合转换

复合转换是指包含多个嵌套子转换的转换。在作业图中，您可以展开复合转换。如需展开转换并查看子转换，请点击箭头。

WordCount 流水线作业图，其中展开了 CountWords 转换以显示其组件转换。 — 图 2：CountWords 转换的各子步骤的流水线代码。并显示了展开的整个流水线作业图。

在流水线代码中，您可以使用以下代码来调用复合转换：

result = transform.apply(input);

以这种方式调用的复合转换会忽略预期的嵌套，因此可能会在 Dataflow 监控界面中显示为展开状态。您的流水线在执行时，也可能会产生与固定的唯一名称有关的警告或错误。

如需避免这些问题，请使用建议的格式调用转换：

result = input.apply(transform);

转换名称

Dataflow 可通过几种不同的方式来获取监控作业图中显示的转换名称。转换名称用于公开可见的位置，包括 Dataflow 监控界面、日志文件和调试工具。请勿使用包含个人身份信息（例如用户名或组织名称）的转换名称。

Java

Dataflow 可以使用您在应用转换时分配的名称。您为 apply 方法提供的第一个参数将作为转换名称。
Dataflow 可以推断转换名称：根据类名称（如果您构建自定义转换）或 DoFn 函数对象的名称（如果您使用 ParDo 等核心转换）进行推断。

Python

Dataflow 可以使用您在应用转换时分配的名称。您可以通过指定转换的 label 参数设置转换名称。
Dataflow 可以推断转换名称：根据类名称（如果您构建自定义转换）或 DoFn 函数对象的名称（如果您使用 ParDo 等核心转换）进行推断。

Go

Dataflow 可以使用您在应用转换时分配的名称。您可以通过指定 Scope 来设置转换名称。
Dataflow 可以推断转换名称：根据结构体名称（如果您使用结构体 DoFn）或函数名称（如果您使用函数 DoFn）进行推断。

查看步骤信息

点击作业图中的某个步骤时，步骤信息面板会显示有关该步骤的更详细信息。如需了解详情，请参阅作业步信息。

Dataflow 作业图 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

基本作业图

Java

Python

Go

复合转换

Java

Python

Go

转换名称

Java

Python

Go

查看步骤信息

Dataflow 作业图