Fix inaccurate return of low precision op list #49391

AnnaTrainingG · 2022-12-28T05:58:12Z

PR types

Bug fixes

PR changes

Others

Describe

修复低精度算子列表获取不准确的问题。

说明：

整个功能通过FLAGS_low_precision_op_list环境变量控制，环境变量默认为0
在模型运行结束调用： paddle.amp.low_precision_op_list()

用法:

FLAGS_low_precision_op_list=1:返回当前模型前向低精度算子列表，便于低精度训练加入黑名单，注意对于inplace的OP无法通过加入黑名单的方式接触低精度运算。

FLAGS_low_precision_op_list=2:返回当前模型前向算子列表，便于查看算子列表。

paddle-bot · 2022-12-28T05:58:16Z

你的PR提交成功，感谢你对开源项目的贡献!
请关注后续CI自动化测试结果，详情请参考Paddle-CI手册。
Your PR has been submitted. Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

zyfncg · 2023-01-03T12:38:36Z

paddle/phi/api/yaml/generator/api_base.py

@@ -1189,6 +1189,7 @@ def gen_kernel_code(self, kernel_name, code_indent, inplace_flag=False):
 {code_indent}  auto kernel_result = phi::KernelFactory::Instance().SelectKernelOrThrowError(
 {code_indent}      "{kernel_name}", {{kernel_backend, kernel_layout, kernel_data_type}});
 {code_indent}  const auto& kernel = kernel_result.kernel;
+{code_indent}  phi::KernelFactory::Instance().AddToLowPrecisionKernelList("{self.api}", kernel_data_type);


感觉可以把 if 判断条件加在这一层以进一步减少额外的调用开销

zyfncg · 2023-01-03T12:38:56Z

paddle/phi/api/yaml/generator/sparse_api_gen.py

@@ -221,6 +221,7 @@ def gen_sparse_kernel_code(self, kernel_name, inplace_flag=False):
    auto kernel_result = phi::KernelFactory::Instance().SelectKernelOrThrowError(
        "{kernel_name}", {{kernel_backend, kernel_layout, kernel_data_type}});
    const auto& phi_kernel = kernel_result.kernel;
+    phi::KernelFactory::Instance().AddToLowPrecisionKernelList("{self.api}", kernel_data_type);


zyfncg · 2023-01-03T12:39:02Z

paddle/phi/api/yaml/generator/strings_api_gen.py

@@ -210,6 +210,7 @@ def gen_string_tensor_kernel_code(self, inplace_flag=False, code_indent=""):
  VLOG(6) << "{self.api} api strings kernel key: [" << kernel_backend << ", " << kernel_layout << ", "<< kernel_data_type << "]";
  auto kernel_result = phi::KernelFactory::Instance().SelectKernelOrThrowError(
      "{self.kernel['func'][0]}", {{kernel_backend, kernel_layout, kernel_data_type}});
+  phi::KernelFactory::Instance().AddToLowPrecisionKernelList("{self.api}", kernel_data_type);


zhangting2020 · 2023-01-05T12:32:46Z

TODO：
（1）将FP32和FP16的OP列表打印出来，类似于：

OP Name                             FP16 Calls             FP32 Calls
conv2d                                  100                   0
elementwise_add                          20                   30

（2）不需要环境变量通过1、2这种等级控制，默认打印出来模型中所有算子的列表。在AMP任务中，一些算子可能是FP16或者FP32 Kernel都会调用

zhangting2020

LGTM

AnnaTrainingG force-pushed the fix_amp_lit branch 2 times, most recently from f21b5ee to f6faa79 Compare January 3, 2023 08:01

zyfncg reviewed Jan 3, 2023

View reviewed changes

AnnaTrainingG force-pushed the fix_amp_lit branch from f6faa79 to 9a5fc61 Compare January 4, 2023 11:13

AnnaTrainingG added 5 commits January 5, 2023 02:20

update

2b25d99

update

6ec196f

update o2

e328f18

udpate

902ed77

Add Flag to .cc

6bf8c20

AnnaTrainingG force-pushed the fix_amp_lit branch from 9a5fc61 to 6bf8c20 Compare January 5, 2023 02:21

update

4853ecb

AnnaTrainingG requested review from zyfncg and lanxianghit January 5, 2023 11:26

zyfncg approved these changes Jan 5, 2023

View reviewed changes

zkh2016 approved these changes Jan 5, 2023

View reviewed changes

zhangting2020 approved these changes Jan 5, 2023

View reviewed changes

lanxianghit approved these changes Jan 6, 2023

View reviewed changes

AnnaTrainingG merged commit a214e5d into PaddlePaddle:develop Jan 6, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Fix inaccurate return of low precision op list #49391

Fix inaccurate return of low precision op list #49391

AnnaTrainingG commented Dec 28, 2022 •

edited

Loading

paddle-bot bot commented Dec 28, 2022

zyfncg Jan 3, 2023

AnnaTrainingG Jan 5, 2023

zyfncg Jan 3, 2023

AnnaTrainingG Jan 5, 2023

zyfncg Jan 3, 2023

AnnaTrainingG Jan 5, 2023

zhangting2020 commented Jan 5, 2023 •

edited

Loading

zhangting2020 left a comment

Fix inaccurate return of low precision op list #49391

Fix inaccurate return of low precision op list #49391

Conversation

AnnaTrainingG commented Dec 28, 2022 • edited Loading

PR types

PR changes

Describe

说明：

用法:

FLAGS_low_precision_op_list=1:返回当前模型前向低精度算子列表，便于低精度训练加入黑名单，注意对于inplace的OP无法通过加入黑名单的方式接触低精度运算。

FLAGS_low_precision_op_list=2:返回当前模型前向算子列表，便于查看算子列表。

paddle-bot bot commented Dec 28, 2022

zyfncg Jan 3, 2023

Choose a reason for hiding this comment

AnnaTrainingG Jan 5, 2023

Choose a reason for hiding this comment

zyfncg Jan 3, 2023

Choose a reason for hiding this comment

AnnaTrainingG Jan 5, 2023

Choose a reason for hiding this comment

zyfncg Jan 3, 2023

Choose a reason for hiding this comment

AnnaTrainingG Jan 5, 2023

Choose a reason for hiding this comment

zhangting2020 commented Jan 5, 2023 • edited Loading

zhangting2020 left a comment

Choose a reason for hiding this comment

AnnaTrainingG commented Dec 28, 2022 •

edited

Loading

zhangting2020 commented Jan 5, 2023 •

edited

Loading