[LLM] Support gpt3 fine grained dybatch v1 #7080

yuanlehome · 2023-09-19T08:23:51Z

PR types

Others

PR changes

Others

Description

Support gpt3 fine grained dybatch v1.

…o support_gpt3

paddle-bot · 2023-09-19T08:23:56Z

Thanks for your contribution!

codecov · 2023-09-19T09:01:45Z

Codecov Report

Merging #7080 (d847287) into develop (da02add) will decrease coverage by 0.13%.
Report is 12 commits behind head on develop.
The diff coverage is 0.00%.

@@             Coverage Diff             @@
##           develop    #7080      +/-   ##
===========================================
- Coverage    59.91%   59.78%   -0.13%     
===========================================
  Files          556      558       +2     
  Lines        82037    82217     +180     
===========================================
+ Hits         49149    49152       +3     
- Misses       32888    33065     +177

Files Changed	Coverage Δ
paddlenlp/experimental/transformers/__init__.py	`0.00% <0.00%> (ø)`
...erimental/transformers/fused_transformer_layers.py	`0.00% <0.00%> (ø)`
...enlp/experimental/transformers/generation_utils.py	`0.00% <0.00%> (ø)`
...addlenlp/experimental/transformers/gpt/__init__.py	`0.00% <0.00%> (ø)`
...addlenlp/experimental/transformers/gpt/modeling.py	`0.00% <0.00%> (ø)`

... and 5 files with indirect coverage changes

llm/predictor.py

paddlenlp/experimental/transformers/gpt/modeling.py

zhoutianzi666 · 2023-09-20T07:41:18Z

paddlenlp/experimental/transformers/gpt/modeling.py

+    def set_state_dict(self, state_dict):
+        dtype = paddle.get_default_dtype()
+
+        for k, v in state_dict.items():


这里的if代码有点多啊？能改的和llama里的一样吗？

建议先这样写，因为gpt的模型来源比较复杂，参数名比较乱，这种if写法已经尽可能多的兼容各种命名的模型了

wj-Mcat

代码质量很好，除了以下两个 comment，还有一个小建议：添加单测，等 #7056 合入之后编写一个 test_predictor 的单测呗。

wj-Mcat · 2023-09-20T09:22:36Z

paddlenlp/experimental/transformers/gpt/modeling.py

+        cls, pretrained_model_name_or_path, from_hf_hub: bool = False, subfolder: str | None = None, *args, **kwargs
+    ):
+        # TODO: Support safetensors loading.
+        kwargs["use_safetensors"] = False


Suggested change

kwargs["use_safetensors"] = False

kwargs["use_safetensors"] = kwargs.get("use_safetensors", False)

建议使用这个，因为单分片 safetensors 是可以支持 inferencemodel 加载的。

wj-Mcat · 2023-09-20T09:24:56Z

paddlenlp/experimental/transformers/gpt/modeling.py

+            position_ids = tgt_pos
+            attention_mask = (tgt_generation_mask - 1) * 1e4
+        else:
+            attention_mask = (attention_mask - 1) * 1e4


这里建议使用：paddle.finfo(attention_mask.dtype).min 的方式来转化 attention_mask 的值。

在 bf16 和 fp16 下面不同值域不一样，建议用这个来得到该 dtype 下的最小值。

上面的 tgt_attention_mask 也是需要调整一下。

yuanlehome · 2023-09-20T09:41:29Z

代码质量很好，除了以下两个 comment，还有一个小建议：添加单测，等 #7056 合入之后编写一个 test_predictor 的单测呗。

可以的，我想补充单测和comment指出的问题放在下个PR一块做吧，这个PR先合一版？

yuanlehome added 5 commits September 18, 2023 08:41

support batch_size=1

da3f9ba

support batch_size > 1

953297b

Merge branch 'develop' of /~https://github.com/yuanlehome/PaddleNLP int…

dff8cd2

…o support_gpt3

update

0ebfa8a

support to_static

eb54fc5

yuanlehome added 3 commits September 19, 2023 08:37

add benchmark for dybatch_preprocess

486adef

fix code style

54a4ed6

fix code style

7dccaf1

vivienfanghuagood reviewed Sep 19, 2023

View reviewed changes

llm/predictor.py Show resolved Hide resolved

zhoutianzi666 reviewed Sep 19, 2023

View reviewed changes

paddlenlp/experimental/transformers/gpt/modeling.py Outdated Show resolved Hide resolved

zhoutianzi666 reviewed Sep 19, 2023

View reviewed changes

paddlenlp/experimental/transformers/gpt/modeling.py Show resolved Hide resolved

yuanlehome force-pushed the support_gpt3 branch from bac5c29 to bd27eee Compare September 19, 2023 11:20

fix comment

c7ec8bf

yuanlehome force-pushed the support_gpt3 branch from bd27eee to c7ec8bf Compare September 19, 2023 11:25

update

d847287

zhoutianzi666 reviewed Sep 20, 2023

View reviewed changes

wj-Mcat requested changes Sep 20, 2023

View reviewed changes

wj-Mcat approved these changes Sep 20, 2023

View reviewed changes

wj-Mcat merged commit af28006 into PaddlePaddle:develop Sep 20, 2023

ZHUI mentioned this pull request Jan 2, 2024

PaddleNLP 2.7.0 Release Note Candidate #7753

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[LLM] Support gpt3 fine grained dybatch v1 #7080

[LLM] Support gpt3 fine grained dybatch v1 #7080

yuanlehome commented Sep 19, 2023

paddle-bot bot commented Sep 19, 2023

codecov bot commented Sep 19, 2023 •

edited

Loading

zhoutianzi666 Sep 20, 2023

yuanlehome Sep 20, 2023

wj-Mcat left a comment •

edited

Loading

wj-Mcat Sep 20, 2023

wj-Mcat Sep 20, 2023

yuanlehome commented Sep 20, 2023

	kwargs["use_safetensors"] = False
	kwargs["use_safetensors"] = kwargs.get("use_safetensors", False)

[LLM] Support gpt3 fine grained dybatch v1 #7080

[LLM] Support gpt3 fine grained dybatch v1 #7080

Conversation

yuanlehome commented Sep 19, 2023

PR types

PR changes

Description

paddle-bot bot commented Sep 19, 2023

codecov bot commented Sep 19, 2023 • edited Loading

Codecov Report

zhoutianzi666 Sep 20, 2023

Choose a reason for hiding this comment

yuanlehome Sep 20, 2023

Choose a reason for hiding this comment

wj-Mcat left a comment • edited Loading

Choose a reason for hiding this comment

wj-Mcat Sep 20, 2023

Choose a reason for hiding this comment

wj-Mcat Sep 20, 2023

Choose a reason for hiding this comment

yuanlehome commented Sep 20, 2023

codecov bot commented Sep 19, 2023 •

edited

Loading

wj-Mcat left a comment •

edited

Loading