huggingface · lewtun · Nov 1, 2022 · Oct 14, 2022 · Oct 17, 2022 · Oct 17, 2022
diff --git a/scripts/setfit/cal_score.py b/scripts/setfit/cal_score.py
@@ -0,0 +1,50 @@
+import argparse
+import json
+from os import listdir
+from os.path import isdir, isfile, join
+
+import numpy as np
+
+
+def parse_args():
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "--exp_folder",
+        "-e",
+        required=True,
+        type=str,
+        help="The folder path of the experiment created by `run_fewshot.py`.",
+    )
+
+    args = parser.parse_args()
+
+    return args
+
+
+def get_folders(folder):
+    return [join(folder, f) for f in listdir(folder) if isdir(join(folder, f))]
+
+
+if __name__ == "__main__":
+
+    args = parse_args()
+
+    dataset_folders = get_folders(args.exp_folder)
+    for dataset_folder in dataset_folders:
+        run_folders = get_folders(dataset_folder)
+
+        scores = []
+        for run_folder in run_folders:
+            with open(join(run_folder, "results.json"), "r") as f:
+                score = json.load(f)["score"]
+                scores.append(score)
+
+        scores = np.array(scores)
+        with open(join(dataset_folder, "results.json"), "w") as f:
+            json.dump(
+                {
+                    "mean": np.mean(scores).item(),
+                    "std": np.std(scores).item(),
+                },
+                f,
+            )
diff --git a/scripts/setfit/run_fewshot.py b/scripts/setfit/run_fewshot.py
@@ -51,6 +51,7 @@ def parse_args():
     parser.add_argument("--is_dev_set", type=bool, default=False)
     parser.add_argument("--is_test_set", type=bool, default=False)
     parser.add_argument("--override_results", default=False, action="store_true")
+    parser.add_argument("--keep_body_frozen", default=False, action="store_true")
     parser.add_argument("--add_data_augmentation", default=False)
 
     args = parser.parse_args()
@@ -105,7 +106,14 @@ def main():
                 continue
 
             # Load model
-            model = SetFitModel.from_pretrained(args.model)
+            if args.classifier == "pytorch":
+                model = SetFitModel.from_pretrained(
+                    args.model,
+                    use_differentiable_head=True,
+                    head_params={"out_features": len(set(train_data["label"]))},
+                )
+            else:
+                model = SetFitModel.from_pretrained(args.model)
             model.model_body.max_seq_length = args.max_seq_length
             if args.add_normalization_layer:
                 model.model_body._modules["2"] = models.Normalize()
@@ -121,7 +129,19 @@ def main():
                 num_epochs=args.num_epochs,
                 num_iterations=args.num_iterations,
             )
-            trainer.train()
+            if args.classifier == "pytorch":
+                trainer.freeze()
+                trainer.train()
+                trainer.unfreeze(keep_body_frozen=args.keep_body_frozen)
+                trainer.train(
+                    num_epochs=25,
+                    body_learning_rate=1e-5,
+                    learning_rate=args.lr,  # recommand: 1e-2
+                    l2_weight=0.0,
+                    batch_size=args.batch_size,
+                )
+            else:
+                trainer.train()
 
             # Evaluate the model on the test data
             metrics = trainer.evaluate()

diff --git a/src/setfit/__init__.py b/src/setfit/__init__.py
@@ -1,4 +1,4 @@
 __version__ = "0.4.0.dev0"
 
-from .modeling import SetFitModel
+from .modeling import SetFitHead, SetFitModel
 from .trainer import SetFitTrainer