Added soft agted hourglass model

borarak · Apr 23, 2020 · a8db48c · a8db48c
1 parent c95ece4
commit a8db48c
Show file tree

Hide file tree

Showing 3 changed files with 207 additions and 0 deletions.
diff --git a/deep-pose/models/__init__.py b/deep-pose/models/__init__.py
@@ -0,0 +1,11 @@
+from .hourglass import HGNet
+from .hourglass_gated import GatedHGNet
+
+
+def get_model(name):
+    if name == "HGNet":
+        return HGNet
+    elif name == "GatedHGNet":
+        return GatedHGNet
+    else:
+        raise ValueError(f"{name} not found in available models")
diff --git a/deep-pose/models/hourglass_gated.py b/deep-pose/models/hourglass_gated.py
@@ -0,0 +1,156 @@
+import tensorflow as tf
+from tensorflow.keras.layers import Conv2D, BatchNormalization, ReLU, MaxPool2D, UpSampling2D
+
+
+class GatedResidualBlock(tf.keras.layers.Layer):
+    def __init__(self, input_channels=256, first_op=False):
+        super(GatedResidualBlock, self).__init__()
+        self.input_channels = input_channels
+        self.first_op = first_op
+
+        self.bn0 = BatchNormalization()
+        self.conv1 = Conv2D(filters=self.input_channels // 2,
+                            kernel_size=3,
+                            padding='same',
+                            strides=1,
+                            name="res_cv1",
+                            kernel_initializer='random_uniform')
+        self.bn1 = BatchNormalization()
+        self.relu1 = ReLU()
+
+        self.conv2 = Conv2D(filters=self.input_channels // 4,
+                            kernel_size=3,
+                            padding='same',
+                            strides=1,
+                            name="res_cv2",
+                            kernel_initializer='random_uniform')
+        self.bn2 = BatchNormalization()
+        self.relu2 = ReLU()
+
+        self.conv3 = Conv2D(filters=self.input_channels // 4,
+                            kernel_size=3,
+                            padding='same',
+                            strides=1,
+                            name="res_cv3",
+                            kernel_initializer='random_uniform')
+        self.bn3 = BatchNormalization()
+        self.relu3 = ReLU()
+        self.alpha = tf.Variable([0.5 for _ in tf.range(self.input_channels)],
+                                 shape=tf.TensorShape((self.input_channels)),
+                                 trainable=True)
+        self.relu4 = ReLU()
+
+    def call(self, inputs):
+        original_inp = inputs
+        if self.first_op:
+            inputs = self.bn0(inputs)
+        x1 = self.relu1(self.bn1(self.conv1(inputs)))
+        x2 = self.relu2(self.bn2(self.conv2(x1)))
+        x3 = self.relu3(self.bn3(self.conv3(x2)))
+
+        x = tf.concat([x1, x2, x3], axis=-1)
+        x = tf.add(
+            tf.multiply(
+                tf.reshape(self.alpha, (-1, 1, 1, self.input_channels)),
+                original_inp), x)
+        return self.relu4(x)
+
+
+class HourGlass():
+    def __init__(self, depth=4):
+        super(HourGlass, self).__init__()
+        self.depth = depth
+        self.down_res_blocks = [
+            GatedResidualBlock() for _ in range(self.depth)
+        ]
+        self.skip_block = [GatedResidualBlock() for _ in range(self.depth)]
+        self.mpool_block = [MaxPool2D(strides=2) for _ in range(self.depth)]
+        self.up_res_blocks = [GatedResidualBlock() for _ in range(self.depth)]
+        self.upsample_block = [
+            UpSampling2D(size=(2, 2)) for _ in range(self.depth)
+        ]
+        self.concat_conv = [
+            Conv2D(filters=256,
+                   kernel_size=3,
+                   strides=1,
+                   padding="same",
+                   kernel_initializer='random_uniform')
+            for _ in range(self.depth)
+        ]
+
+        down_x = []
+
+        inputs = tf.keras.layers.Input(shape=(64, 64, 256), name='hg')
+        x = None
+
+        for i in range(self.depth):
+            if x is None:
+                x = self.down_res_blocks[i](inputs)
+            else:
+                x = self.down_res_blocks[i](x)
+            down_x.append(self.skip_block[i](x))
+            x = self.mpool_block[i](x)
+
+        down_x = list(reversed(down_x))
+
+        for i in range(self.depth):
+            x = self.up_res_blocks[i](x)
+            x = self.upsample_block[i](x)
+            #x = tf.add(x, down_x[i])
+            x = tf.concat((x, down_x[i]), axis=-1)
+            x = self.concat_conv[i](x)
+
+        self.model = tf.keras.models.Model(inputs, x)
+
+
+class GatedHGNet():
+    def __init__(self, stacks=1, num_keypoints=17):
+        super(GatedHGNet, self).__init__()
+        self.stacks = stacks
+        self.num_keypoints = num_keypoints
+        self.hg = [HourGlass().model for _ in range(self.stacks)]
+        self.final_res = [GatedResidualBlock() for _ in range(self.stacks)]
+        self.final_res2 = [
+            GatedResidualBlock() for _ in range(self.stacks - 1)
+        ]
+        self.to_logits = [
+            Conv2D(filters=self.num_keypoints,
+                   kernel_size=1,
+                   padding='same',
+                   activation='sigmoid',
+                   kernel_initializer='random_uniform')
+            for _ in range(self.stacks)
+        ]
+        self.logits2inp = [
+            Conv2D(filters=256,
+                   kernel_size=1,
+                   padding='same',
+                   kernel_initializer='random_uniform')
+            for _ in range(self.stacks - 1)
+        ]
+        self.outputs = []
+
+        input = tf.keras.layers.Input(shape=(256, 256, 3))
+        x = Conv2D(filters=256,
+                   kernel_size=7,
+                   strides=2,
+                   padding='same',
+                   kernel_initializer='random_uniform')(input)
+        x = BatchNormalization()(x)
+        x = ReLU()(x)
+        x = GatedResidualBlock()(x)
+        x = MaxPool2D(strides=2)(x)
+        x = GatedResidualBlock()(x)
+        hg_input = GatedResidualBlock()(x)
+
+        for stack in range(self.stacks):
+            x = self.hg[stack](hg_input)
+            x = self.final_res[stack](x)
+            logit = self.to_logits[stack](x)
+            if stack < self.stacks - 1:
+                x = self.final_res2[stack](x)
+                inputs = self.logits2inp[stack](logit)
+                hg_input = tf.add_n([hg_input, x, inputs])
+            self.outputs.append(logit)
+
+        self.model = tf.keras.models.Model(input, self.outputs)
diff --git a/experiments/hourglass_gated_stacks4.sh b/experiments/hourglass_gated_stacks4.sh
@@ -0,0 +1,40 @@
+#!/bin/bash
+
+# DATA
+# TODO: Remove checkpoint dir redundancy
+CHECKPOINT_DIR="/home/raktim/checkpoints/"
+LAST_CKPT="/home/raktim/checkpoints/e_19_i7200_g111780"
+TRAIN_DATA_DIR="/home/raktim/datasets/coco2017/train2017"
+VAL_DATA_DIR="/home/raktim/datasets/coco2017/val2017"
+TRAIN_ANNOTATIONS="/home/raktim/datasets/coco2017/annotations/person_keypoints_train2017_single_person_all.json"
+VAL_ANNOTATIONS="/home/raktim/datasets/coco2017/annotations/person_keypoints_val2017_single_person_all.json"
+
+#OTHERS
+BATCH=6
+LEARNING_RATE=1e-4
+LR_LOWER_BOUND=5.5e-5
+LR_UPPER_BOUND=5.5e-4
+CYCLE_INTERVAL=3500
+CYCLE_LR=0
+EPOCHS=100
+IMAGE_SIZE=256
+VALIDATION_INTERVAL=500
+WARM_START=1
+MODEL_NAME='GatedHGNet'
+STACKS=4
+
+
+python ../deep-pose/train.py --batch $BATCH --lr $LEARNING_RATE \
+--model_name $MODEL_NAME \
+--image_hw $IMAGE_SIZE --val_interval $VALIDATION_INTERVAL \
+--ckpt_dir $CHECKPOINT_DIR \
+--epochs $EPOCHS \
+--stacks $STACKS \
+--warm_start $WARM_START \
+--cycle_lr $CYCLE_LR \
+--lrl $LR_LOWER_BOUND \
+--lru $LR_UPPER_BOUND \
+--cycle_interval $CYCLE_INTERVAL \
+--last_ckpt $LAST_CKPT \
+--dtrain $TRAIN_DATA_DIR --dval $VAL_DATA_DIR \
+--atrain $TRAIN_ANNOTATIONS --aval $VAL_ANNOTATIONS