huggingface · lhoestq · Feb 2, 2022 · Feb 2, 2022 · Feb 2, 2022 · Feb 2, 2022
diff --git a/src/datasets/features/audio.py b/src/datasets/features/audio.py
@@ -174,7 +174,7 @@ def _decode_mp3(self, path_or_file):
 
         array, sampling_rate = torchaudio.load(path_or_file, format="mp3")
         if self.sampling_rate and self.sampling_rate != sampling_rate:
-            if not hasattr(self, "_resampler"):
+            if not hasattr(self, "_resampler") or self._resampler.orig_freq != sampling_rate:
                 self._resampler = T.Resample(sampling_rate, self.sampling_rate)
             array = self._resampler(array)
             sampling_rate = self.sampling_rate

diff --git a/tests/features/data/test_audio_16000.mp3 b/tests/features/data/test_audio_16000.mp3
diff --git a/tests/features/test_audio.py b/tests/features/test_audio.py
@@ -133,6 +133,26 @@ def test_audio_decode_example_mp3(shared_datadir):
     assert decoded_example["sampling_rate"] == 44100
 
 
+@require_sox
+@require_torchaudio
+def test_audio_resampling_mp3_different_sampling_rates(shared_datadir):
+    audio_path = str(shared_datadir / "test_audio_44100.mp3")
+    audio_path2 = str(shared_datadir / "test_audio_16000.mp3")
+    audio = Audio(sampling_rate=48000)
+
+    decoded_example = audio.decode_example(audio.encode_example(audio_path))
+    assert decoded_example.keys() == {"path", "array", "sampling_rate"}
+    assert decoded_example["path"] == audio_path
+    assert decoded_example["array"].shape == (119119,)
+    assert decoded_example["sampling_rate"] == 48000
+
+    decoded_example = audio.decode_example(audio.encode_example(audio_path2))
+    assert decoded_example.keys() == {"path", "array", "sampling_rate"}
+    assert decoded_example["path"] == audio_path2
+    assert decoded_example["array"].shape == (120960,)
+    assert decoded_example["sampling_rate"] == 48000
+
+
 @require_sndfile
 def test_dataset_with_audio_feature(shared_datadir):
     audio_path = str(shared_datadir / "test_audio_44100.wav")