При выполнении задания я выделил мало времени на качественное решение самой задачи, т.к. главная задача была показать навыки кода.
Использовался шаблон cookiecutter.
В папке data/raw лежат сырые данные.
В папке src/models лежат три файла:
1) parent_model.py -- создается родительский класс модели, от которой будут наследоваться следующие модели
2) popular_model.py -- создается простенькая рекомендационная модель, которая предсказывает всегда самые популярные товары
3) svd_model.py -- создается модель рекомендаций на основе сингулярного разложения
Файл run.py:
В этом файле происходит логика запуска эксперимента. Создается, обрабатывается и разбивается на трейн и тест датасет, обучаются и тестируются различные модели, результаты выводятся в терминал и сохраняются в виде pandas dataframe в папке reports/experiments. При запуске файл принимает один аргумент -- название эксперимента. Пример запуска из командной строки: ./run.py test_exp
└── run.py <- script to run