Bases de dados, códigos, configurações e ferramentas associadas ao artigo "Padronização da Descrição de Produtos Comerciais utilizando NER"
Este projeto foi a base do artigo mencionado acima. Seguem os arquivos utilizados no projeto.
- "Projeto_NER_v05.ipynb" - notebook com o código utilizado no projeto
- "base_arroz_limpa.csv" - base de dados do produto arroz contendo os atributos ean, descricao_estabelecimento e descricao_normalizada.
- "desc_norm_enriquecida.csv" - base de dados enriquecida com as descrições padronizadas do produto arroz contendo os atributos ean, descricao_normalizada, PROD, PROD_X, TIPO, MARCA, MARCA_X, EMBA e PESO
- "Anotação.xlsx" - ferramenta Excel para facilitar a produção da base de dados "desc_norm_enriquecida.csv".
- "base_config.cfg" - arquivo com as configurações para o treinamento do modelo no spacy 3.0.
- "artigo.pdf" - artigo apresentado no SBBD 2022.
Meu nome é Laércio. Se quiser mais informações não disponíveis neste repositório, por favor entre em contato pelo e-mail laercio.lucchesi@gmail.com.