-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy pathsumarizador.py
38 lines (30 loc) · 1.1 KB
/
sumarizador.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
import json
from requests import RequestException
from tfidf_nltk import tf_idf
from textextract import gerar_dicionario
from textextract import escrever_json
def escrever_arquivo(texto):
with open('arquivos/saida.json', 'w', encoding='utf8') as arquivo_saida:
saida = dict(resumo=texto)
json.dump(saida, arquivo_saida, ensure_ascii=False)
def main(titulo_do_artigo):
"""
:param titulo_do_artigo:
:return:
"""
# Dicionário com os respectívos tópicos e seus conteúdos extraídos da Wikipédia
try:
# Pode lançar KeyError e RequestException
original, imagens = gerar_dicionario(titulo_do_artigo)
except KeyError:
raise
except RequestException:
raise
else:
topicos_e_resumos = []
for i in range(0, len(original)):
if original[i][1] != '':
resumo = tf_idf(original[i][1])
# Criamos uma lista de tuplas com os tópicos e seus respectivos conteúdos
topicos_e_resumos.append((original[i][0], resumo))
return escrever_json(topicos_e_resumos, imagens)