prepare() 将按类文件保存的数据汇总、清洗、去重,augment() 进行数据增强
统计词汇、长度、类别的频率,条形图可视化,计算 sent / word_per_sent 指标
Dictionary() 建立词索引的字典,filter_extremes() 过滤低频词
tran_dict() 为填充词、未录词保留索引 0、1,label2ind() 建立标签索引
sent2ind() 将每句转换为词索引、将序列填充为相同长度
tensorize() 将 array 转换为 LongTensor,get_loader() 打乱并划分 batch
通过 dnn、cnn、rnn 构建分类模型,dev_loss 降低则保存模型
trap_count > max_count 则 learn_rate / 10、小于 min_rate 则早停止
predict() 实时交互,输入单句、经过清洗后预测,输出所有类别的概率