首页 > 分享 > NLP干货: (4) NER模型的调用和效果评估

NLP干货: (4) NER模型的调用和效果评估

萌宠菠菠乐园
2024-10-10 21:30

在上一篇文章中讲述了如何使用Spacy建立NER模型，因此本篇将讲述如何调用模型，并评估模型的效果。

1. 加载所需的库：

import pandas as pd

import joblib

2. 加载模型和验证的数据集，提取所有文本的实体信息：

ner = joblib.load(r"C:UsersxxxDesktopnerNER.m")

print('NER模型加载成功')

df = pd.read_excel(r"C:UsersxxxDesktopNERNER-validate.xlsx")

content = df['Content'].values.tolist()

AllEntity = []

for line in range(len(content)):

doc = ner(content[line])

Entity = [(ent.text, ent.label_) for ent in doc.ents]

Entity = sorted(list(set(Entity)), key=Entity.index)

AllEntity.append(Entity)

df['AllEntity'] = AllEntity

Result_Path = r"C:UsersxxxDesktopNERner-ValidateResult1.xlsx"

df.to_excel(Result_Path, index=False)

3. 分析上述输出的Excel文件：

df = pd.read_excel(Result_Path)

label = df['label'].tolist()

values = df['value'].tolist()

AllEntity = df['AllEntity'].tolist()

total = len(label)

Manual_Labeling, mark_AllEnt = [],[]

right_count = all_source_count = all_pred_count = count = fail_count = 0

for line in range(len(label)):

col1 = label[line]

col2 = values[line]

col3 = AllEntity[line]

col1 = eval(col1)

col2 = eval(col2)

col3 = eval(col3)

print('nAllEntity:', col3)

new_list = [(col2[j],col1[j][2]) for j in range(len(col2))]

print('labelled_list:',list(set(new_list)))

Manual_Labeling.append(list(set(new_list)))

all_source_count = all_source_count + len(list(set(new_list)))

all_pred_count = all_pred_count + len(col3)

for item in col3:

if isinstance(item, tuple) and item in new_list:

right_count += 1

else:

fail_count += 1

match_count = 0

for item in new_list:

if item in col3:

match_count += 1

if match_count == len(new_list):

count += 1

mark_AllEnt.append(1)

else:

mark_AllEnt.append(0)

print('Entity总数=',all_source_count, '; Entity预测正确个数=',right_count, '; 找准+找全的文本个数为=',count, '; Entity预测错误个数=',fail_count)

df['Manual_Labeling'] = Manual_Labeling

df['AllEnt_Correction'] = mark_AllEnt

df.to_excel(Result_Path, index=False)

print('nNER测试文本个数=',total, '; labelled Entity总数=',all_source_count, '; model预测正确个数=',right_count, '; 召回率=',round(right_count/all_source_count, 2), '; 精确率=',round(1-(fail_count/all_pred_count), 2))

输出结果：

若NER模型的效果不够好，则可以尝试从几个方面提升：A.增加迭代次数 B.调整学习率和drop参数 C.增加训练数据量

小狗注射什么疫苗，小狗注射什么疫苗好

宠物狗需要什么疫苗打的好些呢（宠物狗必打的疫苗种类及接种时间）

热点分享

布偶猫吃什么对毛发好原来这些食物就可以

对于布偶猫这种长毛猫来说，一般情况下，布偶猫这样的长毛猫咪毛...

这九种宠物既新奇又独特，看完你爱上没有？

这九种宠物既新奇又独特，看完你爱上没有？小猫，小狗，仓鼠...

推荐分享

缅因猫能长多大一种体型较大的猫

缅因猫能长多大?缅因猫是很多人都喜欢的一个品种，尤其是广大的女...

警惕狗贩的骗人损招星期狗的症状特征

警惕狗贩的骗人损招染色：这一招最多的是用在斑点狗、蝴蝶犬...

热门点击排行

养玉米蛇的危害

狗交配为什么会锁住？从狗狗生理结构来分析

分享分类导航

萌宠日常

宠物饲养指南

宠物营养食谱