首页 > 分享 > 词频统计

词频统计

统计重复出现的单词

文本来源:https://pan.baidu.com/s/1o75GKZ4

path = r'C:UsersAdministratorPycharmProjectsuntitled1Walden.txt'

with open(path,'r',encoding='utf8 ') as text:

words = text.read().split()

print(words)

for word in words:

print('{}-{} times'.format(word,words.count(word)))

结论:

有一些带标点符号的单词被单独统计了次数; 有些单词不止一次地展示了出现的次数; 由于Python对大小写敏感,开头大写的单词被单独统计了。

现在我们根据这些点调整一下我们的统计方法。对单词做一些预处理:

mport string

path = r'C:UsersAdministratorPycharmProjectsuntitled1Walden.txt'

with open(path,'r',encoding='utf8 ') as text:

words = [raw_word.strip(string.punctuation).lower() for raw_word in text.read().split()]

words_index = set(words)

counts_dict = {index:

相关知识

统计学习理论及应用
关注公众号,有单词发音哦,【A阶段A+5】
跑宝宝环最全面的积分规则及数据统计
Kaggle宠物收养比赛亚军复盘
宠物行业的统计与趋势:在线零售商如何掘金“
我国宠物食品消费状况的统计调查研究.docx
原创 如何让猫活得更久?猫咪死亡原因和寿命统计
宠物行业的统计与趋势:在线零售商如何掘金“铲屎官市场”?
2024年5月农业农村部核发宠物食品进口饲料登记证统计情况
​2021年最新的国内外宠物展会统计来啦!

网址: 词频统计 https://m.mcbbbk.com/newsview195601.html

所属分类:萌宠日常
上一篇: 我的数据结构学习之路(一)
下一篇: 魔兽世界全版本GM命令全集