文章词频统计

1、词频统计,输出频次最高的中文字符及频次,不包括标点符号
#打开原文件,小女孩.text
fi=open('小女孩.text','r') //打开门小女孩文件,读
fo=open('py-1.txt','w') //写
txt=fi.read()
d={} #定义一个字典
exclude='!@#$%^&*()_+=-{}[]:;"'.,//|<>,。《》'      //包含所有文章中出现的字符,也可全打一边

for word in txt :
      if word in exclude:
         continue                                  //如果word在exclude里,就跳出循环
     else:
            d[word]=d.get(word,0)+1      //否则返回默认值,+1进行自增长

ls=list(d.items())                                    //字典没有

文章词频统计最先出现在Python成神之路

版权声明:
作者:主机优惠
链接:https://www.techfm.club/p/18796.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>