6.4 词语统计
主要练习字典的使用方法,包括字符串的常见操作方法。
比如对于下面的字符串文本,实现文本中词语个数的统计。如:
方法1:遍历文本中的字符串,依次将每个词语添加到现有字典结构中。对于新的词语,新增节点并置个数为1。对于已有的词语,则只增加个数。
为此,首先需要分割出各个词语,常见的方法可以使用字符串自带的split方法:
text = 'to be or not to be'
words = text.lower().split()
print(words)
输出为: ['to', 'be', 'or', 'not', 'to', 'be']
进一步按照刚才算法思路,遍历分割出来的词语列表,判断是否存在于字典中,不存在,新建节点并设置键为该词语,值为1,如果存在,就将对应词语节点的值加一:
text = 'to be or not to be'
words = text.lower().split()
dic = {}
for word in words:
if word not in dic:
dic[
6.4 词语统计最先出现在Python成神之路。
共有 0 条评论