首页

116问答网 > 如何用python和jieba分词，统计词频？

如何用python和jieba分词，统计词频？

2025-03-30 20:15:42

推荐回答（2个）

回答1：

 #! python3
# -*- coding: utf-8 -*-
import os, codecs
import jieba
from collections import Counter
 
def get_words(txt):
    seg_list = jieba.cut(txt)
    c = Counter()
    for x in seg_list:
        if len(x)>1 and x != '\r\n':
            c[x] += 1
    print('常用词频度统计结果')
    for (k,v) in c.most_common(100):
        print('%s%s %s  %d' % ('  '*(5-len(k)), k, '*'*int(v/3), v))
 
if __name__ == '__main__':
    with codecs.open('19d.txt', 'r', 'utf8') as f:
        txt = f.read()
    get_words(txt)

回答2：

https://github.com/williezh/

相关问答

一个txt文档，已经用结巴分词分完词，怎么用python工具...

用Python统计词频

用Python实现小说里的高频词统计并显示

如何用python实现英文短文的双词频统计？

Python ，统计词频，求解答

关于python词云的频次统计机制

python 如何同时按字母顺序和词频排列词频统计的结果？

最新问答

中国纺织物资（集团）总公司入职体检项目有哪些呢谢谢了，大神帮忙啊

紫徽花园周边环境怎么样？生活便利吗？

二手车过完户为什么大本不给我要等到和牌照一起给呢

CF窗口化咋变成最大化啊

求一部动漫（很久以前看的）大概说的是男主有间歇性心脏骤停的毛病，

请教懂风水的朋友，别墅院子里想打一个抽水井，下面是我家的平面图，打在哪个方位比较理想？

内蒙古自治区是哪一年成立的？

汉中门大街周边环境怎么样？生活便利吗？

用什么可以去除pvc胶水

有过维修记录的二手奥迪a4l值得买吗