tfidf代码整理及理解
tfidf代码整理及理解
from sklearn.feature_extraction.text import TfidfVectorizertfidf = TfidfVectorizer()corpus=[我 来到 北京 清华大学,#第一类文本切词后的结果,词之间以空格隔开他 来到 了 网易 杭研 大厦,#第二类文本的切词
tfidf代码整理及理解
from sklearn.feature_ import TfidfVectorizertfidf = TfidfVectorizer()corpus=[我 来到 北京 清华大学,#第一类文本切词后的结果,词之间以空格隔开他 来到 了 网易 杭研 大厦,#第二类文本的切词结果小明 硕士 毕业 与 中国 科学院,#第三类文本的切词结果我 爱 北京 天安门]#第四类文本的切词结果result = tfidf.fit_transform(corpus).toarray()
print(result)
# 统计关键词
word = tfidf.get_feature_names()
print(word)
# 统计关键词出现次数,几句话对比几次
for k,v in tfidf.vocabulary_.items():print(k,v)
# 对比第i类文本的词语tf-idf权重
for i in range(len(result)):print( ---------------------- ,i, -------------------- )for j in range(len(word)):print(word[j],result[i][j])
输出结果如图:
#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格
上传时间: 2024-02-10 06:15:52
推荐阅读
留言与评论(共有 13 条评论) |
本站网友 苦杏仁 | 13分钟前 发表 |
v) # 对比第i类文本的词语tf-idf权重 for i in range(len(result)) | |
本站网友 传奇私服开机 | 11分钟前 发表 |
tfidf代码整理及理解 from sklearn.feature_ import TfidfVectorizertfidf = TfidfVectorizer()corpus=[我 来到 北京 清华大学 | |
本站网友 创富英雄 | 25分钟前 发表 |
print( ---------------------- | |
本站网友 autoit下载 | 3分钟前 发表 |
#第三类文本的切词结果我 爱 北京 天安门]#第四类文本的切词结果result = tfidf.fit_transform(corpus).toarray() print(result) # 统计关键词 word = tfidf.get_feature_names() print(word) # 统计关键词出现次数,几句话对比几次 for k | |
本站网友 拆拆拆 | 24分钟前 发表 |
result[i][j]) 输出结果如图: | |
本站网友 新婚姻法关于房产 | 15分钟前 发表 |
v in tfidf.vocabulary_.items() | |
本站网友 坍塌事故 | 25分钟前 发表 |
#第一类文本切词后的结果,词之间以空格隔开他 来到 了 网易 杭研 大厦 | |
本站网友 新型农业经营体系 | 6分钟前 发表 |
print(word[j] | |
本站网友 保利悦城 | 16分钟前 发表 |
-------------------- )for j in range(len(word)) | |
本站网友 兼职网络推广员 | 2分钟前 发表 |
result[i][j]) 输出结果如图: | |
本站网友 农行贷款 | 26分钟前 发表 |
print(k | |
本站网友 redsn0w | 3分钟前 发表 |
-------------------- )for j in range(len(word)) |