您现在的位置是:首页 > 数码 > 

tfidf代码整理及理解

2025-07-27 01:56:43
tfidf代码整理及理解 from sklearn.feature_extraction.text import TfidfVectorizertfidf = TfidfVectorizer()corpus=[我 来到 北京 清华大学,#第一类文本切词后的结果,词之间以空格隔开他 来到 了 网易 杭研 大厦,#第二类文本的切词

tfidf代码整理及理解

from sklearn.feature_ import TfidfVectorizertfidf = TfidfVectorizer()corpus=[我 来到 北京 清华大学,#第一类文本切词后的结果,词之间以空格隔开他 来到 了 网易 杭研 大厦,#第二类文本的切词结果小明 硕士 毕业 与 中国 科学院,#第三类文本的切词结果我 爱 北京 天安门]#第四类文本的切词结果result = tfidf.fit_transform(corpus).toarray()
print(result)
# 统计关键词
word = tfidf.get_feature_names()
print(word)
# 统计关键词出现次数,几句话对比几次
for k,v in tfidf.vocabulary_.items():print(k,v)
# 对比第i类文本的词语tf-idf权重
for i in range(len(result)):print(	----------------------	,i,	--------------------	)for j in range(len(word)):print(word[j],result[i][j])

输出结果如图:

 

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址:http://www.dnpztj.cn/shuma/857057.html

相关标签:无
上传时间: 2024-02-10 06:15:52
留言与评论(共有 13 条评论)
本站网友 苦杏仁
13分钟前 发表
v) # 对比第i类文本的词语tf-idf权重 for i in range(len(result))
本站网友 传奇私服开机
11分钟前 发表
tfidf代码整理及理解 from sklearn.feature_ import TfidfVectorizertfidf = TfidfVectorizer()corpus=[我 来到 北京 清华大学
本站网友 创富英雄
25分钟前 发表
print( ----------------------
本站网友 autoit下载
3分钟前 发表
#第三类文本的切词结果我 爱 北京 天安门]#第四类文本的切词结果result = tfidf.fit_transform(corpus).toarray() print(result) # 统计关键词 word = tfidf.get_feature_names() print(word) # 统计关键词出现次数,几句话对比几次 for k
本站网友 拆拆拆
24分钟前 发表
result[i][j]) 输出结果如图:  
本站网友 新婚姻法关于房产
15分钟前 发表
v in tfidf.vocabulary_.items()
本站网友 坍塌事故
25分钟前 发表
#第一类文本切词后的结果,词之间以空格隔开他 来到 了 网易 杭研 大厦
本站网友 新型农业经营体系
6分钟前 发表
print(word[j]
本站网友 保利悦城
16分钟前 发表
-------------------- )for j in range(len(word))
本站网友 兼职网络推广员
2分钟前 发表
result[i][j]) 输出结果如图:  
本站网友 农行贷款
26分钟前 发表
print(k
本站网友 redsn0w
3分钟前 发表
-------------------- )for j in range(len(word))