-
主题权重与FREX值数据集Bases30TopicsWeightsandFREXValuesDataset-leonardocaravaggio
2025年5月30日 30 133 10
主题权重与FREX值数据集Bases30TopicsWeightsandFREXValuesDataset-leonardocaravaggio 数据来源:互联网公开数据 标签:文本分析,主题建模,数据集,词频分析,自然语言处理,机器学习,文本挖掘,数据科学 数据概述:... -
垃圾邮件过滤邮件特征数据集SpamFilteringEmailFeatureDataset-mguinezi
2025年5月22日 30 9 4
垃圾邮件过滤邮件特征数据集SpamFilteringEmailFeatureDataset-mguinezi 数据来源:互联网公开数据 标签:垃圾邮件, 邮件分类, 文本分析, 特征工程, 机器学习, 词频分析, 数据挖掘, 邮件内容 数据概述: 该数据集包含从电子邮件中提取的特征,用于垃圾邮件过滤模型的构建与评估。主要特征如下:... -
垃圾邮件过滤邮件特征数据集SpamFilteringEmailFeatureDataset-mguinezi
2025年5月16日 30 179 82
垃圾邮件过滤邮件特征数据集SpamFilteringEmailFeatureDataset-mguinezi 数据来源:互联网公开数据 标签:垃圾邮件, 邮件分类, 文本分析, 特征工程, 机器学习, 词频分析, 数据挖掘, 邮件内容 数据概述: 该数据集包含从电子邮件中提取的特征,用于垃圾邮件过滤模型的构建与评估。主要特征如下:... -
电子邮件语料词频分析数据集EmailCorpusWordFrequencyAnalysis-muskansengar
2025年5月10日 30 37 32
电子邮件语料词频分析数据集EmailCorpusWordFrequencyAnalysis-muskansengar 数据来源:互联网公开数据 标签:电子邮件, 语料库, 词频分析, 自然语言处理, 文本挖掘, Enron数据集, 词汇统计, 数据分析 数据概述:... -
中文词频统计分析数据集ChineseWordFrequencyStatistics-danphan2012
2025年5月5日 30 145 31
中文词频统计分析数据集ChineseWordFrequencyStatistics-danphan2012 数据来源:互联网公开数据 标签:中文, 词频分析, 自然语言处理, 文本挖掘, 语料库, 统计分析, 语言学, 数据集 数据概述: 该数据集包含来自公开语料库的中文文本数据,记录了词语及其对应的出现频率。主要特征如下:... -
日语词汇频率统计数据集JapaneseWordFrequencyStatistics-takashitahara
2025年5月1日 30 85 38
日语词汇频率统计数据集JapaneseWordFrequencyStatistics-takashitahara 数据来源:互联网公开数据 标签:日语, 词频分析, 语言学, 词汇, 自然语言处理, 文本分析, 语料库, 统计 数据概述: 该数据集包含来自公开语料库的日语词汇频率统计数据,记录了日语词汇的出现频率及其排名信息。主要特征如下:... -
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26
2025年4月26日 30 179 19
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26 数据来源:互联网公开数据 标签:语料库,词频分析,逆文档频率,自然语言处理,数据集,文本挖掘,机器学习,信息检索 数据概述:... -
齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari
2025年4月26日 30 176 156
齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari 数据来源:互联网公开数据 标签:文本分析,自然语言处理,齐夫定律,数据集,词频分析,机器学习,语言学,信息检索 数据概述: 该数据集包含文本数据及其对应的齐夫定律特征,用于研究词频分布和文本特征提取。主要特征如下:... -
新冠疫情期间齐夫定律验证数据集Zipf-sLawTestDataset-COVID-19-salemrezzag
2025年4月24日 30 174 13
新冠疫情期间齐夫定律验证数据集Zipf-sLawTestDataset-COVID-19-salemrezzag 数据来源:互联网公开数据 标签:新冠疫情,齐夫定律,文本分析,数据集,自然语言处理,流行病学,数据科学,词频分析 数据概述: 该数据集包含从新冠疫情期间收集的文本数据,用于验证齐夫定律在疫情语境下的适用性。主要特征如下:... -
歌词标注数据集LyricsMarkupDataset-idwntl
2025年4月23日 30 126 84
歌词标注数据集LyricsMarkupDataset-idwntl 数据来源:互联网公开数据 标签:歌词,数据集,文本标注,自然语言处理,音乐分析,文化研究,词频分析,情感分析 数据概述: 该数据集包含来自互联网的歌词文本,记录了各种歌曲的歌词及其标注信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2023年。... -
神经信息处理系统会议1987至2015年词频上下文数据集-saurabhbhagvatula
2025年4月23日 30 68 53
神经信息处理系统会议1987至2015年词频上下文数据集-saurabhbhagvatula 数据来源:互联网公开数据 标签:NIPS,会议论文,词频,自然语言处理,学术研究,计算机科学,数据科学,词频分析,上下文分析 数据概述: 本数据集来源于神经信息处理系统会议(NIPS, Conference on Neural Information... -
情景喜剧老友记剧本及情感分析数据集-lucasyukioimafuko
2025年4月23日 30 73 60
情景喜剧老友记剧本及情感分析数据集-lucasyukioimafuko 数据来源:互联网公开数据 标签:老友记, Friends, 剧本, 情感分析, 文本挖掘, 影视剧, 情感, 词频分析, 数据可视化 数据概述:... -
H姓艺术家歌词录制数据集-2022-marzenah
2025年4月21日 30 195 92
H姓艺术家歌词录制数据集-2022-marzenah 数据来源:互联网公开数据 标签:歌词,艺术家,音乐分析,文本分析,时间序列,情感分析,主题分析,词频分析 数据概述:... -
日本常用词形频率数据集-2021-rtatman
2025年4月21日 30 27 16
日本常用词形频率数据集-2021-rtatman 数据来源:互联网公开数据 标签:日语,词形,频率,语料库,词频分析,日语文本,日本语言学,词性分布,跨语言比较 数据概述:... -
英文无大小写BERT模型单字词数据集
2025年4月19日 30 85 38
英文无大小写BERT模型单字词数据集 数据来源:互联网公开数据 标签:BERT,自然语言处理,英文,词频分析,预训练模型,词汇分布,子词分割 数据概述:... -
政治思想作品语料库数据集1963-2021
2025年4月16日 30 78 5
政治思想作品语料库数据集1963-2021 数据来源:互联网公开数据 标签:政治思想,语料库,历史,现代,文本分析,自然语言处理,词频分析,推荐系统 数据概述:... -
单词流行度数据集用于单词拼图创作研究
2025年4月15日 30 55 2
单词流行度数据集用于单词拼图创作研究 数据来源:互联网公开数据 标签:单词流行度,单词拼图,词频分析,英语,语言学,教育研究,词汇习得 数据概述:... -
尼采著作文本数据集1885-1905
2025年4月15日 30 203 163
尼采著作文本数据集1885-1905 数据来源:互联网公开数据 标签:尼采,哲学,文本分析,自然语言处理,词频分析,推荐系统,人文研究 数据概述:... -
意大利复兴法令词频数据集2020-05-19
2025年4月15日 30 99 31
意大利复兴法令词频数据集2020-05-19 数据来源:互联网公开数据 标签:意大利法令,词频分析,初创经济,政府政策,数据民主,经济刺激计划,数据分析 数据概述: 本数据集收录了2020年5月19日颁布的意大利《复兴法令》(Decreto Rilancio, D.L.... -
理性主义思想家数据集
2025年4月15日 30 62 56
理性主义思想家数据集 数据来源:互联网公开数据 标签:理性主义,思想家,哲学,自然语言处理,数据清理,词频分析,词云,推荐系统 数据概述:...