找到32个数据集

标签: TF-IDF

过滤结果
  • 文本分类TF_IDF特征数据集

    2026年2月22日 30 117 71

    文本分类TF_IDF特征数据集_Text_Classification_TF_IDF_Features 数据来源:互联网公开数据 标签:文本分类, TF-IDF, 机器学习, 特征工程, 自然语言处理, 情感分析, 文本挖掘, 数据集 数据概述: 该数据集包含经过TF-IDF(Term Frequency-Inverse Document...
    packageimg
  • 文本主题建模测试数据集

    2026年2月21日 30 98 49

    文本主题建模测试数据集_Text_Topic_Modeling_Test_Data 数据来源:互联网公开数据 标签:文本分析, 主题建模, 词频统计, TF-IDF, 数据预处理, 机器学习, 文本挖掘, 自然语言处理 数据概述: 该数据集包含预处理后的文本数据,主要用于测试主题建模算法的性能。主要特征如下:...
    packageimg
  • 酒店评论情感分析数据集

    2025年4月20日 60 65 12

    酒店评论情感分析数据集 数据来源:互联网公开数据 标签:酒店评论,情感分析,文本分类,机器学习,自然语言处理,情感极性,TF-IDF,词向量,深度学习 数据概述:...
    packageimg
  • 学术论文标题文本主题分析数据集

    2025年8月2日 30 104 53

    学术论文标题文本主题分析数据集_Academic_Paper_Title_Text_Topic_Analysis 数据来源:互联网公开数据 标签:文本分析, 学术论文, 标题提取, 文本挖掘, 主题模型, TF-IDF, 机器学习, 语料库 数据概述: 该数据集包含从学术论文中提取的标题文本,用于主题分析和文本挖掘研究。主要特征如下:...
    packageimg
  • Klinger等处理后的arXiv论文元数据和摘要数据集-机器学习方法分类-2020

    2025年6月1日 30 73 16

    Klinger等处理后的arXiv论文元数据和摘要数据集-机器学习方法分类-2020 数据来源:互联网公开数据 标签:arXiv,论文元数据,摘要,机器学习,分类,文本处理,训练数据,TF-IDF 数据概述:...
    packageimg
  • 蛋白质功能分析抽象嵌入与词汇表数据集2021-adarshr

    2025年5月31日 30 36 28

    蛋白质功能分析抽象嵌入与词汇表数据集2021-adarshr 数据来源:互联网公开数据 标签:蛋白质,功能分析,TF-IDF,词嵌入,词汇表,科学数据 数据概述: 本数据集名为“Abstract_embeds_final”,收录了蛋白质功能分析相关的研究抽象文本嵌入及词汇表信息。数据集中包含了蛋白质ID和对应的Go词汇表术语,用于构建TF-...
    packageimg
  • 文本主题聚类分析数据集TextTopicClusteringAnalysisDataset-dddmdd

    2025年5月28日 30 81 75

    文本主题聚类分析数据集TextTopicClusteringAnalysisDataset-dddmdd 数据来源:互联网公开数据 标签:文本聚类, 主题建模, 自然语言处理, K-means, TF-IDF, UMAP, 机器学习, 教育 数据概述: 该数据集包含用于文本主题聚类分析的数据,记录了经过处理的文本样本及其对应的聚类结果。主要特征如下:...
    packageimg
  • 文本相似度特征分析训练数据集TextSimilarityFeatureAnalysisTrainingDataset-zhangkeke123

    2025年5月26日 30 19 10

    文本相似度特征分析训练数据集TextSimilarityFeatureAnalysisTrainingDataset-zhangkeke123 数据来源:互联网公开数据 标签:文本相似度, 文本分析, 特征工程, 机器学习, 自然语言处理, 相似度计算, TF-IDF, 数据集 数据概述:...
    packageimg
  • 新闻标题文本特征分析数据集NewsHeadlinesTextFeatureAnalysis-ketan123441

    2025年5月20日 30 173 17

    新闻标题文本特征分析数据集NewsHeadlinesTextFeatureAnalysis-ketan123441 数据来源:互联网公开数据 标签:新闻标题, 文本分析, 自然语言处理, TF-IDF, 文本特征, 机器学习, 舆情分析, 情感分析 数据概述:...
    packageimg
  • 文本情感分类数据集TextSentimentClassificationDataset-redhotchillis

    2025年5月18日 30 135 74

    文本情感分类数据集TextSentimentClassificationDataset-redhotchillis 数据来源:互联网公开数据 标签:情感分析, 文本分类, 机器学习, 自然语言处理, 情感标注, 词向量, TF-IDF, 深度学习 数据概述: 该数据集包含多种文本数据,用于训练和评估文本情感分类模型。主要特征如下:...
    packageimg
  • 社交媒体成瘾相关文本特征分析数据集SocialMediaAddictionTextFeatureAnalysis-anandpanda3

    2025年5月17日 30 48 15

    社交媒体成瘾相关文本特征分析数据集SocialMediaAddictionTextFeatureAnalysis-anandpanda3 数据来源:互联网公开数据 标签:社交媒体, 成瘾行为, 文本分析, 情感分析, 机器学习, LIWC, TF-IDF, 精神健康, Reddit 数据概述:...
    packageimg
  • 嵌入与TF-IDF文本特征提取数据集EmbeddedandTF-IDFTextFeatureExtractionDataset-malav312

    2025年5月12日 30 82 60

    嵌入与TF-IDF文本特征提取数据集EmbeddedandTF-IDFTextFeatureExtractionDataset-malav312 数据来源:互联网公开数据 标签:自然语言处理,文本特征提取,机器学习,数据集,TF-IDF,词嵌入,文本分析,信息检索 数据概述:该数据集包含用于文本特征提取的嵌入和TF-...
    packageimg
  • 医学诊断疾病ICD9代码分析数据集MedicalDiagnosisICD9CodeAnalysisDataset-mariaponomarenko

    2025年5月11日 30 73 17

    医学诊断疾病ICD9代码分析数据集MedicalDiagnosisICD9CodeAnalysisDataset-mariaponomarenko 数据来源:互联网公开数据 标签:ICD9, 医学诊断, 疾病分类, TF-IDF, 文本挖掘, 机器学习, 医疗健康, 临床数据 数据概述:...
    packageimg
  • 毒性分类数据集

    2025年5月5日 30 139 136

    毒性分类数据集 数据来源:互联网公开数据 标签:毒性分类,文本分析,机器学习,自然语言处理,Word2Vec,TF-IDF,文本特征提取,分类模型训练 数据概述: 本数据集是一个用于毒性分类任务的文本数据集,包含经过预处理和特征提取的文本样本,旨在帮助研究者和开发者进行毒性文本识别和分类模型的训练与优化。数据集通过Word2Vec和TF-...
    packageimg
  • 印尼期刊文本分类数据集IndonesianJournalTF-IDFNaiveBayesClassifierDataset-eremje

    2025年4月25日 30 190 35

    印尼期刊文本分类数据集IndonesianJournalTF-IDFNaiveBayesClassifierDataset-eremje 数据来源:互联网公开数据 标签:印尼期刊, 文本分类, 数据集, TF-IDF, 朴素贝叶斯, 机器学习, 自然语言处理, 学术研究...
    packageimg
  • 假新闻与真实新闻分类数据集-2021

    2025年4月24日 30 146 122

    假新闻与真实新闻分类数据集-2021 数据来源:互联网公开数据 标签:假新闻,真实新闻,文本分析,TF-IDF,机器学习,新闻分类,数据标注 数据概述: 本数据集包含标记为假新闻和真实新闻的新闻文章。数据集来源于互联网公开数据,旨在用于假新闻识别的研究和应用。数据集包含三个关键字段: - Title:新闻标题 - Text:新闻正文或内容 -...
    packageimg
  • 文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser

    2025年4月24日 30 23 22

    文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser 数据来源:互联网公开数据 标签:文本分析,TF-IDF,数据集,自然语言处理,机器学习,信息检索,文本挖掘,文本特征 数据概述: 该数据集包含来自公开提交的文本特征提取数据,记录了通过TF-IDF方法提取的文本特征。主要特征如下:...
    packageimg
  • 文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai

    2025年4月22日 30 97 35

    文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai 数据来源:互联网公开数据 标签:文本处理,TF-IDF,数据集,自然语言处理,特征提取,机器学习,信息检索,文本分析 数据概述: 该数据集专注于文本编码与TF-IDF(词频-逆文档频率)权重计算,记录了文本数据经过处理后的特征向量。主要特征如下:...
    packageimg
  • 抑郁症文本分析TF-IDF标准化数据集2021-alexyarbor

    2025年4月22日 30 158 151

    抑郁症文本分析TF-IDF标准化数据集2021-alexyarbor 数据来源:互联网公开数据 标签:抑郁症,文本分析,TF-IDF,标准化,Reddit数据,心理健康,机器学习,自然语言处理 数据概述: 本数据集包含经过标准化处理的TF-IDF(词频-逆文档频率)特征矩阵,源自Kaggle上的抑郁症Reddit文本数据集。原始数据集由infamous...
    packageimg
  • 抑郁症相关Reddit数据集TF-IDF词向量分析-2023-alexyarbor

    2025年4月21日 30 154 41

    抑郁症相关Reddit数据集TF-IDF词向量分析-2023-alexyarbor 数据来源:互联网公开数据 标签:抑郁症,Reddit,TF-IDF,情感分析,VADER,文本处理 数据概述: 本数据集基于Kaggle平台上的“Depression Reddit...
    packageimg