找到29个数据集

标签: TF-IDF

过滤结果
  • Klinger等处理后的arXiv论文元数据和摘要数据集-机器学习方法分类-2020

    2025年6月1日 30 203 105

    Klinger等处理后的arXiv论文元数据和摘要数据集-机器学习方法分类-2020 数据来源:互联网公开数据 标签:arXiv,论文元数据,摘要,机器学习,分类,文本处理,训练数据,TF-IDF 数据概述:...
    packageimg
  • 蛋白质功能分析抽象嵌入与词汇表数据集2021-adarshr

    2025年5月31日 30 3 1

    蛋白质功能分析抽象嵌入与词汇表数据集2021-adarshr 数据来源:互联网公开数据 标签:蛋白质,功能分析,TF-IDF,词嵌入,词汇表,科学数据 数据概述: 本数据集名为“Abstract_embeds_final”,收录了蛋白质功能分析相关的研究抽象文本嵌入及词汇表信息。数据集中包含了蛋白质ID和对应的Go词汇表术语,用于构建TF-...
    packageimg
  • 文本主题聚类分析数据集TextTopicClusteringAnalysisDataset-dddmdd

    2025年5月28日 30 115 27

    文本主题聚类分析数据集TextTopicClusteringAnalysisDataset-dddmdd 数据来源:互联网公开数据 标签:文本聚类, 主题建模, 自然语言处理, K-means, TF-IDF, UMAP, 机器学习, 教育 数据概述: 该数据集包含用于文本主题聚类分析的数据,记录了经过处理的文本样本及其对应的聚类结果。主要特征如下:...
    packageimg
  • 文本相似度特征分析训练数据集TextSimilarityFeatureAnalysisTrainingDataset-zhangkeke123

    2025年5月26日 30 2 1

    文本相似度特征分析训练数据集TextSimilarityFeatureAnalysisTrainingDataset-zhangkeke123 数据来源:互联网公开数据 标签:文本相似度, 文本分析, 特征工程, 机器学习, 自然语言处理, 相似度计算, TF-IDF, 数据集 数据概述:...
    packageimg
  • 新闻标题文本特征分析数据集NewsHeadlinesTextFeatureAnalysis-ketan123441

    2025年5月20日 30 92 39

    新闻标题文本特征分析数据集NewsHeadlinesTextFeatureAnalysis-ketan123441 数据来源:互联网公开数据 标签:新闻标题, 文本分析, 自然语言处理, TF-IDF, 文本特征, 机器学习, 舆情分析, 情感分析 数据概述:...
    packageimg
  • 文本情感分类数据集TextSentimentClassificationDataset-redhotchillis

    2025年5月18日 30 82 3

    文本情感分类数据集TextSentimentClassificationDataset-redhotchillis 数据来源:互联网公开数据 标签:情感分析, 文本分类, 机器学习, 自然语言处理, 情感标注, 词向量, TF-IDF, 深度学习 数据概述: 该数据集包含多种文本数据,用于训练和评估文本情感分类模型。主要特征如下:...
    packageimg
  • 社交媒体成瘾相关文本特征分析数据集SocialMediaAddictionTextFeatureAnalysis-anandpanda3

    2025年5月17日 30 19 3

    社交媒体成瘾相关文本特征分析数据集SocialMediaAddictionTextFeatureAnalysis-anandpanda3 数据来源:互联网公开数据 标签:社交媒体, 成瘾行为, 文本分析, 情感分析, 机器学习, LIWC, TF-IDF, 精神健康, Reddit 数据概述:...
    packageimg
  • 嵌入与TF-IDF文本特征提取数据集EmbeddedandTF-IDFTextFeatureExtractionDataset-malav312

    2025年5月12日 30 38 6

    嵌入与TF-IDF文本特征提取数据集EmbeddedandTF-IDFTextFeatureExtractionDataset-malav312 数据来源:互联网公开数据 标签:自然语言处理,文本特征提取,机器学习,数据集,TF-IDF,词嵌入,文本分析,信息检索 数据概述:该数据集包含用于文本特征提取的嵌入和TF-...
    packageimg
  • 医学诊断疾病ICD9代码分析数据集MedicalDiagnosisICD9CodeAnalysisDataset-mariaponomarenko

    2025年5月11日 30 103 47

    医学诊断疾病ICD9代码分析数据集MedicalDiagnosisICD9CodeAnalysisDataset-mariaponomarenko 数据来源:互联网公开数据 标签:ICD9, 医学诊断, 疾病分类, TF-IDF, 文本挖掘, 机器学习, 医疗健康, 临床数据 数据概述:...
    packageimg
  • 毒性分类数据集

    2025年5月5日 30 160 100

    毒性分类数据集 数据来源:互联网公开数据 标签:毒性分类,文本分析,机器学习,自然语言处理,Word2Vec,TF-IDF,文本特征提取,分类模型训练 数据概述: 本数据集是一个用于毒性分类任务的文本数据集,包含经过预处理和特征提取的文本样本,旨在帮助研究者和开发者进行毒性文本识别和分类模型的训练与优化。数据集通过Word2Vec和TF-...
    packageimg
  • 印尼期刊文本分类数据集IndonesianJournalTF-IDFNaiveBayesClassifierDataset-eremje

    2025年4月25日 30 188 14

    印尼期刊文本分类数据集IndonesianJournalTF-IDFNaiveBayesClassifierDataset-eremje 数据来源:互联网公开数据 标签:印尼期刊, 文本分类, 数据集, TF-IDF, 朴素贝叶斯, 机器学习, 自然语言处理, 学术研究...
    packageimg
  • 假新闻与真实新闻分类数据集-2021

    2025年4月24日 30 119 79

    假新闻与真实新闻分类数据集-2021 数据来源:互联网公开数据 标签:假新闻,真实新闻,文本分析,TF-IDF,机器学习,新闻分类,数据标注 数据概述: 本数据集包含标记为假新闻和真实新闻的新闻文章。数据集来源于互联网公开数据,旨在用于假新闻识别的研究和应用。数据集包含三个关键字段: - Title:新闻标题 - Text:新闻正文或内容 -...
    packageimg
  • 文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser

    2025年4月24日 30 144 106

    文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser 数据来源:互联网公开数据 标签:文本分析,TF-IDF,数据集,自然语言处理,机器学习,信息检索,文本挖掘,文本特征 数据概述: 该数据集包含来自公开提交的文本特征提取数据,记录了通过TF-IDF方法提取的文本特征。主要特征如下:...
    packageimg
  • 文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai

    2025年4月22日 30 193 75

    文本编码与TF-IDF权重计算数据集Encode-TFIDFDataset-damvantai 数据来源:互联网公开数据 标签:文本处理,TF-IDF,数据集,自然语言处理,特征提取,机器学习,信息检索,文本分析 数据概述: 该数据集专注于文本编码与TF-IDF(词频-逆文档频率)权重计算,记录了文本数据经过处理后的特征向量。主要特征如下:...
    packageimg
  • 抑郁症文本分析TF-IDF标准化数据集2021-alexyarbor

    2025年4月22日 30 197 156

    抑郁症文本分析TF-IDF标准化数据集2021-alexyarbor 数据来源:互联网公开数据 标签:抑郁症,文本分析,TF-IDF,标准化,Reddit数据,心理健康,机器学习,自然语言处理 数据概述: 本数据集包含经过标准化处理的TF-IDF(词频-逆文档频率)特征矩阵,源自Kaggle上的抑郁症Reddit文本数据集。原始数据集由infamous...
    packageimg
  • 抑郁症相关Reddit数据集TF-IDF词向量分析-2023-alexyarbor

    2025年4月21日 30 133 14

    抑郁症相关Reddit数据集TF-IDF词向量分析-2023-alexyarbor 数据来源:互联网公开数据 标签:抑郁症,Reddit,TF-IDF,情感分析,VADER,文本处理 数据概述: 本数据集基于Kaggle平台上的“Depression Reddit...
    packageimg
  • 酒店评论情感分析数据集

    2025年4月20日 30 24 11

    酒店评论情感分析数据集 数据来源:互联网公开数据 标签:酒店评论,情感分析,文本分类,机器学习,自然语言处理,情感极性,TF-IDF,词向量,深度学习 数据概述:...
    packageimg
  • 自杀数据清理版数据集

    2025年4月16日 30 185 94

    自杀数据清理版数据集 数据来源:互联网公开数据 标签:自杀,心理健康,文本分析,情感分析,数据清理,TF-IDF,机器学习 数据概述: 本数据集基于“suicide-watch”数据集进行清理和预处理,旨在提供更高质量的数据用于进一步分析和建模。清理过程包括去除表情符号、停止词,并采用TF-...
    packageimg
  • Reddit抑郁文本情感分析与TF-IDF特征数据集

    2025年4月15日 30 40 17

    Reddit抑郁文本情感分析与TF-IDF特征数据集 数据来源:互联网公开数据 标签:情感分析,TF-IDF,Reddit,抑郁研究,自然语言处理,额外特征,社会情感 数据概述:...
    packageimg
  • 非监督学习自然语言处理数据集

    2025年4月15日 30 178 163

    非监督学习自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,非监督学习,问答系统,TF-IDF,文档检索 数据概述: 本数据集用于非监督学习中的问答系统训练。数据集中的每一行代表一个文档,适用于通过向量模型和TF-IDF方法检索用户查询的答案。该数据集包含大量的文本信息,为构建有效的问答系统提供了丰富的训练素材。 数据用途概述:...
    packageimg