找到5,444个数据集

标签: 文本分析

过滤结果
  • 问题回答质量评估预测数据集QuestionAnsweringQualityAssessmentPrediction-manidaaw

    2025年5月30日 30 177 144

    问题回答质量评估预测数据集QuestionAnsweringQualityAssessmentPrediction-manidaaw 数据来源:互联网公开数据 标签:问题回答, 质量评估, 预测模型, 文本分析, 机器学习, 自然语言处理, 问答系统, 深度学习 数据概述:...
    packageimg
  • 淋巴细胞白血病文章数据集-javeria

    2025年5月30日 30 116 0

    淋巴细胞白血病文章数据集-javeria 数据来源:互联网公开数据 标签:白血病,淋巴细胞,医学,数据集,文本分析,自然语言处理,疾病研究,学术文献 数据概述:该数据集包含来自PubMed的关于淋巴细胞白血病(Lymphoblastic Leukemia)的医学文章数据,记录了相关疾病的研究、治疗和临床试验信息。主要特征如下:...
    packageimg
  • 垃圾文本识别数据集RubbishTextDataset-sokoface

    2025年5月30日 30 143 60

    垃圾文本识别数据集RubbishTextDataset-sokoface 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,垃圾信息过滤,机器学习,文本分类,信息检索,数据挖掘 数据概述: 该数据集包含来自互联网的垃圾文本数据,记录了各种形式的垃圾信息,如广告、诈骗、低俗内容等。主要特征如下:...
    packageimg
  • 向量化文本处理数据集VectorisedTextDataset-rhianarmstrong

    2025年5月30日 30 73 54

    向量化文本处理数据集VectorisedTextDataset-rhianarmstrong 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本分析,向量化,深度学习,信息检索 数据概述: 该数据集包含来自互联网的文本数据,经过向量化处理,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • Alura词向量数据集AluraWord2VecDataset-romariogomesbr

    2025年5月30日 30 171 147

    Alura词向量数据集AluraWord2VecDataset-romariogomesbr 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,机器学习,文本分析,深度学习,NLP,语义分析 数据概述: 该数据集包含来自Alura项目的词向量数据,记录了大规模文本语料库中词汇的向量表示。主要特征如下:...
    packageimg
  • 联合国大会演讲处理数据集UNGASpeechesProcessesDataset-smooge

    2025年5月30日 30 25 9

    联合国大会演讲处理数据集UNGASpeechesProcessesDataset-smooge 数据来源:互联网公开数据 标签:联合国,演讲,数据集,文本分析,自然语言处理,政治研究,国际关系,多语言文本 数据概述: 该数据集包含来自联合国大会的演讲记录,经过处理后适用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:...
    packageimg
  • GitHub问题追踪数据集GitHubIssuesDataset-ansnadeem

    2025年5月30日 30 75 67

    GitHub问题追踪数据集GitHubIssuesDataset-ansnadeem 数据来源:互联网公开数据 标签:软件开发,问题追踪,数据集,自然语言处理,文本分析,开源项目,机器学习,代码管理 数据概述:该数据集包含来自GitHub的开源项目的问题追踪数据,记录了开发者在项目开发过程中遇到的问题、讨论和解决方案。主要特征如下:...
    packageimg
  • 作弊检测数据集CheatingDetectionDataset-rahimatanveer1

    2025年5月30日 30 138 88

    作弊检测数据集CheatingDetectionDataset-rahimatanveer1 数据来源:互联网公开数据 标签:作弊检测,数据集,教育,学术诚信,机器学习,数据分析,文本分析,行为分析 数据概述: 该数据集包含了用于作弊检测的数据,旨在帮助识别和预防学术不端行为。主要特征如下: 时间跨度:数据记录的时间范围涵盖了多个学期和考试周期。...
    packageimg
  • 股票市场情绪分析验证数据集StockMarketSentimentAnalysisValidationDataset-kunihikofurugori

    2025年5月30日 30 133 103

    股票市场情绪分析验证数据集StockMarketSentimentAnalysisValidationDataset-kunihikofurugori 数据来源:互联网公开数据 标签:股票市场, 情绪分析, 文本分析, 自然语言处理, 情感分类, 验证集, 金融科技, 数据集 数据概述:...
    packageimg
  • 垃圾邮件与正常邮件数据集CombinedSpamandHamEmailDataset-mlane43210

    2025年5月30日 30 74 9

    垃圾邮件与正常邮件数据集CombinedSpamandHamEmailDataset-mlane43210 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,自然语言处理,文本分析,机器学习,信息检索,电子邮件 数据概述: 该数据集整合了垃圾邮件和正常邮件的文本内容,用于邮件分类、垃圾邮件检测等任务。主要特征如下:...
    packageimg
  • 乌兹别克语问答数据集Question-AnswerUzbekDataset-arslonbek

    2025年5月30日 30 43 36

    乌兹别克语问答数据集Question-AnswerUzbekDataset-arslonbek 数据来源:互联网公开数据 标签:乌兹别克语,问答,自然语言处理,数据集,文本分析,机器翻译,语言学,人工智能 数据概述: 该数据集包含乌兹别克语的问答对,旨在促进乌兹别克语的自然语言处理研究和应用。主要特征如下: 时间跨度:数据收集时间不限,持续更新。...
    packageimg
  • 斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261

    2025年5月30日 30 151 125

    斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,斯坦福大学,文本分析,机器学习,深度学习,语义分析 数据概述:...
    packageimg
  • 预处理简历数据集PreprocessedResumeDataset-hjhgkyo

    2025年5月30日 30 54 37

    预处理简历数据集PreprocessedResumeDataset-hjhgkyo 数据来源:互联网公开数据 标签:简历,数据集,人力资源,招聘,机器学习,文本分析,自然语言处理,求职 数据概述: 该数据集包含经过预处理的简历数据,适用于人力资源管理和招聘过程中的自动化筛选。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 在线性别歧视可解释性检测数据集ExplainableDetectionofOnlineSexism-EDOS-maifeeulasad

    2025年5月30日 30 121 39

    在线性别歧视可解释性检测数据集ExplainableDetectionofOnlineSexism-EDOS-maifeeulasad 数据来源:互联网公开数据 标签:性别歧视,自然语言处理,数据集,机器学习,文本分析,情感分析,社交媒体,可解释性 数据概述: 该数据集主要用于研究和开发在线性别歧视的检测模型,旨在提高模型的可解释性。主要特征如下:...
    packageimg
  • 用户性别预测训练与测试数据集UserGenderPredictionTrainingandTestingDataset-shobhit18th

    2025年5月30日 30 162 158

    用户性别预测训练与测试数据集UserGenderPredictionTrainingandTestingDataset-shobhit18th 数据来源:互联网公开数据 标签:用户画像, 性别预测, 数据挖掘, 机器学习, 用户行为分析, 文本分析, 数据集, 预测模型 数据概述:...
    packageimg
  • 尼泊尔新闻文本数据集NepaliNewsTextDataset-sulavtimilsina

    2025年5月30日 30 111 101

    尼泊尔新闻文本数据集NepaliNewsTextDataset-sulavtimilsina 数据来源:互联网公开数据 标签:新闻文本, 尼泊尔语, 文本分类, 自然语言处理, 语料库, 新闻报道, 文本分析, 数据挖掘 数据概述: 该数据集包含来自尼泊尔新闻网站NepaliPatra的文本数据,记录了各种新闻报道的内容。主要特征如下:...
    packageimg
  • 自然语言处理NLP职位描述数据集-koti4878m

    2025年5月30日 30 150 71

    自然语言处理NLP职位描述数据集-koti4878m 数据来源:互联网公开数据 标签:自然语言处理,NLP,职位描述,文本分析,机器学习,招聘,数据挖掘,文本分类 数据概述:该数据集包含来自互联网的职位描述文本数据,主要记录了不同行业的职位描述信息。主要特征如下: 时间跨度:数据记录的时间范围跨度不定,取决于爬取时间与数据来源。...
    packageimg
  • 图书版本信息数据集Version-2-BooksDataset-sai1881

    2025年5月30日 30 134 116

    图书版本信息数据集Version-2-BooksDataset-sai1881 数据来源:互联网公开数据 标签:图书,版本管理,数据集,出版信息,文本分析,信息管理,学术研究,数据挖掘 数据概述: 该数据集包含来自图书出版行业的版本信息数据,记录了图书的不同版本及其相关信息。主要特征如下: 时间跨度:...
    packageimg
  • 维基百科摘要数据集Wiki-SumDataset-sandeep16064

    2025年5月30日 30 45 41

    维基百科摘要数据集Wiki-SumDataset-sandeep16064 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,信息检索,文本分析,知识图谱,语言模型 数据概述: 该数据集包含来自维基百科的文本及对应的摘要数据,记录了维基百科条目的详细内容和自动生成的摘要信息。主要特征如下:...
    packageimg
  • 社交媒体抑郁症检测数据集SWC-WANGDepressionDetectionDataset-mihailchirobocea

    2025年5月30日 30 117 116

    社交媒体抑郁症检测数据集SWC-WANGDepressionDetectionDataset-mihailchirobocea 数据来源:互联网公开数据 标签:抑郁症,社交媒体,文本分析,自然语言处理,情感分析,机器学习,心理健康,数据集 数据概述: 该数据集包含来自社交媒体平台的数据,用于抑郁症检测研究。主要特征如下:...
    packageimg