找到11,786个数据集

标签: 自然语言处理

过滤结果
  • 高棉语文本数据集KhmerTextDataset123-layacheadeth

    2025年4月26日   

    高棉语文本数据集KhmerTextDataset123-layacheadeth 数据来源:互联网公开数据 标签:自然语言处理,文本分析,高棉语,机器学习,语言模型,数据集,多语言处理,文本分类 数据概述: 该数据集包含来自互联网的高棉语文本数据,记录了高棉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。...
    packageimg
  • 论文摘要数据集PaperDTSDataset-nbviet

    2025年4月26日   

    论文摘要数据集PaperDTSDataset-nbviet 数据来源:互联网公开数据 标签:论文,摘要,数据集,文本分析,自然语言处理,机器学习,学术研究,信息检索 数据概述: 该数据集包含来自Paper DTS的数据,记录了论文的摘要信息。主要特征如下: 时间跨度:数据记录的时间范围为不详。 地理范围:数据覆盖范围不详。...
    packageimg
  • 自然语言处理论文摘要数据集ACLDataset-ch4itanyap4ndey

    2025年4月26日   

    自然语言处理论文摘要数据集ACLDataset-ch4itanyap4ndey 数据来源:互联网公开数据 标签:自然语言处理,NLP,论文,数据集,文本分析,机器学习,学术研究,摘要 数据概述:该数据集包含来自ACL (Association for Computational Linguistics,计算语言学协会)...
    packageimg
  • 语言分类数据集LanguageClassificationDataset-jhaamanvaibhav

    2025年4月26日   

    语言分类数据集LanguageClassificationDataset-jhaamanvaibhav 数据来源:互联网公开数据 标签:语言分类,自然语言处理,数据集,机器学习,文本分析,多语言,数据挖掘,文本分类 数据概述: 该数据集包含来自多个来源的语言分类数据,记录了不同语言的文本样本及其对应的语言标签。主要特征如下:...
    packageimg
  • 新冠病毒疫苗推文情感分析数据集Covid19VaccineTweetsSentimentDataset-trinhngocphap

    2025年4月26日   

    新冠病毒疫苗推文情感分析数据集Covid19VaccineTweetsSentimentDataset-trinhngocphap 数据来源:互联网公开数据 标签:新冠病毒疫苗,推文分析,情感分析,数据集,社交媒体,公共卫生,机器学习,自然语言处理 数据概述:...
    packageimg
  • 姓名与性别分类数据集GenderClassificationbyNameandGenderDataset-noorulainashraf

    2025年4月26日   

    姓名与性别分类数据集GenderClassificationbyNameandGenderDataset-noorulainashraf 数据来源:互联网公开数据 标签:性别分类,姓名分析,数据集,机器学习,文本分析,社会研究,自然语言处理,人口统计 数据概述:...
    packageimg
  • 超级短信数据集SuperSMSDataset-jayaprakashpondy

    2025年4月26日   

    超级短信数据集SuperSMSDataset-jayaprakashpondy 数据来源:互联网公开数据 标签:短信分析,数据集,文本分类,自然语言处理,机器学习,通信技术,信息安全,数据挖掘 数据概述: 该数据集包含来自公开渠道的短信数据,记录了各类短信的文本内容和分类标签。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 尼泊尔语视频字幕数据集NepaliVideoCaptionDataset-kabitaparajuli

    2025年4月26日   

    尼泊尔语视频字幕数据集NepaliVideoCaptionDataset-kabitaparajuli 数据来源:互联网公开数据 标签:视频字幕,数据集,自然语言处理,机器学习,尼泊尔语,多媒体分析,人工智能,语言学习 数据概述:该数据集包含来自MSVD数据集的视频及其对应的尼泊尔语字幕,记录了视频内容的描述信息。主要特征如下:...
    packageimg
  • arXiv自然语言处理论文与GitHub链接数据集arXivNLPPaperswithGitHubLinkDataset-shujian

    2025年4月26日   

    arXiv自然语言处理论文与GitHub链接数据集arXivNLPPaperswithGitHubLinkDataset-shujian 数据来源:互联网公开数据 标签:自然语言处理,学术论文,数据集,机器学习,文本挖掘,数据科学,研究资源,开源项目 数据概述:...
    packageimg
  • 宗教文本数据集ReligiousTextsDataset-mahitnandanad

    2025年4月26日   

    宗教文本数据集ReligiousTextsDataset-mahitnandanad 数据来源:互联网公开数据 标签:宗教,文本分析,数据集,文献研究,自然语言处理,文化研究,历史研究,学术资源 数据概述: 该数据集包含来自多种宗教的经典文本,记录了不同宗教的教义,历史和文化内容。主要特征如下: 时间跨度:数据记录的时间范围从古代到现代。...
    packageimg
  • Facebook内容摘要数据集Facebook内容摘要数据集-snehajadeja

    2025年4月26日   

    Facebook内容摘要数据集Facebook内容摘要数据集-snehajadeja 数据来源:互联网公开数据 标签:社交网络,内容摘要,数据集,自然语言处理,机器学习,文本分析,社交媒体,信息提取 数据概述:该数据集包含来自Facebook的内容摘要数据,记录了用户发布内容的摘要信息。主要特征如下:...
    packageimg
  • 作文评分数据集EssayScoringDataset-pulakamsrilakshmi

    2025年4月26日   

    作文评分数据集EssayScoringDataset-pulakamsrilakshmi 数据来源:互联网公开数据 标签:教育技术,自然语言处理,机器学习,评分系统,文本分析,数据集,教育研究,人工智能 数据概述: 该数据集包含来自作文评分系统的数据,记录了学生作文及其对应的评分信息。主要特征如下:...
    packageimg
  • 乌尔都语文本词频统计数据集-乌尔都语文本语料库

    2025年4月26日   

    乌尔都语文本词频统计数据集-乌尔都语文本语料库 数据来源:互联网公开数据 标签:乌尔都语,文本分析,自然语言处理,词频统计,语料库,语言学,N-gram 数据概述: 本数据集基于在线报纸和书籍的抓取构建的乌尔都语语料库,包含了不同长度的N-gram及其对应的出现频率。数据文件包括:...
    packageimg
  • Glassdoor雇员评论与公司信息数据集-ravikumar15

    2025年4月26日   

    Glassdoor雇员评论与公司信息数据集-ravikumar15 数据来源:互联网公开数据 标签:雇员评论,公司信息,数据集,职场分析,自然语言处理,文本挖掘,数据分析,人力资源 数据概述: 该数据集包含来自 Glassdoor 网站的雇员评论和公司信息。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于 Glassdoor...
    packageimg
  • 食品评论情感分析数据集SentimentAnalysisFoodReviewsDataset-cngkhutnguyn

    2025年4月26日   

    食品评论情感分析数据集SentimentAnalysisFoodReviewsDataset-cngkhutnguyn 数据来源:互联网公开数据 标签:情感分析,食品评论,数据集,自然语言处理,机器学习,消费者行为,文本分析,市场研究 数据概述: 该数据集包含来自食品评论网站或平台的用户评论数据,记录了消费者对食品产品的评价和情感倾向。主要特征如下:...
    packageimg
  • GPT-2模型训练数据集EP2-LR8e5-blackitten13

    2025年4月26日   

    GPT-2模型训练数据集EP2-LR8e5-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,GPT-2,机器学习,模型训练,语言模型,文本分析 数据概述: 该数据集用于训练 GPT-2 模型,由 EP2 (Epoch 2) 和 LR8e5 (Learning Rate 8e-5)...
    packageimg
  • CommonLit阅读理解文章可读性数据集-chiraggodaw

    2025年4月26日   

    CommonLit阅读理解文章可读性数据集-chiraggodaw 数据来源:互联网公开数据 标签:阅读理解,可读性,数据集,自然语言处理,文本分析,教育,机器学习,语言评估 数据概述: 该数据集包含了来自CommonLit平台的中小学阅读理解文章,以及它们的可读性评分。主要特征如下: 时间跨度: 数据记录的时间范围涵盖了多个学年。 地理范围:...
    packageimg
  • 论文评分数据集EssayScoringDataset-caokhoihuynh

    2025年4月26日   

    论文评分数据集EssayScoringDataset-caokhoihuynh 数据来源:互联网公开数据 标签:论文,写作,评分,数据集,自然语言处理,文本分析,教育,机器学习 数据概述: 该数据集包含学生的论文及其对应的评分信息,旨在用于论文评分模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了学生写作的多个年份。...
    packageimg
  • 人工智能生成文本检测训练数据集LLMDetectAIGeneratedTextTrainEssaysDataset-joshualudolf

    2025年4月26日   

    人工智能生成文本检测训练数据集LLMDetectAIGeneratedTextTrainEssaysDataset-joshualudolf 数据来源:互联网公开数据 标签:自然语言处理,机器学习,文本分类,人工智能检测,深度学习,数据集,文本分析,文本生成 数据概述:...
    packageimg
  • 数据2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz

    2025年4月26日   

    2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz 数据来源:互联网公开数据 标签:事实核查,数据集,跨领域,机器学习,自然语言处理,文本分类,信息检索,可信度评估 数据概述: 该数据集源自2022年国际交叉语言评估会议(CLEF...
    packageimg