找到12,007个数据集

标签: 自然语言处理

过滤结果
  • 食品评论情感分析数据集SentimentAnalysisFoodReviewsDataset-cngkhutnguyn

    2025年4月26日   

    食品评论情感分析数据集SentimentAnalysisFoodReviewsDataset-cngkhutnguyn 数据来源:互联网公开数据 标签:情感分析,食品评论,数据集,自然语言处理,机器学习,消费者行为,文本分析,市场研究 数据概述: 该数据集包含来自食品评论网站或平台的用户评论数据,记录了消费者对食品产品的评价和情感倾向。主要特征如下:...
    packageimg
  • GPT-2模型训练数据集EP2-LR8e5-blackitten13

    2025年4月26日   

    GPT-2模型训练数据集EP2-LR8e5-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,GPT-2,机器学习,模型训练,语言模型,文本分析 数据概述: 该数据集用于训练 GPT-2 模型,由 EP2 (Epoch 2) 和 LR8e5 (Learning Rate 8e-5)...
    packageimg
  • CommonLit阅读理解文章可读性数据集-chiraggodaw

    2025年4月26日   

    CommonLit阅读理解文章可读性数据集-chiraggodaw 数据来源:互联网公开数据 标签:阅读理解,可读性,数据集,自然语言处理,文本分析,教育,机器学习,语言评估 数据概述: 该数据集包含了来自CommonLit平台的中小学阅读理解文章,以及它们的可读性评分。主要特征如下: 时间跨度: 数据记录的时间范围涵盖了多个学年。 地理范围:...
    packageimg
  • 论文评分数据集EssayScoringDataset-caokhoihuynh

    2025年4月26日   

    论文评分数据集EssayScoringDataset-caokhoihuynh 数据来源:互联网公开数据 标签:论文,写作,评分,数据集,自然语言处理,文本分析,教育,机器学习 数据概述: 该数据集包含学生的论文及其对应的评分信息,旨在用于论文评分模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了学生写作的多个年份。...
    packageimg
  • 人工智能生成文本检测训练数据集LLMDetectAIGeneratedTextTrainEssaysDataset-joshualudolf

    2025年4月26日   

    人工智能生成文本检测训练数据集LLMDetectAIGeneratedTextTrainEssaysDataset-joshualudolf 数据来源:互联网公开数据 标签:自然语言处理,机器学习,文本分类,人工智能检测,深度学习,数据集,文本分析,文本生成 数据概述:...
    packageimg
  • 数据2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz

    2025年4月26日   

    2022年CLEF会议跨领域事实核查数据集CLEF2022K-FoldSplitsDataset-kucsikz 数据来源:互联网公开数据 标签:事实核查,数据集,跨领域,机器学习,自然语言处理,文本分类,信息检索,可信度评估 数据概述: 该数据集源自2022年国际交叉语言评估会议(CLEF...
    packageimg
  • 全球心理健康数据推特数据集WorldMentalHealthDataTweetsDataset-meerapv

    2025年4月26日   

    全球心理健康数据推特数据集WorldMentalHealthDataTweetsDataset-meerapv 数据来源:互联网公开数据 标签:心理健康,社交媒体,数据集,情感分析,自然语言处理,社会研究,心理健康研究,机器学习 数据概述:该数据集包含来自全球范围内的推特数据,记录了与心理健康相关的话题讨论。主要特征如下:...
    packageimg
  • 社交媒体五折交叉验证数据集Feed5-FoldCross-ValidationDataset-aronbryant

    2025年4月26日   

    社交媒体五折交叉验证数据集Feed5-FoldCross-ValidationDataset-aronbryant 数据来源:互联网公开数据 标签:社交媒体,数据集,交叉验证,机器学习,自然语言处理,推荐系统,用户行为分析,数据科学 数据概述: 该数据集包含来自社交媒体平台的用户行为数据,主要用于五折交叉验证的机器学习模型评估。主要特征如下:...
    packageimg
  • 星际迷航剧本数据集StarTrekScriptsDataset-tamarafingerlin

    2025年4月26日   

    星际迷航剧本数据集StarTrekScriptsDataset-tamarafingerlin 数据来源:互联网公开数据 标签:科幻,剧本,数据集,文本分析,自然语言处理,影视剧,文化研究,语言学 数据概述: 该数据集包含了《星际迷航》系列电视剧和电影的剧本,记录了各个剧集和电影的对话,场景描述等内容。主要特征如下:...
    packageimg
  • 虚假新闻检测模型数据集FakeNewsModelDataset-hoanhminh24

    2025年4月26日   

    虚假新闻检测模型数据集FakeNewsModelDataset-hoanhminh24 数据来源:互联网公开数据 标签:新闻检测,数据集,机器学习,文本分析,自然语言处理,信息安全,新闻媒体,深度学习 数据概述: 该数据集包含用于虚假新闻检测的文本数据,记录了新闻文章的标题,正文,发布时间,来源等信息。主要特征如下:...
    packageimg
  • CommonLit阅读理解单词增强数据集-shaz13

    2025年4月26日   

    CommonLit阅读理解单词增强数据集-shaz13 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,数据集,词汇增强,文本分析,教育,机器学习,文本挖掘 数据概述:该数据集包含 CommonLit 竞赛的阅读理解文本,并对文本中的单词进行了增强处理。主要特征如下: 时间跨度:数据来源于 CommonLit 竞赛,时间跨度涵盖竞赛期间。...
    packageimg
  • 情感分析抑郁症检测数据集西班牙语SentimentAnalysisDepressionDetectionDatasetSpanish-adrianapaola

    2025年4月26日   

    情感分析抑郁症检测数据集西班牙语SentimentAnalysisDepressionDetectionDatasetSpanish-adrianapaola 数据来源:互联网公开数据 标签:情感分析,抑郁症检测,自然语言处理,社交媒体,数据集,心理健康,文本分类,机器学习 数据概述:...
    packageimg
  • Yelp商家评论数据集YelpBusinessReviewDataset-shwetalmore

    2025年4月26日   

    Yelp商家评论数据集YelpBusinessReviewDataset-shwetalmore 数据来源:互联网公开数据 标签:Yelp,商家评论,数据集,自然语言处理,情感分析,推荐系统,用户行为,商业分析 数据概述: 该数据集包含来自Yelp平台的商家评论数据,记录了用户对不同商家的评价和相关信息。主要特征如下:...
    packageimg
  • PDF文件知识提取数据集PDFFilesKnowledgeProcessingandMiningDataset-kailassrt

    2025年4月26日   

    PDF文件知识提取数据集PDFFilesKnowledgeProcessingandMiningDataset-kailassrt 数据来源:互联网公开数据 标签:PDF文件,知识提取,数据集,自然语言处理,机器学习,文本分析,信息检索,学术资源 数据概述:...
    packageimg
  • 越南情感分析处理数据集VietnameseSentimentProcessedDataset-longtrg

    2025年4月26日   

    越南情感分析处理数据集VietnameseSentimentProcessedDataset-longtrg 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分析,越南语,社交媒体,舆情分析 数据概述:该数据集包含经过处理的越南语文本数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 假评论检测自然语言处理数据集FakeReviewDetectionwithNLPDataset-uselessguy

    2025年4月26日   

    假评论检测自然语言处理数据集FakeReviewDetectionwithNLPDataset-uselessguy 数据来源:互联网公开数据 标签:假评论,自然语言处理,数据集,文本分析,机器学习,文本分类,在线评论,电子商务 数据概述:该数据集包含来自电子商务平台的用户评论数据,主要用于假评论检测和自然语言处理任务。主要特征如下:...
    packageimg
  • 航班信息命名实体识别数据集Ner-flightDataset-hharshsharma2098

    2025年4月26日   

    航班信息命名实体识别数据集Ner-flightDataset-hharshsharma2098 数据来源:互联网公开数据 标签:航班信息,命名实体识别,数据集,自然语言处理,机器学习,文本分析,交通行业,航空数据 数据概述: 该数据集包含航班信息相关的数据,适用于命名实体识别任务,帮助识别和提取航班相关的实体信息。主要特征如下: 时间跨度:...
    packageimg
  • BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran

    2025年4月26日   

    BBC新闻分类数据集BBCNewsClassificationDataset-chalikamihiran 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,自然语言处理,机器学习,数据挖掘,信息检索,人工智能 数据概述:该数据集包含来自BBC(英国广播公司)的新闻文章,主要用于新闻类别的自动分类。主要特征如下:...
    packageimg
  • 视频问答数据集VideoQuestionAnsweringDataset-davidromanov

    2025年4月26日   

    视频问答数据集VideoQuestionAnsweringDataset-davidromanov 数据来源:互联网公开数据 标签:视频分析,问答系统,数据集,计算机视觉,自然语言处理,深度学习,人工智能,多模态学习 数据概述: 该数据集包含来自多个视频问答研究项目的数据,记录了视频内容与相关问题的问答对。主要特征如下:...
    packageimg
  • 自然语言处理项目数据集DatasetforNLPProject-namang04

    2025年4月26日   

    自然语言处理项目数据集DatasetforNLPProject-namang04 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,深度学习,语言模型,情感分析,文本分类 数据概述: 该数据集为自然语言处理项目设计,记录了多种文本数据,适用于文本分类,情感分析,语言模型训练等任务。主要特征如下:...
    packageimg