找到11,717个数据集

标签: 自然语言处理

过滤结果
  • 数据2024年Reddit帖子数据集-vooono

    2025年4月23日   

    2024年Reddit帖子数据集-vooono 数据来源:互联网公开数据 标签:社交媒体,Reddit,帖子,文本分析,情感分析,自然语言处理,数据挖掘,用户行为 数据概述: 该数据集包含来自Reddit平台的帖子数据,记录了用户在不同版块发布的文本内容及相关信息。主要特征如下: 时间跨度:数据记录的时间范围为2024年。...
    packageimg
  • 反垃圾邮件预处理数据集BalancedSpamPreprocessedDataset-zeyadkhalid

    2025年4月23日   

    反垃圾邮件预处理数据集BalancedSpamPreprocessedDataset-zeyadkhalid 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分析,自然语言处理,机器学习,分类算法,数据预处理,文本挖掘 数据概述: 该数据集包含经过预处理的反垃圾邮件数据,用于垃圾邮件检测和分类任务。主要特征如下: 时间跨度:...
    packageimg
  • 土耳其科技新闻数据集TurkishTechnologyNewsDataset-denizhanahin

    2025年4月23日   

    土耳其科技新闻数据集TurkishTechnologyNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:土耳其,科技新闻,自然语言处理,文本分析,新闻摘要,情感分析,机器学习,土耳其语 数据概述: 该数据集包含来自土耳其新闻网站的科技新闻文章,记录了土耳其科技领域的新闻报道。主要特征如下:...
    packageimg
  • 课程评论数据集ReviewsCourseDataset-anjaneyagupta03

    2025年4月23日   

    课程评论数据集ReviewsCourseDataset-anjaneyagupta03 数据来源:互联网公开数据 标签:课程评论,数据集,自然语言处理,情感分析,文本挖掘,教育,机器学习,评价 数据概述: 该数据集包含来自在线课程的评论数据,记录了学生对课程的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围未知,但通常涵盖课程的多个学期或年份。...
    packageimg
  • 生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555

    2025年4月23日   

    生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555 数据来源:互联网公开数据 标签:生物医学,文本挖掘,自然语言处理,否定检测,语料库,新冠,药物治疗,语言学 数据概述:...
    packageimg
  • 比利时法语法律问答与法规检索数据集-thedevastator

    2025年4月23日   

    比利时法语法律问答与法规检索数据集-thedevastator 数据来源:互联网公开数据 标签:法律,比利时,法规,问答,检索,自然语言处理,机器学习,法律科技 数据概述:...
    packageimg
  • 维基百科平衡性别共指数据集-thedevastator

    2025年4月23日   

    维基百科平衡性别共指数据集-thedevastator 数据来源:互联网公开数据 标签:共指,性别平衡,数据集,维基百科,文本分析,自然语言处理,NLP,教育,研究 数据概述:...
    packageimg
  • 自然语言处理项目原始数据集-emilygreen8

    2025年4月23日   

    自然语言处理项目原始数据集-emilygreen8 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本数据,语料库,数据预处理,机器学习,文本分析 数据概述: 该数据集包含用于自然语言处理(NLP)项目的原始文本数据,涵盖多种文本来源和语言。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的发布时间。...
    packageimg
  • 问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82

    2025年4月23日   

    问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,语义理解,信息检索,知识图谱,人工智能 数据概述: 该数据集包含来自tgif问答系统项目的大量问答对数据,记录了用户提问与系统回答的详细信息。主要特征如下:...
    packageimg
  • 推特情感分析增强数据集-推文情感与文本增强-mks2192

    2025年4月23日   

    推特情感分析增强数据集-推文情感与文本增强-mks2192 数据来源:互联网公开数据 标签:推特,情感分析,文本挖掘,自然语言处理,数据增强,情感分类,文本数据 数据概述:...
    packageimg
  • 跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers

    2025年4月23日   

    跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,跨编码器,语义理解,机器学习,深度学习,文本匹配 数据概述: 该数据集包含用于训练跨编码器模型的大量文本数据,旨在提升模型在语义理解和文本匹配方面的性能。主要特征如下:...
    packageimg
  • 古兰经印尼语版本数据集QuranIndonesiaDataset-sofyanuli

    2025年4月23日   

    古兰经印尼语版本数据集QuranIndonesiaDataset-sofyanuli 数据来源:互联网公开数据 标签:古兰经,宗教,伊斯兰教,文本分析,自然语言处理,文化研究,宗教文本,印尼语 数据概述: 该数据集包含古兰经的印尼语版本,记录了《古兰经》中的所有章节(苏拉)和经文(阿亚特)。主要特征如下:...
    packageimg
  • 科学声明事实核查数据集-2022-thedevastator

    2025年4月23日   

    科学声明事实核查数据集-2022-thedevastator 数据来源:互联网公开数据 标签:科学声明,事实核查,信任度分析,情感分析,科学传播,数据标注,自然语言处理 数据概述:...
    packageimg
  • 医疗健康糖尿病数据自动标注数据集HealthDBTSATSDataset-joaogabrieln

    2025年4月22日   

    医疗健康糖尿病数据自动标注数据集HealthDBTSATSDataset-joaogabrieln 数据来源:互联网公开数据 标签:医疗健康,糖尿病,数据集,自动标注,机器学习,医学影像,疾病诊断,自然语言处理 数据概述: 该数据集包含来自医疗机构的糖尿病患者相关数据,并结合了自动标注信息,旨在支持糖尿病诊断,治疗和研究。主要特征如下:...
    packageimg
  • 越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx

    2025年4月22日   

    越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx 数据来源:互联网公开数据 标签:语言学研究,越南语,词汇分析,语料库,自然语言处理,文本挖掘,语言技术,数据集 数据概述:...
    packageimg
  • 社交媒体情感分析数据集TwitterSentimentAnalysisDataset-amnaasabahat

    2025年4月22日   

    社交媒体情感分析数据集TwitterSentimentAnalysisDataset-amnaasabahat 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,文本挖掘,情感挖掘,大数据 数据概述: 该数据集包含来自Twitter平台的公开推文数据,记录了用户发布的推文及其情感倾向。主要特征如下:...
    packageimg
  • 学术论文引用关系数据集SIYAPaperDataset-lakshinpathak

    2025年4月22日   

    学术论文引用关系数据集SIYAPaperDataset-lakshinpathak 数据来源:互联网公开数据 标签:学术论文,引用关系,数据集,知识图谱,自然语言处理,文本分析,学术研究,科学计量学 数据概述:该数据集包含来自多个学术领域的论文引用关系数据,记录了论文之间的引用情况,适用于学术研究,知识图谱构建等任务。主要特征如下:...
    packageimg
  • 圣经文本数据集-vishnuprksh

    2025年4月22日   

    圣经文本数据集-vishnuprksh 数据来源:互联网公开数据 标签:圣经,文本分析,自然语言处理,数据集,宗教研究,语言学,文本挖掘,语料库 数据概述:该数据集包含来自圣经的文本数据,涵盖了旧约和新约的多个版本和翻译。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了圣经创作的整个时期,从公元前15世纪到公元1世纪。...
    packageimg
  • 电影描述数据集MovieDescriptionDataset-malihamehjabinmitu

    2025年4月22日   

    电影描述数据集MovieDescriptionDataset-malihamehjabinmitu 数据来源:互联网公开数据 标签:电影,数据集,文本分析,自然语言处理,情感分析,机器学习,影视研究,数据挖掘 数据概述: 该数据集包含来自公开电影数据库的电影描述数据,记录了多部电影的剧情简介,分类标签,导演,演员等信息。主要特征如下:...
    packageimg
  • Flipkart产品属性值提取数据集FlipkartProductsforAttribute-ValueExtractionDataset-lameesm...

    2025年4月22日   

    Flipkart产品属性值提取数据集FlipkartProductsforAttribute-ValueExtractionDataset-lameesmohamedmohee 数据来源:互联网公开数据 标签:电子商务,产品数据,属性提取,数据集,自然语言处理,机器学习,文本分析,数据挖掘 数据概述:...
    packageimg