找到11,745个数据集

标签: 自然语言处理

过滤结果
  • 情感识别与文本分析数据集CREMATextCSVDataset-nytgaming

    2025年4月24日   

    情感识别与文本分析数据集CREMATextCSVDataset-nytgaming 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本挖掘,机器学习,情感计算,语言技术,人工智能 数据概述: 该数据集包含来自CREMA-D项目的文本数据,记录了语音情感识别任务中的文本内容及其对应的情感标签。主要特征如下:...
    packageimg
  • 美国人口普查BERT词嵌入数据集BERTEmbeddingUSPPPDataset-e94076039

    2025年4月24日   

    美国人口普查BERT词嵌入数据集BERTEmbeddingUSPPPDataset-e94076039 数据来源:互联网公开数据 标签:BERT词嵌入,人口普查,数据集,自然语言处理,机器学习,社会科学研究,人口统计,美国 数据概述:该数据集包含了基于BERT模型生成的人口普查相关词汇的词嵌入,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • 未对齐的标记化数据集CenteredTokenized-2Dataset-enarior

    2025年4月24日   

    未对齐的标记化数据集CenteredTokenized-2Dataset-enarior 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本处理,机器学习,语言模型,数据标注,文本分类,深度学习 数据概述: 该数据集包含来自未对齐标记化处理过程的文本数据,记录了经过特定标记化方法处理的文本样本。主要特征如下:...
    packageimg
  • 双语文本对齐数据集BitextDataCollection-imaadhasan

    2025年4月24日   

    双语文本对齐数据集BitextDataCollection-imaadhasan 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本对齐,双语数据,语言技术,数据挖掘,人工智能 数据概述: 该数据集包含来自多个来源的双语文本对齐数据,记录了不同语言之间的文本对应关系。主要特征如下:...
    packageimg
  • Quora重复问题数据集QuoraDuplicateQuestionsDataset-ekanshu

    2025年4月24日   

    Quora重复问题数据集QuoraDuplicateQuestionsDataset-ekanshu 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,深度学习,语义分析 数据概述: 该数据集包含来自Quora平台的问答数据,记录了平台上用户提出的问题及其标签。主要特征如下:...
    packageimg
  • 医学问答数据集MedicalQuestionAnsweringDataset-swaranshpatel

    2025年4月24日   

    医学问答数据集MedicalQuestionAnsweringDataset-swaranshpatel 数据来源:互联网公开数据 标签:医学,问答系统,数据集,人工智能,自然语言处理,健康咨询,机器学习,信息检索 数据概述: 该数据集包含来自医学领域的问答数据,记录了用户提出的医学相关问题及其对应的专家回答。主要特征如下:...
    packageimg
  • KaggleREADME文件文档数据集-rejent

    2025年4月24日   

    KaggleREADME文件文档数据集-rejent 数据来源:互联网公开数据 标签:文档,数据集,Kaggle,元数据,数据清洗,数据分析,机器学习,自然语言处理 数据概述: 该数据集包含Kaggle平台上README文档的元数据和文本内容,用于数据科学和机器学习研究。主要特征如下:...
    packageimg
  • 客户银行推文主题分析数据集LDA-W2V-D2VTopicsandTweetsCustomerBankingDataset-yixiang

    2025年4月24日   

    客户银行推文主题分析数据集LDA-W2V-D2VTopicsandTweetsCustomerBankingDataset-yixiang 数据来源:互联网公开数据 标签:客户银行,推文分析,主题建模,文本挖掘,情感分析,自然语言处理,机器学习,社交媒体 数据概述:...
    packageimg
  • 标题与期刊论文数据集TitleandJournalDataset-boa234

    2025年4月24日   

    标题与期刊论文数据集TitleandJournalDataset-boa234 数据来源:互联网公开数据 标签:期刊论文,标题分析,数据集,学术研究,文本挖掘,自然语言处理,信息检索,学术资源 数据概述: 该数据集包含来自多个学术期刊的论文标题数据,记录了各类期刊论文的标题信息。主要特征如下: 时间跨度: 数据记录的时间范围从2000年到2022年。...
    packageimg
  • 焦虑症状Reddit帖子数据集AnxietySymptomsRedditPostsDataset-countmein

    2025年4月24日   

    焦虑症状Reddit帖子数据集AnxietySymptomsRedditPostsDataset-countmein 数据来源:互联网公开数据 标签:焦虑症状,Reddit,社交媒体,心理健康,数据分析,情感分析,自然语言处理,心理健康研究...
    packageimg
  • 阿达尼集团相关推文数据集TweetsonAdani10kDataset-vidiptvashist

    2025年4月24日   

    阿达尼集团相关推文数据集TweetsonAdani10kDataset-vidiptvashist 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,舆情监测,机器学习,自然语言处理,商业研究 数据概述: 该数据集包含来自社交媒体平台Twitter(推文)的公开数据,记录了与阿达尼集团(Adani...
    packageimg
  • 胸腔积液MIMIC影像报告数据集EffusionMIMICReportsDataset-wasifnafee

    2025年4月24日   

    胸腔积液MIMIC影像报告数据集EffusionMIMICReportsDataset-wasifnafee 数据来源:互联网公开数据 标签:医学影像,胸腔积液,MIMIC数据库,数据集,临床报告,机器学习,自然语言处理,医疗AI 数据概述:...
    packageimg
  • Kindle电子书数据集KindleBooksDataset-snathjr

    2025年4月24日   

    Kindle电子书数据集KindleBooksDataset-snathjr 数据来源:互联网公开数据 标签:电子书,数据集,阅读分析,用户行为,自然语言处理,市场分析,推荐系统,书籍推荐 数据概述: 该数据集包含来自Kindle平台的电子书数据,记录了电子书的详细信息和用户交互数据。主要特征如下:...
    packageimg
  • 推特产品情感分析数据集-blessondensil294

    2025年4月24日   

    推特产品情感分析数据集-blessondensil294 数据来源:互联网公开数据 标签:情感分析,推特,产品评价,自然语言处理,文本分类,机器学习,社交媒体,舆情分析 数据概述: 该数据集包含了来自推特平台的产品相关推文,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围为一段时间内的推文。...
    packageimg
  • 在线评论立场识别数据集OLIDCleanedDataset-barunikarthika

    2025年4月24日   

    在线评论立场识别数据集OLIDCleanedDataset-barunikarthika 数据来源:互联网公开数据 标签:自然语言处理,文本分类,立场识别,数据集,机器学习,社交媒体,情感分析,情感计算 数据概述: 该数据集包含来自社交媒体平台的在线评论数据,记录了用户对不同话题的立场和态度。主要特征如下:...
    packageimg
  • 信息科学582挑战赛数据集-saranga7

    2025年4月24日   

    信息科学582挑战赛数据集-saranga7 数据来源:互联网公开数据 标签:机器学习,数据集,文本分析,自然语言处理,情感分析,社交媒体,竞赛,新闻 数据概述:该数据集包含来自信息科学582挑战赛的数据,主要记录了与新闻文章相关的文本数据。主要特征如下: 时间跨度:数据记录的时间范围,涵盖了挑战赛期间的新闻文章。...
    packageimg
  • 大规模机器学习模型测试结果数据集TestOutputsfromFullTrainDataset-karelbecerra

    2025年4月24日   

    大规模机器学习模型测试结果数据集TestOutputsfromFullTrainDataset-karelbecerra 数据来源:互联网公开数据 标签:机器学习,模型测试,数据集,预测结果,性能评估,自然语言处理,计算机视觉,深度学习 数据概述: 该数据集包含了从完整训练数据集(Full Train...
    packageimg
  • 达里جة语句子数据集DarijaSentencesDataset-atif10

    2025年4月24日   

    达里جة语句子数据集DarijaSentencesDataset-atif10 数据来源:互联网公开数据 标签:自然语言处理,语言数据集,文本分类,情感分析,机器学习,人工智能,语言研究,非洲语言 数据概述: 该数据集包含来自摩洛哥达里جة语的真实句子数据,记录了该语言的日常用语和表达。主要特征如下:...
    packageimg
  • 数据2022年世界杯足球赛推特数据集FIFAWorldCup2022TweetsDataset-alawdisoft

    2025年4月24日   

    2022年世界杯足球赛推特数据集FIFAWorldCup2022TweetsDataset-alawdisoft 数据来源:互联网公开数据 标签:世界杯,足球,社交媒体,推特,数据分析,自然语言处理,体育研究,社会学 数据概述: 该数据集包含2022年世界杯足球赛期间的推特数据,记录了全球球迷在推特上的讨论和互动。主要特征如下:...
    packageimg
  • 突尼斯短信垃圾邮件数据集TunisianSMSSpamandHamCollection-mahdibenabdallah

    2025年4月24日   

    突尼斯短信垃圾邮件数据集TunisianSMSSpamandHamCollection-mahdibenabdallah 数据来源:互联网公开数据 标签:短信,垃圾邮件,文本分类,自然语言处理,机器学习,阿拉伯语,数据集,文本分析 数据概述: 该数据集包含了来自突尼斯的短信数据,用于垃圾短信(Spam)和正常短信(Ham)的分类研究。主要特征如下:...
    packageimg