找到11,747个数据集

标签: 自然语言处理

过滤结果
  • 能源原油行业情感分析数据集SentimentAnalysisinEnergyCrudeOilDataset-yassinehamdaoui1

    2025年4月24日   

    能源原油行业情感分析数据集SentimentAnalysisinEnergyCrudeOilDataset-yassinehamdaoui1 数据来源:互联网公开数据 标签:情感分析,能源行业,原油市场,金融分析,数据集,自然语言处理,机器学习,商业智能...
    packageimg
  • 生物医学问答数据集QNA-Bio-1024-donutkashvi

    2025年4月24日   

    生物医学问答数据集QNA-Bio-1024-donutkashvi 数据来源:互联网公开数据 标签:生物医学,问答系统,数据集,自然语言处理,机器学习,医疗健康,医学知识,信息检索 数据概述: 该数据集包含来自多个生物医学领域的问答数据,旨在用于构建和评估生物医学问答系统。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 数据2019年美国数据分析师职位分析数据集-anjolaoluwaajayi

    2025年4月24日   

    2019年美国数据分析师职位分析数据集-anjolaoluwaajayi 数据来源:互联网公开数据 标签:数据分析,职位分析,美国,2019年,招聘信息,文本分析,自然语言处理,职业发展 数据概述:该数据集包含了2019年在美国发布的多个数据分析师职位信息。主要特征如下: 时间跨度:数据记录的时间范围为2019年全年。 地理范围:数据主要覆盖美国境内。...
    packageimg
  • 新闻文本数据集ScrapedNewsDataDataset-eilhie

    2025年4月24日   

    新闻文本数据集ScrapedNewsDataDataset-eilhie 数据来源:互联网公开数据 标签:新闻数据,文本分析,数据集,自然语言处理,机器学习,信息提取,数据挖掘,新闻媒体 数据概述: 该数据集包含来自互联网的公开新闻数据,记录了各类新闻文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从【起始年份】到【结束年份】。...
    packageimg
  • 问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk

    2025年4月24日   

    问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语义理解,语言模型,教育技术,数据挖掘 数据概述: 该数据集包含来自多个来源的问题重述和表达优化数据,记录了不同领域问题的原始表述及其优化后的重述。主要特征如下:...
    packageimg
  • 大规模情感数据集LargeEmotionSetDataset-ubbarapusiri

    2025年4月24日   

    大规模情感数据集LargeEmotionSetDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本挖掘,心理学,情感识别,数据挖掘 数据概述: 该数据集包含大规模的情感数据,记录了不同文本内容所表达的情感倾向。主要特征如下: 时间跨度:数据记录的时间范围未明确说明,推测为近年数据。...
    packageimg
  • 人脸与姓名数据集-bailalim

    2025年4月24日   

    人脸与姓名数据集-bailalim 数据来源:互联网公开数据 标签:人脸识别,姓名匹配,数据集,图像,自然语言处理,机器学习,身份验证,社交媒体 数据概述: 该数据集包含人脸图像及其对应的姓名信息,旨在用于人脸识别,姓名匹配等任务。主要特征如下: 时间跨度: 数据记录的时间范围不限,取决于数据来源。 地理范围: 数据来源广泛,涵盖全球范围。 数据维度:...
    packageimg
  • Jigsaw评论毒性验证数据集-hmikraminfo

    2025年4月24日   

    Jigsaw评论毒性验证数据集-hmikraminfo 数据来源:互联网公开数据 标签:自然语言处理,文本分析,毒性检测,数据集,机器学习,情感分析,评论,社交媒体 数据概述: 该数据集由 Jigsaw 团队提供,用于验证和评估文本毒性检测模型。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了大量的近期评论数据。...
    packageimg
  • 对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla

    2025年4月24日   

    对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla 数据来源:互联网公开数据 标签:对话记录,文本清理,数据集,自然语言处理,机器学习,文本分析,数据预处理,语言学 数据概述:该数据集包含经过清理的对话记录,适用于自然语言处理,文本分析等任务。主要特征如下:...
    packageimg
  • 推文情感预测数据集TweetSentimentPredictionDataset-dinoooo9

    2025年4月24日   

    推文情感预测数据集TweetSentimentPredictionDataset-dinoooo9 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,文本分析,数据挖掘,情感识别 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的内容及其对应的情感标签。主要特征如下:...
    packageimg
  • Facebook评论数据集FacebookCommentDataset-axelj1

    2025年4月24日   

    Facebook评论数据集FacebookCommentDataset-axelj1 数据来源:互联网公开数据 标签:社交媒体,数据集,评论分析,情感分析,自然语言处理,机器学习,互联网数据,用户行为 数据概述: 该数据集包含来自Facebook平台的用户评论数据,记录了社交媒体上的用户互动和反馈信息。主要特征如下:...
    packageimg
  • 维基百科文章向量文件数据集WikipediaArticlesVectorFileDataset-sachinsk

    2025年4月24日   

    维基百科文章向量文件数据集WikipediaArticlesVectorFileDataset-sachinsk 数据来源:互联网公开数据 标签:维基百科,文章向量,自然语言处理,数据集,机器学习,文本分析,词嵌入,信息检索 数据概述: 该数据集包含来自维基百科的文章向量数据,记录了维基百科文章的词嵌入向量。主要特征如下: 时间跨度:...
    packageimg
  • 虚假新闻检测数据集FakeNewsChallengeDataset-quentinducoulombier

    2025年4月24日   

    虚假新闻检测数据集FakeNewsChallengeDataset-quentinducoulombier 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,机器学习,文本分类,信息传播,数据分析,新闻媒体 数据概述: 该数据集来自虚假新闻挑战赛(Fake News Challenge),记录了网络新闻文本及其真实性标签。主要特征如下:...
    packageimg
  • 越南语翻译数据集VietnameseTranslateDataset-tranvannhan1911

    2025年4月24日   

    越南语翻译数据集VietnameseTranslateDataset-tranvannhan1911 数据来源:互联网公开数据 标签:语言学习,翻译,数据集,自然语言处理,机器学习,越南语,文本分析,语言技术 数据概述: 该数据集包含来自越南语翻译项目的数据,记录了越南语与其它语言(如英语,中文等)之间的翻译数据。主要特征如下:...
    packageimg
  • 讽刺检测数据集SarcasticDetectionsDataset-muhammadabbasshareef

    2025年4月24日   

    讽刺检测数据集SarcasticDetectionsDataset-muhammadabbasshareef 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,情感识别,人工智能,语言模型 数据概述: 该数据集包含来自社交媒体,新闻评论和论坛等公开来源的文本数据,记录了用户生成内容中的讽刺表达。主要特征如下:...
    packageimg
  • 文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser

    2025年4月24日   

    文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser 数据来源:互联网公开数据 标签:文本分析,TF-IDF,数据集,自然语言处理,机器学习,信息检索,文本挖掘,文本特征 数据概述: 该数据集包含来自公开提交的文本特征提取数据,记录了通过TF-IDF方法提取的文本特征。主要特征如下:...
    packageimg
  • 心理健康常见问题解答数据集MentalHealthFAQDataset-mahmoudsaadmohamed

    2025年4月24日   

    心理健康常见问题解答数据集MentalHealthFAQDataset-mahmoudsaadmohamed 数据来源:互联网公开数据 标签:心理健康,常见问题,数据集,问答系统,自然语言处理,情感分析,医疗健康,知识图谱 数据概述: 该数据集包含来自各种来源的心理健康相关的常见问题解答。主要特征如下:...
    packageimg
  • 表情符号预测数据集EmojiPredictionDataset-anantyadav

    2025年4月24日   

    表情符号预测数据集EmojiPredictionDataset-anantyadav 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,情感计算,文本挖掘,计算机科学,数据挖掘 数据概述:该数据集包含用于表情符号预测的文本数据,记录了与表情符号相关的文本内容和对应的表情符号标签。主要特征如下:...
    packageimg
  • O2O电商评论数据集O2OShopCommentDataset-yuzhanu

    2025年4月24日   

    O2O电商评论数据集O2OShopCommentDataset-yuzhanu 数据来源:互联网公开数据 标签:电商评论,数据集,消费者行为,自然语言处理,情感分析,机器学习,商业智能,市场研究 数据概述: 该数据集包含来自O2O电商平台(线上到线下)的用户评论数据,记录了消费者对商品和服务的反馈信息。主要特征如下:...
    packageimg
  • 命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin

    2025年4月24日   

    命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin 数据来源:互联网公开数据 标签:命名实体识别, 数据集, 自然语言处理, 机器学习, Keras, 人工智能, 文本分析, 语义理解 数据概述:...
    packageimg