找到5,735个数据集

标签: 文本分析

过滤结果
  • 英语与法语意图分类数据集IntentClassificationEnglish-FrenchDataset-husainkhatba

    2025年4月24日   

    英语与法语意图分类数据集IntentClassificationEnglish-FrenchDataset-husainkhatba 数据来源:互联网公开数据 标签:自然语言处理,意图分类,数据集,机器学习,双语,文本分析,语言模型,机器翻译 数据概述: 该数据集记录了英语和法语文本的意图分类信息,主要用于训练和评估跨语言的意图识别模型。主要特征如下:...
    packageimg
  • 客服对话训练数据集KefuConversationTrainDataset-eyeshield23

    2025年4月24日   

    客服对话训练数据集KefuConversationTrainDataset-eyeshield23 数据来源:互联网公开数据 标签:客服对话,数据集,自然语言处理,机器学习,文本分析,对话系统,人工智能,语言模型 数据概述: 该数据集包含来自客服系统的对话数据,记录了客服与用户的交互记录。主要特征如下:...
    packageimg
  • 文本数据分析数据集DatasetforTextualDataAnalysis-par7h0

    2025年4月24日   

    文本数据分析数据集DatasetforTextualDataAnalysis-par7h0 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,情感分析,文本挖掘,数据科学,信息处理 数据概述: 该数据集包含来自互联网公开渠道的文本数据,记录了各类文本内容及其相关属性。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • Seneweb网站新闻文章数据集-barabaradiop

    2025年4月24日   

    Seneweb网站新闻文章数据集-barabaradiop 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,情感分析,舆情分析,新闻媒体,信息检索 数据概述:该数据集包含来自Seneweb网站的新闻文章数据,记录了Seneweb网站发布的各类新闻文章信息。主要特征如下:...
    packageimg
  • 孟加拉语新闻文章数据集BanglaNewsArticleDataset-asifahmedshodip

    2025年4月24日   

    孟加拉语新闻文章数据集BanglaNewsArticleDataset-asifahmedshodip 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,机器学习,新闻分类,多语言,孟加拉语 数据概述: 该数据集包含来自孟加拉语新闻网站和媒体平台的新闻文章数据,记录了各类新闻事件和话题的报道内容。主要特征如下:...
    packageimg
  • 古兰经文本数据集QuranKareemTextDataset-mohamedeldesouky

    2025年4月24日   

    古兰经文本数据集QuranKareemTextDataset-mohamedeldesouky 数据来源:互联网公开数据 标签:伊斯兰教,古兰经,文本分析,自然语言处理,宗教研究,阿拉伯语,数据集,语义分析 数据概述: 该数据集包含了古兰经的阿拉伯语原文及其翻译,是研究伊斯兰教文本和进行自然语言处理的重要资源。主要特征如下: 时间跨度:...
    packageimg
  • 电影剧情摘要数据集-linggarmaretva

    2025年4月24日   

    电影剧情摘要数据集-linggarmaretva 数据来源:互联网公开数据 标签:电影,剧情,摘要,文本分析,自然语言处理,情感分析,机器学习,电影推荐 数据概述: 该数据集包含来自电影剧情摘要的数据,记录了电影的详细剧情概要信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年代的电影。 地理范围:数据涵盖了全球范围内的电影作品。...
    packageimg
  • 自然语言处理乐器评论数据集NLPMusicalInstrumentsReviewDataset-revatishingole

    2025年4月24日   

    自然语言处理乐器评论数据集NLPMusicalInstrumentsReviewDataset-revatishingole 数据来源:互联网公开数据 标签:自然语言处理,乐器评论,数据集,文本分析,情感分析,机器学习,消费者行为,市场研究 数据概述: 该数据集包含来自乐器类产品的用户评论数据,记录了消费者对各类乐器的评价和反馈。主要特征如下:...
    packageimg
  • 推特新训练集TweetNewTrainFolds-zzy990106

    2025年4月24日   

    推特新训练集TweetNewTrainFolds-zzy990106 数据来源:互联网公开数据 标签:推特数据,数据集,文本分析,机器学习,自然语言处理,社交媒体分析,情感分析,信息提取 数据概述:该数据集包含来自推特的新训练数据,记录了大量推文以供文本分析和机器学习任务。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 古兰经短节选元数据数据集AyatLessThan30SecsMetadataDataset-omartariq612

    2025年4月24日   

    古兰经短节选元数据数据集AyatLessThan30SecsMetadataDataset-omartariq612 数据来源:互联网公开数据 标签:古兰经,元数据,数据集,文本分析,伊斯兰研究,数据挖掘,宗教文献,自然语言处理 数据概述: 该数据集包含古兰经中时长不超过30秒的经文节选的元数据,记录了这些短节选的详细信息。主要特征如下:...
    packageimg
  • 科研论文数据分析集ArXiv论文数据集2023-hhgttg

    2025年4月24日   

    科研论文数据分析集ArXiv论文数据集2023-hhgttg 数据来源:互联网公开数据 标签:科研论文,数据集,机器学习,自然语言处理,学术研究,文本分析,知识图谱,信息检索 数据概述: 该数据集包含来自ArXiv的10000篇科研论文数据,记录了论文的主要信息,包括标题,作者,摘要,主题分类,引用次数等。主要特征如下:...
    packageimg
  • 土耳其国防新闻数据集TRTHaberSavunmaNewsDataset-denizhanahin

    2025年4月24日   

    土耳其国防新闻数据集TRTHaberSavunmaNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻数据,国防领域,数据集,文本分析,机器学习,自然语言处理,新闻监测,安全研究 数据概述: 该数据集包含来自土耳其TRT Haber电视台的国防相关新闻数据,记录了与国防,军事和安全相关的新闻报道。主要特征如下:...
    packageimg
  • LLM序列生成任务1千条验证集预测结果数据集LLMSEQGEN-1KValPredsDataset-illidan7

    2025年4月24日   

    LLM序列生成任务1千条验证集预测结果数据集LLMSEQGEN-1KValPredsDataset-illidan7 数据来源:互联网公开数据 标签:自然语言处理,序列生成,数据集,语言模型,机器学习,文本分析,人工智能,预测任务 数据概述:...
    packageimg
  • 英语语言理解能力评估数据集ELI5ScorerTrainDataAdditional-ratthachat

    2025年4月24日   

    英语语言理解能力评估数据集ELI5ScorerTrainDataAdditional-ratthachat 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言理解,机器学习,文本分析,教育技术,人工智能,模型训练 数据概述: 该数据集包含来自ELI5项目的附加训练数据,用于英语语言理解能力的评估和模型训练。主要特征如下:...
    packageimg
  • 巴西金融文本情感分析数据集FinancialPhraseBankPT-BRDataset-danielesimas

    2025年4月24日   

    巴西金融文本情感分析数据集FinancialPhraseBankPT-BRDataset-danielesimas 数据来源:互联网公开数据 标签:金融,文本分析,情感分析,巴西,自然语言处理,数据集,机器学习,情绪识别 数据概述: 该数据集包含巴西金融领域的新闻文本,用于情感分析任务。主要特征如下:...
    packageimg
  • MBTI人格测试数据集MBTIPersonalityTestDataset-rfairon

    2025年4月24日   

    MBTI人格测试数据集MBTIPersonalityTestDataset-rfairon 数据来源:互联网公开数据 标签:MBTI,人格测试,心理学,数据集,文本分析,NLP,机器学习,性格分析 数据概述: 该数据集包含了参与MBTI(Myers-Briggs Type Indicator,迈尔斯-...
    packageimg
  • Mercari二手商品交易平台手套商品数据集-samuelsujith

    2025年4月24日   

    Mercari二手商品交易平台手套商品数据集-samuelsujith 数据来源:互联网公开数据 标签:电商,二手商品,手套,商品信息,文本分析,机器学习,价格预测,数据挖掘 数据概述: 该数据集包含来自Mercari二手商品交易平台的手套商品数据,旨在用于商品价格预测,文本分析等研究。主要特征如下:...
    packageimg
  • 土耳其时事新闻数据集TurkishDatasetNewsAktuel-denizhanahin

    2025年4月24日   

    土耳其时事新闻数据集TurkishDatasetNewsAktuel-denizhanahin 数据来源:互联网公开数据 标签:新闻数据,土耳其,时事,数据集,自然语言处理,文本分析,机器学习,媒体研究 数据概述: 该数据集包含来自土耳其的时事新闻数据,记录了土耳其各媒体平台发布的新闻报道。主要特征如下:...
    packageimg
  • 社交媒体推文互动趋势数据集OMGitsAliya推文互动趋势数据集-thedevastator

    2025年4月24日   

    社交媒体推文互动趋势数据集OMGitsAliya推文互动趋势数据集-thedevastator 数据来源:互联网公开数据 标签:社交媒体,推文互动,数据集,情感分析,用户行为,机器学习,文本分析,社交网络 数据概述: 该数据集包含来自社交媒体用户OMGitsAliya的推文互动数据,记录了推文的各种互动指标。主要特征如下:...
    packageimg
  • 古登堡项目元数据集GutenbergMetadataDataset-alexxandrau

    2025年4月24日   

    古登堡项目元数据集GutenbergMetadataDataset-alexxandrau 数据来源:互联网公开数据 标签:古登堡项目,元数据,文学作品,数据集,文本分析,文化研究,文学历史,图书信息 数据概述:该数据集包含来自古登堡项目的元数据,记录了古登堡项目中电子书的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从19世纪到现代。...
    packageimg