找到5,740个数据集

标签: 文本分析

过滤结果
  • 学术论文文本分析数据集EssayDataset-hienbm02

    2025年4月25日   

    学术论文文本分析数据集EssayDataset-hienbm02 数据来源:互联网公开数据 标签:文本分析,教育研究,数据集,自然语言处理,机器学习,学术写作,文献分析,语言模型 数据概述: 该数据集包含来自学术论文和学术写作的文本数据,记录了学术文献的文本内容和相关特征。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。...
    packageimg
  • 社交媒体上的孟加拉语女权主义评论数据集CommentsinBanglaofFeminismonSocialMediaDataset-mdarifulislamshuvh

    2025年4月25日   

    社交媒体上的孟加拉语女权主义评论数据集CommentsinBanglaofFeminismonSocialMediaDataset-mdarifulislamshuvh 数据来源:互联网公开数据 标签:女权主义,社交媒体,孟加拉语,文本分析,社会研究,情感分析,数据挖掘,文化研究 数据概述:...
    packageimg
  • CommonLit阅读理解竞赛排行榜数据集-fritzcremer

    2025年4月25日   

    CommonLit阅读理解竞赛排行榜数据集-fritzcremer 数据来源:互联网公开数据 标签:阅读理解,数据集,自然语言处理,机器学习,文本分析,教育,竞赛,排行榜 数据概述:该数据集包含CommonLit阅读理解竞赛的排行榜数据,记录了参赛者的成绩和排名。主要特征如下: 时间跨度:数据记录的时间范围为竞赛期间。...
    packageimg
  • 新闻媒体情感分析数据集KompasDataset-anandaprayoga

    2025年4月25日   

    新闻媒体情感分析数据集KompasDataset-anandaprayoga 数据来源:互联网公开数据 标签:新闻媒体,情感分析,数据集,文本分析,自然语言处理,机器学习,社会研究,新闻学 数据概述: 该数据集包含来自印尼新闻网站Kompas.com的文章,记录了大量新闻报道的内容及其对应的情感标签,适用于新闻情感分析和机器学习任务。主要特征如下:...
    packageimg
  • 客户支持对话文本数据集Bitext客户支持训练数据集-pragadeeshn01

    2025年4月25日   

    客户支持对话文本数据集Bitext客户支持训练数据集-pragadeeshn01 数据来源:互联网公开数据 标签:客户支持,对话,文本分析,自然语言处理,机器学习,数据集,语义理解,客户服务 数据概述: 该数据集包含来自 Bitext 公司的客户支持对话文本,旨在用于训练和评估客户支持相关的自然语言处理模型。主要特征如下: 时间跨度:...
    packageimg
  • Kickstarter项目风险评估数据集KickstarterProjectRiskAssessmentDataset-amirhoseinabbasi

    2025年4月25日   

    Kickstarter项目风险评估数据集KickstarterProjectRiskAssessmentDataset-amirhoseinabbasi 数据来源:互联网公开数据 标签:众筹,Kickstarter,项目风险,数据集,文本分析,机器学习,风险评估,项目管理 数据概述: 该数据集包含来自 Kickstarter 平台的 10,000...
    packageimg
  • 医学笔记评估与伪标签数据集NBMEPseudoLabelingDataset-lunapandachan

    2025年4月25日   

    医学笔记评估与伪标签数据集NBMEPseudoLabelingDataset-lunapandachan 数据来源:互联网公开数据 标签:医学评估,伪标签,数据集,自然语言处理,机器学习,医学教育,文本分析,人工智能 数据概述: 该数据集来源于医学笔记评估(NBME)项目,包含医学教育中的伪标签数据,用于辅助医学笔记的评估和分类。主要特征如下:...
    packageimg
  • AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii

    2025年4月25日   

    AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii 数据来源:互联网公开数据 标签:新闻文章,数据集,科技新闻,AMD,自然语言处理,文本分析,机器学习,信息提取 数据概述: 该数据集包含来自互联网公开渠道的与AMD公司相关的新闻文章数据,记录了关于AMD公司的新闻报道和相关信息。主要特征如下:...
    packageimg
  • 文本摘要数据集TextSummarizationDataset-dngnguynanh12

    2025年4月25日   

    文本摘要数据集TextSummarizationDataset-dngnguynanh12 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,深度学习,NLP,文本分析,信息检索 数据概述: 该数据集包含大量文本及其对应的摘要,旨在用于训练和评估文本摘要模型。主要特征如下:...
    packageimg
  • 问题集数据集Question-SetDataset-tanujsaxena

    2025年4月25日   

    问题集数据集Question-SetDataset-tanujsaxena 数据来源:互联网公开数据 标签:问题集,数据集,自然语言处理,文本分析,机器学习,教育研究,问答系统,人工智能 数据概述: 该数据集包含来自公开来源的问题集合,记录了各类问题的文本内容和相关信息。主要特征如下: 时间跨度:数据记录的时间范围从近年到当前。...
    packageimg
  • LLM提示词恢复数据集LLMDataforPromptRecoveryDataset-ehsaasdhand

    2025年4月25日   

    LLM提示词恢复数据集LLMDataforPromptRecoveryDataset-ehsaasdhand 数据来源:互联网公开数据 标签:大型语言模型,提示词,数据集,自然语言处理,信息检索,机器学习,文本分析,模型训练 数据概述: 该数据集包含了用于研究和开发大型语言模型(LLM)提示词恢复技术的数据。主要特征如下:...
    packageimg
  • 语言分类测试数据集TestLanguageClassificationDataset-jhaamanvaibhav

    2025年4月25日   

    语言分类测试数据集TestLanguageClassificationDataset-jhaamanvaibhav 数据来源:互联网公开数据 标签:语言分类,数据集,自然语言处理,机器学习,文本分析,文本挖掘,人工智能,计算机科学 数据概述:该数据集包含来自多种语言的文本数据,适用于语言分类和识别任务。主要特征如下:...
    packageimg
  • 电影标题-评分-摘要与情节数据集-arnavsharmaas

    2025年4月25日   

    电影标题-评分-摘要与情节数据集-arnavsharmaas 数据来源:互联网公开数据 标签:电影,评分,摘要,情节,文本分析,情感分析,电影评论,自然语言处理 数据概述: 该数据集包含电影的标题,评分,摘要和情节概要信息。主要特征如下: 时间跨度:数据记录的时间范围覆盖了不同年代的电影。...
    packageimg
  • 语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv

    2025年4月25日   

    语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,教育,学生,语言模型,平等化,文本分析...
    packageimg
  • 金融新闻文本数据集FinanceNewsTextDataset-shivangisafai

    2025年4月25日   

    金融新闻文本数据集FinanceNewsTextDataset-shivangisafai 数据来源:互联网公开数据 标签:金融新闻,文本分析,自然语言处理,情感分析,市场预测,新闻数据,财经,新闻 数据概述: 该数据集包含来自各类新闻媒体的金融新闻文本,记录了金融市场相关的资讯和报道。主要特征如下:...
    packageimg
  • 宣传品识别数据集PropagandaDetectionOurData-vladimirsydor

    2025年4月25日   

    宣传品识别数据集PropagandaDetectionOurData-vladimirsydor 数据来源:互联网公开数据 标签:宣传品识别,数据集,文本分析,机器学习,自然语言处理,社会研究,学术资源,信息分析 数据概述:该数据集包含了一组用于宣传品识别的数据,记录了不同类型文本中的宣传品内容,适用于宣传品检测和文本分析任务。主要特征如下:...
    packageimg
  • 拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais

    2025年4月25日   

    拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,拉脱维亚语,文本分析,机器学习,语言学,信息检索 数据概述: 该数据集包含了拉脱维亚语的问答对,旨在促进拉脱维亚语自然语言处理领域的研究和应用。主要特征如下: 时间跨度:...
    packageimg
  • 斯拉夫语言有毒评论数据集ToxicCommentswithSlavicDataset-mykras

    2025年4月25日   

    斯拉夫语言有毒评论数据集ToxicCommentswithSlavicDataset-mykras 数据来源:互联网公开数据 标签:文本分析,有害内容,数据集,自然语言处理,机器学习,情感分析,多语言,斯拉夫语言 数据概述:...
    packageimg
  • GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri

    2025年4月25日   

    GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源:互联网公开数据 标签:自然语言处理,数据集,印尼语,GPT-2,文本生成,语言模型,机器翻译,文本分析 数据概述: 该数据集包含了印尼语文本数据,旨在用于训练和评估GPT-2模型,从而提升印尼语文本生成,翻译等相关任务的性能。主要特征如下:...
    packageimg
  • BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13

    2025年4月25日   

    BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,BERT,机器学习,深度学习,文本分析,语言模型,人工智能 数据概述: 该数据集包含了BERT-...
    packageimg