找到5,740个数据集

标签: 文本分析

过滤结果
  • 电影类型分类数据集MovieGenreClassificationDataset-olegsmirnov2001

    2025年4月25日   

    电影类型分类数据集MovieGenreClassificationDataset-olegsmirnov2001 数据来源:互联网公开数据 标签:电影,数据集,类型分类,机器学习,数据分析,娱乐行业,自然语言处理,文本分析 数据概述: 该数据集专注于电影类型的分类任务,记录了电影相关的详细信息。主要特征如下:...
    packageimg
  • 关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788

    2025年4月25日   

    关键词URL匹配否定数据集KeywordURLMatchingNegationDataset-yingna667788 数据来源:互联网公开数据 标签:自然语言处理,URL匹配,数据集,关键词提取,文本分析,机器学习,信息检索,数据挖掘 数据概述:...
    packageimg
  • 集体意见垃圾邮件检测数据集-samygithub

    2025年4月25日   

    集体意见垃圾邮件检测数据集-samygithub 数据来源:互联网公开数据 标签:垃圾邮件检测,集体意见,文本分析,自然语言处理,机器学习,情感分析,社交媒体,数据挖掘 数据概述: 该数据集包含来自互联网的集体意见数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据来源。 地理范围:...
    packageimg
  • 路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch

    2025年4月24日   

    路透社CAC40指数三年新闻文章数据集ReutersCAC403-YearArticlesDataset-wissemch 数据来源:互联网公开数据 标签:新闻文章,CAC40指数,金融市场,文本分析,自然语言处理,时间序列,情感分析,市场研究 数据概述:...
    packageimg
  • 金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist

    2025年4月24日   

    金融新闻标题数据集FinancialHeadlineNewsDataset-tomthescientist 数据来源:互联网公开数据 标签:金融,新闻标题,数据集,文本分析,自然语言处理,机器学习,经济研究,新闻挖掘 数据概述: 该数据集包含来自多个金融新闻来源的标题数据,记录了金融领域的新闻标题及其相关信息。主要特征如下:...
    packageimg
  • 训练健康描述与数据数据集-sumeetbabar

    2025年4月24日   

    训练健康描述与数据数据集-sumeetbabar 数据来源:互联网公开数据 标签:健康,训练,描述,数据集,自然语言处理,文本分析,医学,健康管理 数据概述: 该数据集包含关于训练和健康描述的数据,记录了与训练相关的健康信息。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时间段的训练和健康数据。...
    packageimg
  • 脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1

    2025年4月24日   

    脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1 数据来源:互联网公开数据 标签:脱口秀,喜剧,文本分析,自然语言处理,数据集,语言学,娱乐,表演艺术 数据概述: 该数据集包含了大量的脱口秀表演脚本,记录了不同喜剧演员的表演内容。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同年代的脱口秀表演。...
    packageimg
  • 英西语翻译数据集English-SpanishTranslationDataset-nouranader

    2025年4月24日   

    英西语翻译数据集English-SpanishTranslationDataset-nouranader 数据来源:互联网公开数据 标签:翻译,语言学,数据集,机器学习,自然语言处理,文本分析,多语言支持,语言学习 数据概述:该数据集包含来自互联网的英西语翻译数据,记录了英语和西班牙语之间的文本对应关系。主要特征如下:...
    packageimg
  • 文本分类数据集WordClassificationDataset-jcatumba

    2025年4月24日   

    文本分类数据集WordClassificationDataset-jcatumba 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,文本分析,人工智能,语言学,数据科学 数据概述:该数据集包含来自多个来源的文本数据,记录了不同类别的文本信息,适用于文本分类任务。主要特征如下:...
    packageimg
  • 事件原始数据数据集EventsRawDataDataset-happy1996

    2025年4月24日   

    事件原始数据数据集EventsRawDataDataset-happy1996 数据来源:互联网公开数据 标签:事件,数据集,文本分析,自然语言处理,信息抽取,舆情分析,社会科学,新闻 数据概述: 该数据集包含来自不同来源的事件原始数据,记录了各种社会,政治,经济等领域的事件信息。主要特征如下:...
    packageimg
  • 自然语言推理处理数据集ProcessedSNLIDataset-neverseepython

    2025年4月24日   

    自然语言推理处理数据集ProcessedSNLIDataset-neverseepython 数据来源:互联网公开数据 标签:自然语言处理,数据集,推理任务,机器学习,文本分析,人工智能,语言学,学术资源 数据概述:该数据集包含来自斯坦福自然语言推理(SNLI)项目的处理后的数据,记录了成对句子及它们的逻辑关系,适用于自然语言推理研究。主要特征如下:...
    packageimg
  • 新冠疫情期间齐夫定律验证数据集Zipf-sLawTestDataset-COVID-19-salemrezzag

    2025年4月24日   

    新冠疫情期间齐夫定律验证数据集Zipf-sLawTestDataset-COVID-19-salemrezzag 数据来源:互联网公开数据 标签:新冠疫情,齐夫定律,文本分析,数据集,自然语言处理,流行病学,数据科学,词频分析 数据概述: 该数据集包含从新冠疫情期间收集的文本数据,用于验证齐夫定律在疫情语境下的适用性。主要特征如下:...
    packageimg
  • 贾斯汀-特鲁多推特数据集JustinTrudeauTweetsDataset-datascienceai

    2025年4月24日   

    贾斯汀-特鲁多推特数据集JustinTrudeauTweetsDataset-datascienceai 数据来源:互联网公开数据 标签:推特,政治,加拿大,政府,社交媒体,文本分析,政治研究,社会学 数据概述:该数据集包含来自加拿大总理贾斯汀·特鲁多的推特数据,记录了他在推特平台上发布的内容。主要特征如下:...
    packageimg
  • 说服力与影响力分析数据集Persuade-2-0Dataset-garried

    2025年4月24日   

    说服力与影响力分析数据集Persuade-2-0Dataset-garried 数据来源:互联网公开数据 标签:说服力,影响力,数据集,自然语言处理,文本分析,情感分析,机器学习,心理学 数据概述: 该数据集包含来自Persuade-2.0项目的数据,记录了不同情境下的说服性文本及其效果评估。主要特征如下:...
    packageimg
  • 医疗人工智能大模型数据集MedicaAILLMDatasetandModel-emirhanai

    2025年4月24日   

    医疗人工智能大模型数据集MedicaAILLMDatasetandModel-emirhanai 数据来源:互联网公开数据 标签:医疗人工智能,大模型,数据集,机器学习,自然语言处理,文本分析,健康医疗,医疗研究 数据概述:该数据集为MedicaAI项目的一部分,主要记录了医疗相关文本数据,适用于医疗人工智能大模型的训练和应用。主要特征如下:...
    packageimg
  • 地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan

    2025年4月24日   

    地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan 数据来源:互联网公开数据 标签:地理信息,地名识别,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息提取 数据概述: 该数据集包含来自网络文本和地理信息资源的地名数据,记录了不同文本中的地名及其位置信息。主要特征如下: 时间跨度:...
    packageimg
  • 尼泊尔语命名实体识别数据集NepaliNERDataset-rajanghimire

    2025年4月24日   

    尼泊尔语命名实体识别数据集NepaliNERDataset-rajanghimire 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,尼泊尔语,机器学习,文本分析,序列标注,语言技术 数据概述: 该数据集包含尼泊尔语的命名实体识别数据,记录了尼泊尔语文本中的人名,地名,组织名等实体信息。主要特征如下:...
    packageimg
  • 隐含仇恨言论排名数据集ImplicitHateSpeechwithRankingDataset-devayani14

    2025年4月24日   

    隐含仇恨言论排名数据集ImplicitHateSpeechwithRankingDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,情感分析,机器学习,自然语言处理,社会研究,内容审核 数据概述:该数据集包含来自多个在线平台的文本数据,记录了带有隐含仇恨言论的言论内容及其对应的排名。主要特征如下:...
    packageimg
  • RedditWSB论坛帖子数据集RedditWSBPostsDataset-dataranch

    2025年4月24日   

    RedditWSB论坛帖子数据集RedditWSBPostsDataset-dataranch 数据来源:互联网公开数据 标签:社交媒体,金融,股票,投资,文本分析,自然语言处理,舆情分析,机器学习 数据概述: 该数据集包含来自 Reddit 网站 WallStreetBets(WSB)子版块的帖子数据,记录了用户在 WSB...
    packageimg
  • 俄英虚假新闻翻译数据集RUS-ENFakeNewsTranslationDataset-nimbus32

    2025年4月24日   

    俄英虚假新闻翻译数据集RUS-ENFakeNewsTranslationDataset-nimbus32 数据来源:互联网公开数据 标签:虚假新闻,翻译,数据集,俄语,英语,自然语言处理,机器翻译,文本分析 数据概述: 该数据集包含了俄语(RUS)到英语(EN)的虚假新闻翻译数据,旨在促进虚假信息检测和跨语言分析的研究。主要特征如下:...
    packageimg