找到5,734个数据集

标签: 文本分析

过滤结果
  • 西班牙拉索拉纳镇新闻报刊文章数据集2010-2024-mgabve

    2025年4月23日   

    西班牙拉索拉纳镇新闻报刊文章数据集2010-2024-mgabve 数据来源:互联网公开数据 标签:西班牙,拉索拉纳,新闻,报刊文章,城镇发展,NLP,文本分析,数字化 数据概述: 本数据集收录了1093篇西班牙语报刊文章,内容均关于西班牙卡斯蒂利亚-拉曼恰自治区Ciudad...
    packageimg
  • 帕尔辛卢英语到波斯语翻译训练数据集ParsinluEnglishtoFarsiTranslationTrainDataset-nouriehmadanian

    2025年4月23日   

    帕尔辛卢英语到波斯语翻译训练数据集ParsinluEnglishtoFarsiTranslationTrainDataset-nouriehmadanian 数据来源:互联网公开数据 标签:翻译数据集,英语到波斯语,自然语言处理,机器学习,数据科学,语言学,文本分析,人工智能 数据概述:...
    packageimg
  • 语言翻译数据集2010-2020数据集-amankumar2002

    2025年4月23日   

    语言翻译数据集2010-2020数据集-amankumar2002 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,文本分析,语言学,多语言数据,文本翻译 数据概述:该数据集包含来自多个公开来源的语言翻译数据,记录了多种语言之间的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 好读书籍词典数据集5000本好书BookDictionaryfromGoodreads5000Books-subhradiphalder

    2025年4月23日   

    好读书籍词典数据集5000本好书BookDictionaryfromGoodreads5000Books-subhradiphalder 数据来源:互联网公开数据 标签:书籍词典,数据集,好读书籍,文本分析,自然语言处理,文学研究,阅读推荐,教育资料...
    packageimg
  • 翻译测试数据集TranslatedTestDataset-sohammhatre112

    2025年4月23日   

    翻译测试数据集TranslatedTestDataset-sohammhatre112 数据来源:互联网公开数据 标签:翻译,测试,数据集,自然语言处理,机器学习,语言模型,文本分析,人工智能 数据概述:该数据集包含来自互联网公开来源的翻译测试数据,记录了多个语言之间的文本翻译结果。主要特征如下:...
    packageimg
  • Shopee电商平台商品数据预处理数据集-kunihikofurugori

    2025年4月23日   

    Shopee电商平台商品数据预处理数据集-kunihikofurugori 数据来源:互联网公开数据 标签:电商,商品数据,预处理,数据清洗,机器学习,文本分析,自然语言处理,Shopee 数据概述: 该数据集包含Shopee电商平台上的商品信息,经过预处理,主要用于数据清洗和准备,以便后续的分析和建模。主要特征如下:...
    packageimg
  • 机器学习子版块讨论数据集FLAIRSforMachineLearningSubredditDataset-ranjan6459

    2025年4月23日   

    机器学习子版块讨论数据集FLAIRSforMachineLearningSubredditDataset-ranjan6459 数据来源:互联网公开数据 标签:机器学习,数据集,社交媒体,文本分析,自然语言处理,社区讨论,数据挖掘,人工智能 数据概述:...
    packageimg
  • 世界主要宗教经典文献数据集-伊斯兰教与基督教-itsnobita

    2025年4月23日   

    世界主要宗教经典文献数据集-伊斯兰教与基督教-itsnobita 数据来源:互联网公开数据 标签:宗教经典,伊斯兰教,基督教,历史,文化,学术研究,文本分析,宗教文献 数据概述:...
    packageimg
  • Reddit帖子互动数据集RedditPostInteractionDataset-monjoynchoudhury

    2025年4月23日   

    Reddit帖子互动数据集RedditPostInteractionDataset-monjoynchoudhury 数据来源:互联网公开数据 标签:社交媒体,Reddit,帖子,互动,文本分析,自然语言处理,用户行为,数据挖掘 数据概述: 该数据集包含来自 Reddit 平台的帖子互动数据,记录了用户在 Reddit...
    packageimg
  • CommonLit阅读理解数据集CommonLitCrawledDataDataset-safavieh

    2025年4月23日   

    CommonLit阅读理解数据集CommonLitCrawledDataDataset-safavieh 数据来源:互联网公开数据 标签:阅读理解,数据集,自然语言处理,机器学习,教育研究,文本分析,人工智能,语言学习 数据概述:该数据集包含来自CommonLit项目的数据,记录了大量阅读理解相关的文章和对应的问题。主要特征如下:...
    packageimg
  • 生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko

    2025年4月23日   

    生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko 数据来源:互联网公开数据 标签:自然语言处理,实体识别,数据集,机器学习,文本分析,地理信息,人工智能,语义理解 数据概述: 该数据集包含通过生成式模型创建的文本数据,专注于山脉相关实体的识别任务。主要特征如下:...
    packageimg
  • 专利摘要分析数据集PatentsAbstractsDataset-chizzi25

    2025年4月23日   

    专利摘要分析数据集PatentsAbstractsDataset-chizzi25 数据来源:互联网公开数据 标签:专利,摘要,文本分析,自然语言处理,机器学习,专利检索,知识产权,技术创新 数据概述: 该数据集包含来自公开专利文献的摘要信息,记录了不同领域的专利技术描述。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集ProcessedFakeNewsDataset-negikirin

    2025年4月23日   

    虚假新闻检测数据集ProcessedFakeNewsDataset-negikirin 数据来源:互联网公开数据 标签:虚假新闻,假新闻检测,文本分析,自然语言处理,机器学习,新闻分类,信息真实性,数据挖掘 数据概述: 该数据集包含经过处理的虚假新闻数据,旨在用于虚假新闻的检测和分类。主要特征如下:...
    packageimg
  • 伊斯兰书籍文本数据集1000IslamicBooksDataset-huzaifatahir7524

    2025年4月23日   

    伊斯兰书籍文本数据集1000IslamicBooksDataset-huzaifatahir7524 数据来源:互联网公开数据 标签:伊斯兰教,书籍,文本分析,宗教研究,自然语言处理,数据集,文化,文献 数据概述: 该数据集包含来自互联网的1000本伊斯兰书籍的文本数据,涵盖了伊斯兰教的各个方面。主要特征如下:...
    packageimg
  • 金属乐队歌曲歌词数据集MetallicaSongswithLyricsDataset-dmytroievdokymov

    2025年4月23日   

    金属乐队歌曲歌词数据集MetallicaSongswithLyricsDataset-dmytroievdokymov 数据来源:互联网公开数据 标签:音乐,歌词,金属乐队,摇滚,数据集,文本分析,音乐研究,情感分析 数据概述: 该数据集包含金属乐队(Metallica)的歌曲歌词数据,记录了乐队自成立以来的歌曲的歌词内容。主要特征如下:...
    packageimg
  • 数据2024年Reddit帖子数据集-vooono

    2025年4月23日   

    2024年Reddit帖子数据集-vooono 数据来源:互联网公开数据 标签:社交媒体,Reddit,帖子,文本分析,情感分析,自然语言处理,数据挖掘,用户行为 数据概述: 该数据集包含来自Reddit平台的帖子数据,记录了用户在不同版块发布的文本内容及相关信息。主要特征如下: 时间跨度:数据记录的时间范围为2024年。...
    packageimg
  • 反垃圾邮件预处理数据集BalancedSpamPreprocessedDataset-zeyadkhalid

    2025年4月23日   

    反垃圾邮件预处理数据集BalancedSpamPreprocessedDataset-zeyadkhalid 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分析,自然语言处理,机器学习,分类算法,数据预处理,文本挖掘 数据概述: 该数据集包含经过预处理的反垃圾邮件数据,用于垃圾邮件检测和分类任务。主要特征如下: 时间跨度:...
    packageimg
  • 土耳其科技新闻数据集TurkishTechnologyNewsDataset-denizhanahin

    2025年4月23日   

    土耳其科技新闻数据集TurkishTechnologyNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:土耳其,科技新闻,自然语言处理,文本分析,新闻摘要,情感分析,机器学习,土耳其语 数据概述: 该数据集包含来自土耳其新闻网站的科技新闻文章,记录了土耳其科技领域的新闻报道。主要特征如下:...
    packageimg
  • 维基百科平衡性别共指数据集-thedevastator

    2025年4月23日   

    维基百科平衡性别共指数据集-thedevastator 数据来源:互联网公开数据 标签:共指,性别平衡,数据集,维基百科,文本分析,自然语言处理,NLP,教育,研究 数据概述:...
    packageimg
  • 自然语言处理项目原始数据集-emilygreen8

    2025年4月23日   

    自然语言处理项目原始数据集-emilygreen8 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本数据,语料库,数据预处理,机器学习,文本分析 数据概述: 该数据集包含用于自然语言处理(NLP)项目的原始文本数据,涵盖多种文本来源和语言。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的发布时间。...
    packageimg