找到5,735个数据集

标签: 文本分析

过滤结果
  • 文本分析工具数据集TextAnalysisToolDataset-jaynadkarni

    2025年4月23日   

    文本分析工具数据集TextAnalysisToolDataset-jaynadkarni 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,机器学习,情感分析,文本挖掘,语言模型,数据科学 数据概述: 该数据集包含来自多个公开来源的文本数据,记录了各类文本内容的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。...
    packageimg
  • 推特灾难事件数据集DisasterTwitterData-riturajsingh99

    2025年4月23日   

    推特灾难事件数据集DisasterTwitterData-riturajsingh99 数据来源:互联网公开数据 标签:推特,灾难事件,自然语言处理,文本分析,机器学习,社交媒体,舆情分析,危机管理 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了与灾难事件相关的内容。主要特征如下:...
    packageimg
  • 印度地址相似度分析数据集-karan510

    2025年4月23日   

    印度地址相似度分析数据集-karan510 数据来源:互联网公开数据 标签:地址数据,印度,数据清洗,地理信息,机器学习,文本分析,相似度计算,自然语言处理 数据概述:该数据集包含了来自印度地区的地址数据,主要用于地址相似度分析和数据清洗。主要特征如下: 时间跨度:数据记录时间跨度不限,主要为历史地址数据。...
    packageimg
  • CommonLit阅读理解文本特征数据集-douglaskgaraujo

    2025年4月23日   

    CommonLit阅读理解文本特征数据集-douglaskgaraujo 数据来源:互联网公开数据 标签:文本特征,阅读理解,可读性,自然语言处理,教育,CommonLit,文本分析,机器学习 数据概述: 本数据集是对CommonLit阅读理解挑战赛提供的文本数据进行特征计算的结果。...
    packageimg
  • 推特灾害检测数据集TwitterDisasterDetectionDataset-sankaraassane

    2025年4月23日   

    推特灾害检测数据集TwitterDisasterDetectionDataset-sankaraassane 数据来源:互联网公开数据 标签:社交媒体,灾害检测,数据集,文本分析,机器学习,自然语言处理,信息挖掘,应急响应 数据概述: 该数据集包含来自推特平台的数据,记录了用户发布的与灾害相关的推文内容。主要特征如下:...
    packageimg
  • Quora问答对语义相似度预测数据集

    2025年4月23日   

    Quora问答对语义相似度预测数据集 数据来源:互联网公开数据 标签:自然语言处理,语义相似度,问答对,文本匹配,机器学习,Quora,Kaggle,文本分析 数据概述: 本数据集源自Kaggle竞赛Quora问答对,用于预测给定的问答对中,哪一对问题具有相同的含义。 数据集包含了大量Quora平台上的问题对,每个问题对都标注了它们是否语义相似。...
    packageimg
  • 德国到英语翻译数据集GermantoEnglishTranslationDataset-jamesbond00700

    2025年4月23日   

    德国到英语翻译数据集GermantoEnglishTranslationDataset-jamesbond00700 数据来源:互联网公开数据 标签:翻译,语言处理,数据集,机器学习,自然语言处理,双语,文本分析,人工智能 数据概述: 该数据集包含来自互联网的德语到英语的平行文本数据,记录了德语原文及其对应的英语翻译。主要特征如下:...
    packageimg
  • 短信文本清洗数据集SMSCleanedDataset-ashishgoraniya

    2025年4月23日   

    短信文本清洗数据集SMSCleanedDataset-ashishgoraniya 数据来源:互联网公开数据 标签:短信,文本清洗,数据集,自然语言处理,机器学习,文本分析,通信数据,数据预处理 数据概述: 该数据集包含来自短信通信的文本数据,记录了经过清洗和标准化的短信内容。主要特征如下: 时间跨度:数据记录的时间范围未明确指定,推测涵盖不同时间段。...
    packageimg
  • 酒店评论翻译数据集TranslatedHotelsReviewDataset-franoisgeorgesjulien

    2025年4月23日   

    酒店评论翻译数据集TranslatedHotelsReviewDataset-franoisgeorgesjulien 数据来源:互联网公开数据 标签:酒店评论,数据集,自然语言处理,机器翻译,文本分析,旅游行业,用户体验,情感分析 数据概述: 该数据集包含来自全球多家酒店的评论数据,记录了用户对酒店的评价和反馈,并提供了多语言翻译版本。主要特征如下:...
    packageimg
  • 阿比谢克访谈数据集AbhishekInterviewDataset-joylunkad

    2025年4月23日   

    阿比谢克访谈数据集AbhishekInterviewDataset-joylunkad 数据来源:互联网公开数据 标签:访谈,数据集,面试,机器学习,自然语言处理,文本分析,数据挖掘,人物访谈 数据概述: 该数据集包含了阿比谢克(Abhishek)的访谈数据,记录了他在不同场合,不同主题下的访谈内容。主要特征如下:...
    packageimg
  • 尼泊尔豪华酒店评论数据集NepalLuxuryHotelReviewsDataset-suprapandey

    2025年4月23日   

    尼泊尔豪华酒店评论数据集NepalLuxuryHotelReviewsDataset-suprapandey 数据来源:互联网公开数据 标签:酒店评论,尼泊尔,旅游,情感分析,自然语言处理,数据集,文本分析,豪华酒店 数据概述: 该数据集包含来自互联网的尼泊尔豪华酒店评论数据,记录了游客对尼泊尔豪华酒店的评价和反馈。主要特征如下:...
    packageimg
  • 印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2

    2025年4月23日   

    印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2 数据来源:互联网公开数据 标签:语言混合,数据集,自然语言处理,多语言,机器学习,文本分析,语言研究,翻译技术 数据概述: 该数据集包含来自印地语与英语混合语言环境的数据,记录了两种语言在文本中的混合使用情况。主要特征如下:...
    packageimg
  • 宠物领养情感实体数据集Petfinder情感实体数据集-tototohpl

    2025年4月23日   

    宠物领养情感实体数据集Petfinder情感实体数据集-tototohpl 数据来源:互联网公开数据 标签:情感分析,实体识别,宠物领养,数据集,自然语言处理,机器学习,文本分析,社会科学研究 数据概述:该数据集包含来自Petfinder的数据,记录了用户在领养宠物时发表的评论,适用于情感分析和实体识别等任务。主要特征如下:...
    packageimg
  • 罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu

    2025年4月23日   

    罗马尼亚新闻文章数据集2025年1月31日RomanianArticlesDataset-31-01-2025-raduinedelcu 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,媒体研究,信息提取,机器学习,新闻媒体 数据概述: 该数据集包含罗马尼亚新闻网站的文章数据,记录了特定日期的新闻内容和相关信息。主要特征如下:...
    packageimg
  • 乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan

    2025年4月23日   

    乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,乌尔都语,罗马转写,情感分析,机器学习,语言学,数据集 数据概述: 该数据集来自加州大学欧文分校(UCI),包含了乌尔都语的罗马转写文本数据,主要用于自然语言处理和文本分析研究。主要特征如下:...
    packageimg
  • 阿拉伯语车票文本数据集ArabicTweetsforTicketsTextsDataset-lamakhalilalhazmi

    2025年4月23日   

    阿拉伯语车票文本数据集ArabicTweetsforTicketsTextsDataset-lamakhalilalhazmi 数据来源:互联网公开数据 标签:阿拉伯语,文本分析,数据集,社交媒体,机器学习,情感分析,自然语言处理,情感识别 数据概述:...
    packageimg
  • 大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen

    2025年4月23日   

    大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,上下文理解,文本分析,机器学习,人工智能,语义分析 数据概述:...
    packageimg
  • 印度BERT微调数据集IndianDatasetforFinetuningofBERT-yashtiwari1906

    2025年4月23日   

    印度BERT微调数据集IndianDatasetforFinetuningofBERT-yashtiwari1906 数据来源:互联网公开数据 标签:印度,BERT,微调,自然语言处理,机器学习,数据集,文本分析,人工智能 数据概述:该数据集包含来自印度的各种文本数据,适用于BERT模型的微调和自然语言处理任务。主要特征如下:...
    packageimg
  • 英语翻译数据集EnglishTranslatedDataset-tasnim34

    2025年4月23日   

    英语翻译数据集EnglishTranslatedDataset-tasnim34 数据来源:互联网公开数据 标签:英语翻译,数据集,自然语言处理,机器学习,文本分析,语言学,学术研究,语言技术 数据概述:该数据集包含来自多个来源的英语翻译文本数据,记录了原文本及其翻译版本。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。...
    packageimg
  • 越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh

    2025年4月23日   

    越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh 数据来源:互联网公开数据 标签:新闻文章,越南,自然语言处理,文本分析,数据集,情感分析,主题分类,信息检索 数据概述: 该数据集包含了来自越南新闻网站VnExpress的文章数据,记录了该网站上发布的新闻文章的详细信息。主要特征如下:...
    packageimg