找到5,827个数据集

标签: 文本分析

过滤结果
  • 金融新闻情感分析数据集FinancialNewsSentimentAnalysisDataset-tderonde

    2025年5月30日   

    金融新闻情感分析数据集FinancialNewsSentimentAnalysisDataset-tderonde 数据来源:互联网公开数据 标签:金融新闻,情感分析,自然语言处理,数据集,文本分析,机器学习,金融科技,情感分类 数据概述: 该数据集包含了经过 FinBERT 模型处理的金融新闻数据,用于情感分析研究。主要特征如下: 时间跨度:...
    packageimg
  • 消息内容分析数据集MessagesV1Dataset-pcvchowdary

    2025年5月30日   

    消息内容分析数据集MessagesV1Dataset-pcvchowdary 数据来源:互联网公开数据 标签:消息,文本分析,自然语言处理,情感分析,数据集,社交媒体,机器学习,数据挖掘 数据概述: 该数据集包含来自各种社交媒体平台的消息内容,记录了用户之间的文本交流信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年初到2023年末。...
    packageimg
  • 亚马逊评论词汇处理数据集AmazonReviewsLexicalProcessingDataset-abidinawres

    2025年5月30日   

    亚马逊评论词汇处理数据集AmazonReviewsLexicalProcessingDataset-abidinawres 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,词汇处理,情感分析,机器学习,电子商务,消费者研究 数据概述: 该数据集包含来自亚马逊平台的用户评论数据,记录了商品评论的文本内容及其相关信息。主要特征如下:...
    packageimg
  • 电影及其剧本数据集MoviesandMovieScriptsDataset-torloweidadata

    2025年5月30日   

    电影及其剧本数据集MoviesandMovieScriptsDataset-torloweidadata 数据来源:互联网公开数据 标签:电影,剧本,数据集,文本分析,自然语言处理,文学研究,文化研究,娱乐产业 数据概述: 该数据集包含来自多个来源的电影及其剧本数据,记录了电影的基本信息和对应的剧本内容。主要特征如下:...
    packageimg
  • 仇恨言论和攻击性语言数据集2019年版HateSpeechandOffensiveLanguageDataset2019-siddiqui7

    2025年5月30日   

    仇恨言论和攻击性语言数据集2019年版HateSpeechandOffensiveLanguageDataset2019-siddiqui7 数据来源:互联网公开数据 标签:仇恨言论,攻击性语言,数据集,文本分析,自然语言处理,社交媒体分析,社会学,道德研究...
    packageimg
  • 多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules

    2025年5月30日   

    多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 文本分析, 语言学, 文本比对, 英语, 西班牙语 数据概述:...
    packageimg
  • 自然语言处理分类模型微调数据集LLM分类模型微调数据集-lonnieqin

    2025年5月30日   

    自然语言处理分类模型微调数据集LLM分类模型微调数据集-lonnieqin 数据来源:互联网公开数据 标签:自然语言处理,分类模型,深度学习,CNN模型,微调,文本分析,机器学习,数据集 数据概述: 该数据集主要用于自然语言处理分类模型的微调,特别是卷积神经网络(CNN)模型的应用。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • Naver博客文章搜索结果数据集NaverBlogSearchResultsDataset-wysohn2

    2025年5月30日   

    Naver博客文章搜索结果数据集NaverBlogSearchResultsDataset-wysohn2 数据来源:互联网公开数据 标签:博客,搜索,数据集,自然语言处理,文本分析,韩国,社交媒体,信息检索 数据概述: 该数据集包含来自Naver博客的搜索结果数据,记录了用户在Naver博客平台上进行的搜索查询及其相关的文章信息。主要特征如下:...
    packageimg
  • 写作行为与质量竞赛数据集-parkchoeun

    2025年5月30日   

    写作行为与质量竞赛数据集-parkchoeun 数据来源:互联网公开数据 标签:写作行为,写作质量,数据集,文本分析,自然语言处理,机器学习,竞赛,教育 数据概述: 该数据集包含来自写作行为与质量竞赛的数据,记录了参赛者的写作行为和作品质量。主要特征如下: 时间跨度:数据记录的时间范围为竞赛期间。 地理范围:数据覆盖了参与竞赛的全球用户。...
    packageimg
  • 印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslation-dhruvsinghsachan

    2025年5月30日   

    印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslation-dhruvsinghsachan 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语料库, 印地语, 英语, 自然语言处理, 语言学, 文本分析 数据概述: 该数据集包含来自互联网的印地语-...
    packageimg
  • 人物维基百科传记文本数据集PeopleWikipediaBiographyTextDataset-jainprashant07

    2025年5月30日   

    人物维基百科传记文本数据集PeopleWikipediaBiographyTextDataset-jainprashant07 数据来源:互联网公开数据 标签:人物传记, 文本数据, 维基百科, 自然语言处理, 文本分析, 传记信息, 知识图谱, 信息检索 数据概述:...
    packageimg
  • 推特情感分析数据集SentimentAnalysisTweetsDataset-mlcovidresearch

    2025年5月30日   

    推特情感分析数据集SentimentAnalysisTweetsDataset-mlcovidresearch 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,自然语言处理,机器学习,文本分析,舆情分析,NLP 数据概述: 该数据集包含来自推特(Twitter)的推文数据,主要用于情感分析研究。主要特征如下:...
    packageimg
  • 问题回答质量评估预测数据集QuestionAnsweringQualityAssessmentPrediction-manidaaw

    2025年5月30日   

    问题回答质量评估预测数据集QuestionAnsweringQualityAssessmentPrediction-manidaaw 数据来源:互联网公开数据 标签:问题回答, 质量评估, 预测模型, 文本分析, 机器学习, 自然语言处理, 问答系统, 深度学习 数据概述:...
    packageimg
  • 淋巴细胞白血病文章数据集-javeria

    2025年5月30日   

    淋巴细胞白血病文章数据集-javeria 数据来源:互联网公开数据 标签:白血病,淋巴细胞,医学,数据集,文本分析,自然语言处理,疾病研究,学术文献 数据概述:该数据集包含来自PubMed的关于淋巴细胞白血病(Lymphoblastic Leukemia)的医学文章数据,记录了相关疾病的研究、治疗和临床试验信息。主要特征如下:...
    packageimg
  • 垃圾文本识别数据集RubbishTextDataset-sokoface

    2025年5月30日   

    垃圾文本识别数据集RubbishTextDataset-sokoface 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,垃圾信息过滤,机器学习,文本分类,信息检索,数据挖掘 数据概述: 该数据集包含来自互联网的垃圾文本数据,记录了各种形式的垃圾信息,如广告、诈骗、低俗内容等。主要特征如下:...
    packageimg
  • 向量化文本处理数据集VectorisedTextDataset-rhianarmstrong

    2025年5月30日   

    向量化文本处理数据集VectorisedTextDataset-rhianarmstrong 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本分析,向量化,深度学习,信息检索 数据概述: 该数据集包含来自互联网的文本数据,经过向量化处理,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • Alura词向量数据集AluraWord2VecDataset-romariogomesbr

    2025年5月30日   

    Alura词向量数据集AluraWord2VecDataset-romariogomesbr 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,机器学习,文本分析,深度学习,NLP,语义分析 数据概述: 该数据集包含来自Alura项目的词向量数据,记录了大规模文本语料库中词汇的向量表示。主要特征如下:...
    packageimg
  • 联合国大会演讲处理数据集UNGASpeechesProcessesDataset-smooge

    2025年5月30日   

    联合国大会演讲处理数据集UNGASpeechesProcessesDataset-smooge 数据来源:互联网公开数据 标签:联合国,演讲,数据集,文本分析,自然语言处理,政治研究,国际关系,多语言文本 数据概述: 该数据集包含来自联合国大会的演讲记录,经过处理后适用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:...
    packageimg
  • GitHub问题追踪数据集GitHubIssuesDataset-ansnadeem

    2025年5月30日   

    GitHub问题追踪数据集GitHubIssuesDataset-ansnadeem 数据来源:互联网公开数据 标签:软件开发,问题追踪,数据集,自然语言处理,文本分析,开源项目,机器学习,代码管理 数据概述:该数据集包含来自GitHub的开源项目的问题追踪数据,记录了开发者在项目开发过程中遇到的问题、讨论和解决方案。主要特征如下:...
    packageimg
  • 作弊检测数据集CheatingDetectionDataset-rahimatanveer1

    2025年5月30日   

    作弊检测数据集CheatingDetectionDataset-rahimatanveer1 数据来源:互联网公开数据 标签:作弊检测,数据集,教育,学术诚信,机器学习,数据分析,文本分析,行为分析 数据概述: 该数据集包含了用于作弊检测的数据,旨在帮助识别和预防学术不端行为。主要特征如下: 时间跨度:数据记录的时间范围涵盖了多个学期和考试周期。...
    packageimg