找到5,747个数据集

标签: 文本分析

过滤结果
  • 垃圾邮件分类数据集SpamMailClassificationDataset-ramyayeddla

    2025年4月26日   

    垃圾邮件分类数据集SpamMailClassificationDataset-ramyayeddla 数据来源:互联网公开数据 标签:垃圾邮件,数据集,分类算法,文本分析,机器学习,自然语言处理,信息安全,数据分析 数据概述: 该数据集包含来自互联网公开来源的电子邮件数据,记录了垃圾邮件和正常邮件的分类信息。主要特征如下:...
    packageimg
  • Twitter客户服务对话数据集TwitterCustomerServiceConversationDataset-aminaslam

    2025年4月26日   

    Twitter客户服务对话数据集TwitterCustomerServiceConversationDataset-aminaslam 数据来源:互联网公开数据 标签:社交媒体,客户服务,数据集,文本分析,情感分析,自然语言处理,机器学习,数据挖掘 数据概述:...
    packageimg
  • 预处理的Word2Vec词向量数据集PreprocessedWord2VecEmbeddingsDataset-louvalita

    2025年4月26日   

    预处理的Word2Vec词向量数据集PreprocessedWord2VecEmbeddingsDataset-louvalita 数据来源:互联网公开数据 标签:自然语言处理,词向量,Word2Vec,数据集,文本分析,机器学习,深度学习,语义分析 数据概述:...
    packageimg
  • 恶意语言检测数据集-hiungtrung

    2025年4月26日   

    恶意语言检测数据集-hiungtrung 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器学习,恶意内容,语言检测,数据集,NLP 数据概述: 该数据集包含用于恶意语言检测的文本数据,旨在帮助开发和评估识别网络恶意内容(如辱骂,仇恨言论,威胁等)的模型。主要特征如下: 时间跨度:...
    packageimg
  • 多语种情感对话数据集MELD文本数据集-va6573

    2025年4月26日   

    多语种情感对话数据集MELD文本数据集-va6573 数据来源:互联网公开数据 标签:多语种,情感识别,对话分析,数据集,自然语言处理,机器学习,情感计算,文本分析 数据概述: 该数据集包含来自多语种情感对话(MELD)的文本数据,记录了不同语言的对话及其对应的情感标签。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2018年。...
    packageimg
  • 自然语言处理与词向量训练数据集NLPNBCWord2VecDataset-duydung271

    2025年4月26日   

    自然语言处理与词向量训练数据集NLPNBCWord2VecDataset-duydung271 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,文本分析,机器学习,深度学习,语义分析,信息检索 数据概述: 该数据集包含来自自然语言处理领域的NBC新闻文本数据,用于词向量训练和文本分析任务。主要特征如下:...
    packageimg
  • 点击诱饵标题测试数据集LLMClickbaitTestDataset-datasontran

    2025年4月26日   

    点击诱饵标题测试数据集LLMClickbaitTestDataset-datasontran 数据来源:互联网公开数据 标签:点击诱饵,标题生成,数据集,自然语言处理,文本分析,机器学习,语言模型,评估 数据概述:该数据集包含用于测试和评估大型语言模型(LLM)生成点击诱饵标题能力的文本数据。主要特征如下:...
    packageimg
  • 社交媒体反恐言论分析数据集DesisterTweetDataset-resalat

    2025年4月26日   

    社交媒体反恐言论分析数据集DesisterTweetDataset-resalat 数据来源:互联网公开数据 标签:社交媒体,反恐,数据集,文本分析,情感分析,机器学习,网络安全,舆论研究 数据概述: 该数据集包含来自社交媒体平台的数据,记录了用户发布的与反恐相关的言论和讨论。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2020年。...
    packageimg
  • 农业信息推文数据集AGITweetsDataset-shreyasnavsalkar

    2025年4月26日   

    农业信息推文数据集AGITweetsDataset-shreyasnavsalkar 数据来源:互联网公开数据 标签:农业信息,社交媒体,推文,数据集,文本分析,自然语言处理,社会研究,市场分析 数据概述:该数据集包含来自社交媒体平台的农业相关信息推文数据,记录了与农业相关的讨论和信息分享。主要特征如下:...
    packageimg
  • 印度尼西亚犯罪推文模拟数据集IndonesianCrimeTweetsSimulatedDataset-aginanjar

    2025年4月26日   

    印度尼西亚犯罪推文模拟数据集IndonesianCrimeTweetsSimulatedDataset-aginanjar 数据来源:互联网公开数据 标签:犯罪,推文,社交媒体,数据集,文本分析,自然语言处理,情感分析,印度尼西亚 数据概述: 该数据集包含模拟的印度尼西亚犯罪相关推文,旨在用于犯罪分析,舆情监控和社交媒体研究。主要特征如下:...
    packageimg
  • 美国东海岸数据科学职位信息数据集Indeed-com-gk5894

    2025年4月26日   

    美国东海岸数据科学职位信息数据集Indeed-com-gk5894 数据来源:互联网公开数据 标签:数据科学,职位信息,美国东海岸,招聘,自然语言处理,文本分析,机器学习,就业市场 数据概述: 该数据集包含来自Indeed.com的美国东海岸地区数据科学职位信息,记录了不同公司发布的职位详情。主要特征如下:...
    packageimg
  • 过滤推文数据集

    2025年4月26日   

    过滤推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,文本分析,自然语言处理,情绪分析,用户行为,MBTI人格类型,文本分类 数据概述:...
    packageimg
  • 招聘信息分析数据集JobPostingAnalysisDataset-dipanjanadas

    2025年4月26日   

    招聘信息分析数据集JobPostingAnalysisDataset-dipanjanadas 数据来源:互联网公开数据 标签:招聘信息,文本分析,自然语言处理,机器学习,就业市场,行业分析,数据挖掘,人才招聘 数据概述: 该数据集包含从互联网上抓取的招聘信息数据,记录了各类职位发布的详细信息。主要特征如下: 时间跨度:...
    packageimg
  • 纳斯达克上市公司股票描述数据集NASDAQListedCompanyStockDescriptionsDataset-sauers

    2025年4月26日   

    纳斯达克上市公司股票描述数据集NASDAQListedCompanyStockDescriptionsDataset-sauers 数据来源:互联网公开数据 标签:股票市场,公司描述,纳斯达克,文本分析,自然语言处理,金融数据,数据集,上市公司 数据概述:...
    packageimg
  • 新闻文本分类数据集DraupNewsClassificationDataset-shadabhussain

    2025年4月26日   

    新闻文本分类数据集DraupNewsClassificationDataset-shadabhussain 数据来源:互联网公开数据 标签:新闻分类,文本分析,数据集,自然语言处理,机器学习,信息检索,数据挖掘,人工智能 数据概述: 该数据集包含来自Draup平台的新闻文本数据,主要记录了各类新闻文章的文本内容及其分类标签。主要特征如下:...
    packageimg
  • 新闻文本处理与自然语言理解数据集NewsProcessedNLPCoreDataset-mario123475

    2025年4月26日   

    新闻文本处理与自然语言理解数据集NewsProcessedNLPCoreDataset-mario123475 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,新闻分析,机器学习,语义理解,情感分析,数据挖掘 数据概述: 该数据集包含经过预处理的新闻文本数据,记录了来自多个新闻来源的新闻文章内容。主要特征如下:...
    packageimg
  • 技能提取数据范围综述数据集ScopingReviewofSkillExtractionData-andruonciul

    2025年4月26日   

    技能提取数据范围综述数据集ScopingReviewofSkillExtractionData-andruonciul 数据来源:互联网公开数据 标签:技能提取,数据集,自然语言处理,机器学习,教育技术,人力资源,文本分析,信息检索 数据概述: 该数据集包含来自多个来源的技能提取数据,记录了不同领域中技能信息的识别与提取。主要特征如下:...
    packageimg
  • 中国古典诗歌文本数据集Tibamemlnlp-poemDataset-smallstone2022

    2025年4月26日   

    中国古典诗歌文本数据集Tibamemlnlp-poemDataset-smallstone2022 数据来源:互联网公开数据 标签:古典文学,诗歌,数据集,文本分析,自然语言处理,机器学习,文化研究,语言模型 数据概述: 该数据集包含来自中国古典诗歌的文本数据,记录了历代著名诗人的诗歌作品及其相关信息。主要特征如下:...
    packageimg
  • 文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn

    2025年4月26日   

    文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,信息检索,文本分析,知识图谱,学术研究 数据概述: 该数据集包含来自多个来源的文章主题分类数据,记录了各类文章的主题标签和内容。主要特征如下:...
    packageimg
  • 简历筛选数据集ResumeScreeningDataset-serkanp

    2025年4月26日   

    简历筛选数据集ResumeScreeningDataset-serkanp 数据来源:互联网公开数据 标签:人力资源,简历筛选,数据分析,机器学习,招聘,文本分析,自然语言处理,职业发展 数据概述: 该数据集包含来自招聘平台的简历数据,记录了求职者的简历信息及其对应的职位匹配结果。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg