-
垃圾邮件分类数据集SpamMailClassificationDataset-ramyayeddla
垃圾邮件分类数据集SpamMailClassificationDataset-ramyayeddla 数据来源:互联网公开数据 标签:垃圾邮件,数据集,分类算法,文本分析,机器学习,自然语言处理,信息安全,数据分析 数据概述: 该数据集包含来自互联网公开来源的电子邮件数据,记录了垃圾邮件和正常邮件的分类信息。主要特征如下:... -
Twitter客户服务对话数据集TwitterCustomerServiceConversationDataset-aminaslam
Twitter客户服务对话数据集TwitterCustomerServiceConversationDataset-aminaslam 数据来源:互联网公开数据 标签:社交媒体,客户服务,数据集,文本分析,情感分析,自然语言处理,机器学习,数据挖掘 数据概述:... -
预处理的Word2Vec词向量数据集PreprocessedWord2VecEmbeddingsDataset-louvalita
预处理的Word2Vec词向量数据集PreprocessedWord2VecEmbeddingsDataset-louvalita 数据来源:互联网公开数据 标签:自然语言处理,词向量,Word2Vec,数据集,文本分析,机器学习,深度学习,语义分析 数据概述:... -
恶意语言检测数据集-hiungtrung
恶意语言检测数据集-hiungtrung 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器学习,恶意内容,语言检测,数据集,NLP 数据概述: 该数据集包含用于恶意语言检测的文本数据,旨在帮助开发和评估识别网络恶意内容(如辱骂,仇恨言论,威胁等)的模型。主要特征如下: 时间跨度:... -
多语种情感对话数据集MELD文本数据集-va6573
多语种情感对话数据集MELD文本数据集-va6573 数据来源:互联网公开数据 标签:多语种,情感识别,对话分析,数据集,自然语言处理,机器学习,情感计算,文本分析 数据概述: 该数据集包含来自多语种情感对话(MELD)的文本数据,记录了不同语言的对话及其对应的情感标签。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2018年。... -
自然语言处理与词向量训练数据集NLPNBCWord2VecDataset-duydung271
自然语言处理与词向量训练数据集NLPNBCWord2VecDataset-duydung271 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,文本分析,机器学习,深度学习,语义分析,信息检索 数据概述: 该数据集包含来自自然语言处理领域的NBC新闻文本数据,用于词向量训练和文本分析任务。主要特征如下:... -
点击诱饵标题测试数据集LLMClickbaitTestDataset-datasontran
点击诱饵标题测试数据集LLMClickbaitTestDataset-datasontran 数据来源:互联网公开数据 标签:点击诱饵,标题生成,数据集,自然语言处理,文本分析,机器学习,语言模型,评估 数据概述:该数据集包含用于测试和评估大型语言模型(LLM)生成点击诱饵标题能力的文本数据。主要特征如下:... -
社交媒体反恐言论分析数据集DesisterTweetDataset-resalat
社交媒体反恐言论分析数据集DesisterTweetDataset-resalat 数据来源:互联网公开数据 标签:社交媒体,反恐,数据集,文本分析,情感分析,机器学习,网络安全,舆论研究 数据概述: 该数据集包含来自社交媒体平台的数据,记录了用户发布的与反恐相关的言论和讨论。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2020年。... -
农业信息推文数据集AGITweetsDataset-shreyasnavsalkar
农业信息推文数据集AGITweetsDataset-shreyasnavsalkar 数据来源:互联网公开数据 标签:农业信息,社交媒体,推文,数据集,文本分析,自然语言处理,社会研究,市场分析 数据概述:该数据集包含来自社交媒体平台的农业相关信息推文数据,记录了与农业相关的讨论和信息分享。主要特征如下:... -
印度尼西亚犯罪推文模拟数据集IndonesianCrimeTweetsSimulatedDataset-aginanjar
印度尼西亚犯罪推文模拟数据集IndonesianCrimeTweetsSimulatedDataset-aginanjar 数据来源:互联网公开数据 标签:犯罪,推文,社交媒体,数据集,文本分析,自然语言处理,情感分析,印度尼西亚 数据概述: 该数据集包含模拟的印度尼西亚犯罪相关推文,旨在用于犯罪分析,舆情监控和社交媒体研究。主要特征如下:... -
美国东海岸数据科学职位信息数据集Indeed-com-gk5894
美国东海岸数据科学职位信息数据集Indeed-com-gk5894 数据来源:互联网公开数据 标签:数据科学,职位信息,美国东海岸,招聘,自然语言处理,文本分析,机器学习,就业市场 数据概述: 该数据集包含来自Indeed.com的美国东海岸地区数据科学职位信息,记录了不同公司发布的职位详情。主要特征如下:... -
-
招聘信息分析数据集JobPostingAnalysisDataset-dipanjanadas
招聘信息分析数据集JobPostingAnalysisDataset-dipanjanadas 数据来源:互联网公开数据 标签:招聘信息,文本分析,自然语言处理,机器学习,就业市场,行业分析,数据挖掘,人才招聘 数据概述: 该数据集包含从互联网上抓取的招聘信息数据,记录了各类职位发布的详细信息。主要特征如下: 时间跨度:... -
纳斯达克上市公司股票描述数据集NASDAQListedCompanyStockDescriptionsDataset-sauers
纳斯达克上市公司股票描述数据集NASDAQListedCompanyStockDescriptionsDataset-sauers 数据来源:互联网公开数据 标签:股票市场,公司描述,纳斯达克,文本分析,自然语言处理,金融数据,数据集,上市公司 数据概述:... -
新闻文本分类数据集DraupNewsClassificationDataset-shadabhussain
新闻文本分类数据集DraupNewsClassificationDataset-shadabhussain 数据来源:互联网公开数据 标签:新闻分类,文本分析,数据集,自然语言处理,机器学习,信息检索,数据挖掘,人工智能 数据概述: 该数据集包含来自Draup平台的新闻文本数据,主要记录了各类新闻文章的文本内容及其分类标签。主要特征如下:... -
新闻文本处理与自然语言理解数据集NewsProcessedNLPCoreDataset-mario123475
新闻文本处理与自然语言理解数据集NewsProcessedNLPCoreDataset-mario123475 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,新闻分析,机器学习,语义理解,情感分析,数据挖掘 数据概述: 该数据集包含经过预处理的新闻文本数据,记录了来自多个新闻来源的新闻文章内容。主要特征如下:... -
技能提取数据范围综述数据集ScopingReviewofSkillExtractionData-andruonciul
技能提取数据范围综述数据集ScopingReviewofSkillExtractionData-andruonciul 数据来源:互联网公开数据 标签:技能提取,数据集,自然语言处理,机器学习,教育技术,人力资源,文本分析,信息检索 数据概述: 该数据集包含来自多个来源的技能提取数据,记录了不同领域中技能信息的识别与提取。主要特征如下:... -
中国古典诗歌文本数据集Tibamemlnlp-poemDataset-smallstone2022
中国古典诗歌文本数据集Tibamemlnlp-poemDataset-smallstone2022 数据来源:互联网公开数据 标签:古典文学,诗歌,数据集,文本分析,自然语言处理,机器学习,文化研究,语言模型 数据概述: 该数据集包含来自中国古典诗歌的文本数据,记录了历代著名诗人的诗歌作品及其相关信息。主要特征如下:... -
文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn
文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,信息检索,文本分析,知识图谱,学术研究 数据概述: 该数据集包含来自多个来源的文章主题分类数据,记录了各类文章的主题标签和内容。主要特征如下:... -
简历筛选数据集ResumeScreeningDataset-serkanp
简历筛选数据集ResumeScreeningDataset-serkanp 数据来源:互联网公开数据 标签:人力资源,简历筛选,数据分析,机器学习,招聘,文本分析,自然语言处理,职业发展 数据概述: 该数据集包含来自招聘平台的简历数据,记录了求职者的简历信息及其对应的职位匹配结果。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...