-
大规模情感分析数据集LargeEmotionDataset-ubbarapusiri
大规模情感分析数据集LargeEmotionDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,情感分类,情绪识别,中文文本 数据概述: 该数据集包含大规模的中文文本数据,用于情感分析研究。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的中文文本。... -
冰与火之歌文学作品数据集ASongofIceandFireLiteraryDataset-stormbreaker1726
冰与火之歌文学作品数据集ASongofIceandFireLiteraryDataset-stormbreaker1726 数据来源:互联网公开数据 标签:文学作品,数据集,文本分析,数据分析,机器学习,自然语言处理,故事分析,小说研究 数据概述: 该数据集包含来自《冰与火之歌》系列文学作品的数据,记录了该系列小说的文本内容及相关元数据。主要特征如下:... -
CommonLit文本阅读理解训练数据集CommonLitReadabilityPrizeDataset-mcpenguin
CommonLit文本阅读理解训练数据集CommonLitReadabilityPrizeDataset-mcpenguin 数据来源:互联网公开数据 标签:文本分析,阅读理解,自然语言处理,教育,数据集,机器学习,文本难度,语言学 数据概述: 该数据集包含CommonLit公司提供的文本阅读理解训练数据,旨在评估文本的可读性和难度。主要特征如下:... -
棒球比赛自动化洞察数据集AutomatedInsightsBaseballGameRoundupDataset-jialin97
棒球比赛自动化洞察数据集AutomatedInsightsBaseballGameRoundupDataset-jialin97 数据来源:互联网公开数据 标签:棒球,体育,数据集,比赛分析,自然语言处理,数据挖掘,机器学习,文本分析 数据概述: 该数据集包含来自自动化洞察(Automated... -
僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal
僧伽罗语新闻文章数据集SinhalaNewsArticlesDataset-timnirmal 数据来源:互联网公开数据 标签:新闻文章,僧伽罗语,自然语言处理,文本分析,数据集,情感分析,语言模型,文本挖掘 数据概述: 该数据集包含来自互联网的僧伽罗语新闻文章,旨在为自然语言处理(NLP)研究和应用提供资源。主要特征如下:... -
新闻处理数据集NewsProcessedDataset-mario123475
新闻处理数据集NewsProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻,数据处理,文本分析,自然语言处理,机器学习,数据挖掘,信息提取,情感分析 数据概述:该数据集包含来自互联网的新闻数据,经过预处理和清洗,适用于文本分析和自然语言处理任务。主要特征如下:... -
自然语言处理特征工程数据集FeatureEngineeringforNLPDataAcquisition-ebaruti
自然语言处理特征工程数据集FeatureEngineeringforNLPDataAcquisition-ebaruti 数据来源:互联网公开数据 标签:自然语言处理,特征工程,数据集,文本分析,机器学习,语言学,数据科学,人工智能... -
航空公司微博评论数据集AirlineReviewsonTwitterDataset-jdhruvr
航空公司微博评论数据集AirlineReviewsonTwitterDataset-jdhruvr 数据来源:互联网公开数据 标签:航空业,社交媒体,数据集,自然语言处理,情感分析,机器学习,消费者行为,客户服务 数据概述: 该数据集包含来自微博平台上关于航空公司的用户评论数据,记录了消费者对航空公司服务的评价和反馈。主要特征如下:... -
TED演讲数据集2006-2023TEDTalkDataset-tasnimtahasin
TED演讲数据集2006-2023TEDTalkDataset-tasnimtahasin 数据来源:互联网公开数据 标签:TED演讲,数据集,文本分析,视频内容,演讲者,主题分类,自然语言处理,教育与培训 数据概述:该数据集包含来自TED官方网站的演讲内容,记录了自2006年以来的TED演讲的详细信息和文本内容。主要特征如下:... -
越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia
越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia 数据来源:互联网公开数据 标签:自然语言处理,文本分析,停用词,越南语,数据集,语言学,文本挖掘,信息检索 数据概述: 该数据集包含了越南语的停用词列表,旨在帮助文本处理和自然语言处理任务。主要特征如下:... -
光学字符识别OCR与Gemini模型融合结果数据集OCR-GeminiResultDataset-risckynhut
光学字符识别OCR与Gemini模型融合结果数据集OCR-GeminiResultDataset-risckynhut 数据来源:互联网公开数据 标签:光学字符识别,自然语言处理,数据集,图像处理,文本分析,机器学习,人工智能,计算机视觉 数据概述: 该数据集包含通过光学字符识别(OCR)技术与 Gemini... -
亚马逊商品评论情感分析数据集AmazonProductReviewsSentimentAnalysisDataset-mastersniffer
亚马逊商品评论情感分析数据集AmazonProductReviewsSentimentAnalysisDataset-mastersniffer 数据来源:互联网公开数据 标签:情感分析,评论数据,自然语言处理,机器学习,文本挖掘,电商,用户评价,数据集 数据概述: 该数据集包含来自亚马逊网站的商品评论数据,用于情感分析和文本挖掘任务。主要特征如下:... -
LLM基线模型评测数据集-aditya21511
LLM基线模型评测数据集-aditya21511 数据来源:互联网公开数据 标签:大语言模型,LLM,基线模型,评测,NLP,自然语言处理,基准测试,性能评估 数据概述: 该数据集包含用于评估大语言模型(LLM)性能的基线模型评测数据,用于衡量LLM在不同任务上的表现。主要特征如下: 时间跨度:数据集涵盖了当前LLM发展阶段的多个时间点。... -
英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48
英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,法语,数据挖掘,人工智能,多语言处理 数据概述: 该数据集来自WMT(Workshop on Machine... -
CORD-19研究任务相关性评分数据集
CORD-19研究任务相关性评分数据集 数据来源:互联网公开数据 标签:CORD-19,研究任务,相关性评分,自然语言处理,LSA,学术研究,竞赛数据 数据概述:... -
仇恨言论检测数据集HateSpeechDetectionDataset-divanshu22
仇恨言论检测数据集HateSpeechDetectionDataset-divanshu22 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,数据集,文本分类,机器学习,情感分析,社交媒体,文本挖掘 数据概述: 该数据集包含来自社交媒体平台的数据,记录了各种形式的仇恨言论文本。主要特征如下:... -
微博情感分析数据集WeiboSentimentAnalysisDataset-lindiefan
微博情感分析数据集WeiboSentimentAnalysisDataset-lindiefan 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,文本分类,情感计算,大数据 数据概述: 该数据集包含来自微博平台的文本数据,记录了用户发布的内容及其对应的情感标签。主要特征如下:... -
正则表达式与文本挖掘清理后的NLP数据集-janiscorona
正则表达式与文本挖掘清理后的NLP数据集-janiscorona 数据来源:互联网公开数据 标签:自然语言处理,文本挖掘,正则表达式,数据清洗,NLP,数据集,文本分析,数据预处理 数据概述: 该数据集包含了经过清洗和预处理的文本数据,主要用于自然语言处理(NLP)和文本挖掘任务。主要特征如下:... -
GoJek用户应用评价数据集UASReviewGojekDataset-dwialviany
GoJek用户应用评价数据集UASReviewGojekDataset-dwialviany 数据来源:互联网公开数据 标签:用户评价,出行服务,数据集,文本分析,情感分析,自然语言处理,服务质量,移动应用 数据概述:该数据集包含来自GoJek用户的应用评价数据,记录了用户对GoJek出行服务的反馈和体验。主要特征如下:... -
英文单词全集数据集-lennartluik
英文单词全集数据集-lennartluik 数据来源:互联网公开数据 标签:英文单词,词汇库,英语学习,语言研究,自然语言处理,NLP 数据概述: 本数据集收录了《dwyl/english-...