-
印度城市名称拼写错误数据集IndianCitieswithTypoDataset-anirbanacharya
印度城市名称拼写错误数据集IndianCitieswithTypoDataset-anirbanacharya 数据来源:互联网公开数据 标签:城市名称,数据集,拼写错误,数据处理,地理信息,数据清洗,自然语言处理,机器学习 数据概述: 该数据集包含来自印度各城市的名称数据,记录了城市名称中常见的拼写错误及正确名称。主要特征如下:... -
元学习批量转换器数据集MetaLearningClusterBatchTransformerDataset-rezaabd
元学习批量转换器数据集MetaLearningClusterBatchTransformerDataset-rezaabd 数据来源:互联网公开数据 标签:元学习,批量转换器,聚类,数据集,深度学习,自然语言处理,机器学习,人工智能 数据概述: 该数据集包含用于训练和评估元学习批量转换器模型的数据,主要记录了经过聚类处理的文本数据。主要特征如下:... -
新闻文本分类数据集NewsTextClassification-zhangzheli
新闻文本分类数据集NewsTextClassification-zhangzheli 数据来源:互联网公开数据 标签:文本分类, 新闻, 标题, 正文, 机器学习, 自然语言处理, 多分类, 数据集 数据概述: 该数据集包含来自新闻网站的新闻文章,记录了文章的标题、正文以及所属类别信息,用于新闻文本的分类任务。主要特征如下:... -
光学字符识别英文文本标注数据集OpticalCharacterRecognitionEnglishTextAnnotationDataset-sardararslan
光学字符识别英文文本标注数据集OpticalCharacterRecognitionEnglishTextAnnotationDataset-sardararslan 数据来源:互联网公开数据 标签:光学字符识别, OCR, 文本识别, 图像处理, 深度学习, 数据集, 文本标注, 自然语言处理 数据概述:... -
世界银行项目文档主题分类数据集WorldBankProjectDocumentTopicClassification-tylersuard
世界银行项目文档主题分类数据集WorldBankProjectDocumentTopicClassification-tylersuard 数据来源:互联网公开数据 标签:文本分类, 世界银行, 项目文档, 多标签分类, 机器学习, 自然语言处理, 发展经济学, 政策分析 数据概述:... -
葡萄酒评论探索数据集ExploringtheWineReviewsKaggleDataset-muhammadahmed26
葡萄酒评论探索数据集ExploringtheWineReviewsKaggleDataset-muhammadahmed26 数据来源:互联网公开数据 标签:葡萄酒,评论分析,数据集,评分预测,自然语言处理,数据分析,食品科学,机器学习 数据概述: 该数据集包含来自各大葡萄酒评论网站的专业品鉴数据,记录了葡萄酒的详细信息和评论内容。主要特征如下:... -
图像描述词频统计数据集ImageDescriptionWordFrequencyStatistics-ritchie46
图像描述词频统计数据集ImageDescriptionWordFrequencyStatistics-ritchie46 数据来源:互联网公开数据 标签:图像描述, 词频统计, 文本分析, 自然语言处理, 计算机视觉, 语料库, 数据挖掘, 图像检索 数据概述:... -
文本情感分析词向量数据集TextSentimentAnalysisWordEmbeddingDataset-sailhan
文本情感分析词向量数据集TextSentimentAnalysisWordEmbeddingDataset-sailhan 数据来源:互联网公开数据 标签:情感分析, 文本分类, 词向量, 自然语言处理, 机器学习, 深度学习, 语料库, 情感词典 数据概述:... -
自杀风险文本分类数据集SuicideRiskTextClassificationDataset-tonmoyabdullah
自杀风险文本分类数据集SuicideRiskTextClassificationDataset-tonmoyabdullah 数据来源:互联网公开数据 标签:心理健康,文本分类,数据集,自然语言处理,情感分析,机器学习,社会学研究,危机干预 数据概述:... -
金融新闻情感分析数据集FinancialNewsSentimentAnalysisDataset-tderonde
金融新闻情感分析数据集FinancialNewsSentimentAnalysisDataset-tderonde 数据来源:互联网公开数据 标签:金融新闻,情感分析,自然语言处理,数据集,文本分析,机器学习,金融科技,情感分类 数据概述: 该数据集包含了经过 FinBERT 模型处理的金融新闻数据,用于情感分析研究。主要特征如下: 时间跨度:... -
语言工具使用情况调查数据集2023年中国用户语言工具使用情况调查数据集-alvaromendizabal
语言工具使用情况调查数据集2023年中国用户语言工具使用情况调查数据集-alvaromendizabal 数据来源:互联网公开数据 标签:语言工具,使用情况,用户调查,自然语言处理,数据集,市场研究,人工智能,用户体验... -
消息内容分析数据集MessagesV1Dataset-pcvchowdary
消息内容分析数据集MessagesV1Dataset-pcvchowdary 数据来源:互联网公开数据 标签:消息,文本分析,自然语言处理,情感分析,数据集,社交媒体,机器学习,数据挖掘 数据概述: 该数据集包含来自各种社交媒体平台的消息内容,记录了用户之间的文本交流信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年初到2023年末。... -
亚马逊评论词汇处理数据集AmazonReviewsLexicalProcessingDataset-abidinawres
亚马逊评论词汇处理数据集AmazonReviewsLexicalProcessingDataset-abidinawres 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,词汇处理,情感分析,机器学习,电子商务,消费者研究 数据概述: 该数据集包含来自亚马逊平台的用户评论数据,记录了商品评论的文本内容及其相关信息。主要特征如下:... -
电影及其剧本数据集MoviesandMovieScriptsDataset-torloweidadata
电影及其剧本数据集MoviesandMovieScriptsDataset-torloweidadata 数据来源:互联网公开数据 标签:电影,剧本,数据集,文本分析,自然语言处理,文学研究,文化研究,娱乐产业 数据概述: 该数据集包含来自多个来源的电影及其剧本数据,记录了电影的基本信息和对应的剧本内容。主要特征如下:... -
仇恨言论和攻击性语言数据集2019年版HateSpeechandOffensiveLanguageDataset2019-siddiqui7
仇恨言论和攻击性语言数据集2019年版HateSpeechandOffensiveLanguageDataset2019-siddiqui7 数据来源:互联网公开数据 标签:仇恨言论,攻击性语言,数据集,文本分析,自然语言处理,社交媒体分析,社会学,道德研究... -
Jigsaw恶意评论检测数据集JigsawOffensiveObservationsDataset-gauravbrills
Jigsaw恶意评论检测数据集JigsawOffensiveObservationsDataset-gauravbrills 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,情感分析,恶意评论,数据集,社交媒体,NLP 数据概述: 该数据集由 Jigsaw 团队提供,旨在用于检测在线评论中的恶意、侮辱性和攻击性言论。主要特征如下:... -
最终数据问答数据集FinalDataQuestionAnswerDataset-tasneemalbokary
最终数据问答数据集FinalDataQuestionAnswerDataset-tasneemalbokary 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,文本理解,信息检索,人工智能,数据挖掘 数据概述: 该数据集包含来自问答系统相关研究的数据,记录了问答系统的训练和评估数据。主要特征如下:... -
网络犯罪举报文本分类数据集CybercrimeReportingTextClassificationDataset-jastegsingh233
网络犯罪举报文本分类数据集CybercrimeReportingTextClassificationDataset-jastegsingh233 数据来源:互联网公开数据 标签:网络犯罪, 文本分类, 犯罪举报, 自然语言处理, 机器学习, 欺诈, 社交媒体, 安全 数据概述:... -
社交媒体情感分析文本数据集SocialMediaSentimentAnalysisTextDataset-royal10march
社交媒体情感分析文本数据集SocialMediaSentimentAnalysisTextDataset-royal10march 数据来源:互联网公开数据 标签:情感分析, 文本分类, 社交媒体, 情绪识别, 自然语言处理, 机器学习, 数据标注, 情感极性 数据概述:... -
学术论文摘要处理数据集ArxivAfterProcessedDataset-mokshitsurana
学术论文摘要处理数据集ArxivAfterProcessedDataset-mokshitsurana 数据来源:互联网公开数据 标签:学术论文,摘要处理,数据集,自然语言处理,机器学习,文本挖掘,学术研究,数据科学 数据概述: 该数据集包含来自arXiv预印本库的学术论文摘要,已进行初步处理。主要特征如下:...