-
手写文本图像识别及内容标注数据集HandwrittenTextImageRecognitionandContentAnnotationDataset-yiyueme
手写文本图像识别及内容标注数据集HandwrittenTextImageRecognitionandContentAnnotationDataset-yiyueme 数据来源:互联网公开数据 标签:手写文本识别, 图像识别, OCR, 自然语言处理, 文本标注, 图像分类, 深度学习, 法语 数据概述:... -
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-tienbk
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-tienbk 数据来源:互联网公开数据 标签:文本纠错, 越南语, 自然语言处理, 深度学习, 错误检测, 语料库, 文本校对, 机器学习 数据概述: 该数据集包含越南语文本,记录了原始句子及其对应的带有错误的版本,用于越南语文本纠错任务。主要特征如下:... -
语音样本数据集SpeechSampleDataset-ramya19051992
语音样本数据集SpeechSampleDataset-ramya19051992 数据来源:互联网公开数据 标签:语音识别,数据集,音频处理,机器学习,自然语言处理,人工智能,信号处理,教育技术 数据概述: 该数据集包含来自不同来源的语音样本数据,记录了多种语音信号的特征。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖多个时间段。... -
恶意信息文本分类数据集-aniketgupta01
恶意信息文本分类数据集-aniketgupta01 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,恶意信息,情感分析,数据集,NLP,深度学习 数据概述: 该数据集包含用于恶意信息文本分类的文本数据,旨在识别和区分文本中的恶意内容。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但包含了当前常见的网络用语和恶意表达方式。... -
说服性论文数据集PersuadeEssayDataset-gendoso
说服性论文数据集PersuadeEssayDataset-gendoso 数据来源:互联网公开数据 标签:论文,数据集,自然语言处理,文本分析,写作质量,情感分析,机器学习,教育 数据概述: 该数据集包含来自 Kaggle 的说服性论文数据,记录了学生撰写的说服性文章,旨在评估学生的写作能力及说服技巧。主要特征如下:... -
能源公司电子邮件数据集EnronEmailDataset-tanweishing
能源公司电子邮件数据集EnronEmailDataset-tanweishing 数据来源:互联网公开数据 标签:电子邮件数据,数据集,企业通信,数据分析,机器学习,文本挖掘,自然语言处理,商业智能 数据概述: 该数据集包含来自恩隆公司(Enron... -
Python编程问答数据集PythonQADatasets-terrychanorg
Python编程问答数据集PythonQADatasets-terrychanorg 数据来源:互联网公开数据 标签:编程,问答,数据集,自然语言处理,机器学习,算法,教育,技术支持 数据概述: 该数据集包含来自公开编程问答平台的数据,记录了关于Python编程的常见问题和解答。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
新闻报纸普里特里卡数据集NewspaperPotrikaDataset-miratunnahar
新闻报纸普里特里卡数据集NewspaperPotrikaDataset-miratunnahar 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,社会研究,机器学习,自然语言处理,学术资源,历史研究 数据概述:该数据集包含来自普里特里卡(Potrika)报纸的数据,记录了该报纸从1870年到2018年期间的历史文章。主要特征如下:... -
亚马逊商品元数据数据集AmazonMeta-DataDataset-dartigb
亚马逊商品元数据数据集AmazonMeta-DataDataset-dartigb 数据来源:互联网公开数据 标签:电商,商品,元数据,文本分析,推荐系统,自然语言处理,机器学习,数据挖掘 数据概述: 该数据集包含来自亚马逊电商平台的商品元数据,记录了大量商品的详细信息。主要特征如下:... -
法律电子卷宗解析训练数据集LECRUnsupervisedTrainingDataTop-N96Dataset-hasegawatsuyoshi
法律电子卷宗解析训练数据集LECRUnsupervisedTrainingDataTop-N96Dataset-hasegawatsuyoshi 数据来源:互联网公开数据 标签:法律科技,自然语言处理,数据集,电子卷宗,无监督学习,文本分类,人工智能,机器学习 数据概述:... -
酒店用户评论情感分析数据集HotelUserReviewsSentimentAnalysisDataset-daniabizara
酒店用户评论情感分析数据集HotelUserReviewsSentimentAnalysisDataset-daniabizara 数据来源:互联网公开数据 标签:情感分析, 用户评论, 酒店评价, 自然语言处理, 文本分析, VADER, 情绪分析, 推荐系统 数据概述:... -
文本挖掘人工智能数据集CleanedDatasetforTextMiningforAI-stefaniaconte
文本挖掘人工智能数据集CleanedDatasetforTextMiningforAI-stefaniaconte 数据来源:互联网公开数据 标签:文本挖掘,数据集,人工智能,自然语言处理,机器学习,文本分析,数据清洗,信息检索 数据概述:该数据集包含经过清理和预处理的文本数据,适用于文本挖掘和人工智能领域的研究和应用。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-lavbox
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-lavbox 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情感标注, 机器学习, 语料库, 情感极性 数据概述: 该数据集包含来自电影评论的短语和对应的情感极性值,用于情感分析任务。主要特征如下:... -
酒店与餐厅评价数据集HotelandRestaurantReviewsDataset-hariwh0
酒店与餐厅评价数据集HotelandRestaurantReviewsDataset-hariwh0 数据来源:互联网公开数据 标签:酒店评价,餐厅评价,数据集,自然语言处理,情感分析,客户反馈,旅游服务,商业智能 数据概述:... -
表情包文本情感分析数据集EmoticonsChineseSentimentAnalysisDataset-tarunsinha968
表情包文本情感分析数据集EmoticonsChineseSentimentAnalysisDataset-tarunsinha968 数据来源:互联网公开数据 标签:情感分析,表情包,中文文本,数据集,自然语言处理,文本挖掘,机器学习,社交媒体 数据概述:... -
CommonLit2023开放式文本阅读理解数据集-lftuwujie
CommonLit2023开放式文本阅读理解数据集-lftuwujie 数据来源:互联网公开数据 标签:阅读理解,文本分析,自然语言处理,教育,数据集,机器学习,文本挖掘,语言学 数据概述: 该数据集由CommonLit平台提供,包含了来自不同年级学生的开放式文本阅读理解数据,旨在促进对阅读理解和文本分析的研究。主要特征如下:... -
推文处理流水线数据集TweetsPipelineDataset-omaressam02
推文处理流水线数据集TweetsPipelineDataset-omaressam02 数据来源:互联网公开数据 标签:社交媒体,推文分析,数据集,文本挖掘,情感分析,机器学习,自然语言处理,网络舆情 数据概述: 该数据集包含来自社交媒体平台Twitter的推文数据,记录了用户发布的推文内容及相关信息。主要特征如下:... -
语义相似度模型训练评估结果数据集SemanticSimilarityModelTrainingEvaluationResults-niuxiaoying
语义相似度模型训练评估结果数据集SemanticSimilarityModelTrainingEvaluationResults-niuxiaoying 数据来源:互联网公开数据 标签:语义相似度, 文本相似度, 模型评估, 机器学习, 自然语言处理, Pearson相关系数, Spearman相关系数, 训练结果 数据概述:... -
文本情感分类与主题识别数据集TextSentimentClassificationandTopicRecognitionDataset-thne1111
文本情感分类与主题识别数据集TextSentimentClassificationandTopicRecognitionDataset-thne1111 数据来源:互联网公开数据 标签:文本情感分析, 主题分类, 多分类模型, 情感识别, 文本挖掘, 自然语言处理, 机器学习, 语料库 数据概述:... -
多语言翻译语料库MultilingualTranslationCorpus-pushpaksaraf
多语言翻译语料库MultilingualTranslationCorpus-pushpaksaraf 数据来源:互联网公开数据 标签:机器翻译, 语言学, 语料库, 自然语言处理, 文本翻译, 文本分析, 印度语, 语言对 数据概述:...