-
手绘图像笔画数据集Hand-drawnImageStrokes-supernovadkb
手绘图像笔画数据集Hand-drawnImageStrokes-supernovadkb 数据来源:互联网公开数据 标签:手绘图像, 笔画数据, 图像识别, 模式识别, 计算机视觉, 数据集, 文本数据, 机器学习 数据概述: 该数据集包含来自多个类别的手绘图像的笔画数据,记录了不同类别图像的笔画坐标信息,用于图像识别与模式分析。主要特征如下:... -
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi 数据来源:互联网公开数据 标签:印度英语,语料库,自然语言处理,文本分析,语言学,机器学习,文本数据,语言资源 数据概述: 该数据集包含来自阿迪提语料库的印度英语文本数据,记录了印度英语的各种语言现象。主要特征如下:... -
越南诗歌文本情感分析数据集VietnamesePoetryTextSentimentAnalysis-nguyenpham551
越南诗歌文本情感分析数据集VietnamesePoetryTextSentimentAnalysis-nguyenpham551 数据来源:互联网公开数据 标签:越南语, 诗歌, 情感分析, 文本数据, 自然语言处理, 情感词典, 文本分类, 诗歌创作 数据概述:... -
用户行为分类训练数据集UserBehaviorCategorizationTrainingData-lourdesob
用户行为分类训练数据集UserBehaviorCategorizationTrainingData-lourdesob 数据来源:互联网公开数据 标签:用户行为分析, 行为分类, 文本数据, 机器学习, 数据标注, 用户画像, 行为预测, 数据挖掘 数据概述:... -
越南堤坝巡查文本数据集VietnamDykePatrolTextDataset-minhnguyendichnhat
越南堤坝巡查文本数据集VietnamDykePatrolTextDataset-minhnguyendichnhat 数据来源:互联网公开数据 标签:堤坝巡查, 文本数据, 自然语言处理, 越南语, 水利工程, 堤坝安全, 文本分析, 灾害防治 数据概述:... -
文本语境理解训练数据集TextContextUnderstandingTrainingDataset-venkatapadavala
文本语境理解训练数据集TextContextUnderstandingTrainingDataset-venkatapadavala 数据来源:互联网公开数据 标签:文本分析, 语境理解, 自然语言处理, 语言模型, 文本数据, 机器学习, 数据集, 训练数据 数据概述:... -
数据2019年奥斯卡颁奖典礼推文数据集-shaz13
2019年奥斯卡颁奖典礼推文数据集-shaz13 数据来源:互联网公开数据 标签:社交媒体,推文,奥斯卡,情感分析,自然语言处理,电影,文化,文本数据 数据概述: 该数据集包含了关于2019年奥斯卡颁奖典礼的推文数据,记录了用户在Twitter上发布的与奥斯卡相关的讨论和评论。主要特征如下:... -
预处理后语料库数据集CorpusAfterPreprocessed18deDataset-ictworld
预处理后语料库数据集CorpusAfterPreprocessed18deDataset-ictworld 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,数据预处理,机器学习,文本分类,语言模型,深度学习 数据概述: 该数据集包含经过预处理的文本数据,记录了经过清洗、分词和标准化等处理的语料信息。主要特征如下:... -
电影评论情感分析测试数据集MovieReviewsSentimentAnalysisTestData-sarthakgangwal
电影评论情感分析测试数据集MovieReviewsSentimentAnalysisTestData-sarthakgangwal 数据来源:互联网公开数据 标签:情感分析, 文本数据, 电影评论, 自然语言处理, 情感分类, 机器学习, 评论挖掘, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了观众对电影的评价。主要特征如下:... -
阿拉伯语文本情感分析数据集-nanorfelixsam
阿拉伯语文本情感分析数据集-nanorfelixsam 数据来源:互联网公开数据 标签:阿拉伯语,情感分析,文本数据,自然语言处理,机器学习,NLP,语言学,情感分类 数据概述: 该数据集包含来自互联网的阿拉伯语文本数据,用于阿拉伯语文本情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期互联网上的阿拉伯语文本。... -
孟加拉语语音识别句子数据集BengaliSpeechRecognitionSentenceDataset-sadib2506
孟加拉语语音识别句子数据集BengaliSpeechRecognitionSentenceDataset-sadib2506 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 语音数据, 文本数据, 语音转录, 自然语言处理, 深度学习, 声学模型 数据概述:... -
阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune
阿拉伯语故事文本数据集FinalArabicStoriesDataset-raidouahioune 数据来源:互联网公开数据 标签:阿拉伯语,文本数据,故事集,自然语言处理,机器学习,语言研究,文化遗产,文本分析 数据概述: 该数据集包含来自阿拉伯语故事文本的集合,记录了阿拉伯语故事的内容和结构。主要特征如下:... -
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine
泰卢固语罗马化文本数据集TeluguRomanizedTextDataset-teachingmachine 数据来源:互联网公开数据 标签:泰卢固语,罗马化,文本数据,自然语言处理,数据集,语言学,机器翻译,文本分析 数据概述: 该数据集包含泰卢固语文本的罗马化转写数据,记录了泰卢固语文本与其对应的罗马字母转写版本。主要特征如下:... -
Twitter情感分析数据集Sentiment140CleanedDataset-fadhilmch
Twitter情感分析数据集Sentiment140CleanedDataset-fadhilmch 数据来源:互联网公开数据 标签:情感分析,社交媒体,文本数据,自然语言处理,机器学习,情感分类,Twitter,数据集 数据概述: 该数据集包含来自Twitter的推文数据,主要用于情感分析任务,即判断推文的情感倾向是积极还是消极。主要特征如下:... -
游戏翻译语料库-中文-越南语对照数据集GameTranslationCorpus-Chinese-Vietnamese-trninh
游戏翻译语料库-中文-越南语对照数据集GameTranslationCorpus-Chinese-Vietnamese-trninh 数据来源:互联网公开数据 标签:机器翻译, 游戏翻译, 语言对, 中文, 越南语, 文本数据, 语料库, 多语言 数据概述:... -
大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis
大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis 数据来源:互联网公开数据 标签:自然语言处理,大规模语言模型,预训练,数据集,文本数据,深度学习,语言模型,人工智能 数据概述: 该数据集包含了用于大规模语言模型(LLM)预训练的文本数据,旨在为模型提供丰富的语言知识和上下文理解能力。主要特征如下: 时间跨度:... -
分子活性预测SMILES数据集MolecularActivityPredictionSMILESDataset-clarkziyuanwang
分子活性预测SMILES数据集MolecularActivityPredictionSMILESDataset-clarkziyuanwang 数据来源:互联网公开数据 标签:SMILES, 分子活性, 机器学习, 药物研发, 化学信息学, 文本数据, 模型训练, 数据集 数据概述:... -
科勒里奇倡议科研论文文本与标签数据集ColeridgeInitiativeUnitedTextsandLabelsDataset-anaidashaginian
科勒里奇倡议科研论文文本与标签数据集ColeridgeInitiativeUnitedTextsandLabelsDataset-anaidashaginian 数据来源:互联网公开数据 标签:科研论文,文本数据,自然语言处理,数据标注,学术研究,机器学习,文本分析,信息提取... -
阿拉伯语推特文本数据集ArabicTwitterTextData-asalhi
阿拉伯语推特文本数据集ArabicTwitterTextData-asalhi 数据来源:互联网公开数据 标签:阿拉伯语, 社交媒体, 文本数据, 推特, 自然语言处理, 情感分析, 文本挖掘, 语料库 数据概述: 该数据集包含来自Twitter平台的阿拉伯语推文文本数据,记录了用户发布的推文内容及其对应的URL链接。主要特征如下:... -
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,文本清洗,机器学习,语言模型,信息检索,文本分析 数据概述: 该数据集是维基文本清洗数据集的第二部分,包含了从维基百科中提取和清洗过的文本数据。主要特征如下:...