-
印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall
印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall 数据来源:互联网公开数据 标签:机器翻译,英印翻译,自然语言处理,数据集,语言学,文本数据,人工智能,NLP 数据概述:...
-
人物维基百科传记文本数据集PeopleWikipediaBiographyTextDataset-jainprashant07
人物维基百科传记文本数据集PeopleWikipediaBiographyTextDataset-jainprashant07 数据来源:互联网公开数据 标签:人物传记, 文本数据, 维基百科, 自然语言处理, 文本分析, 传记信息, 知识图谱, 信息检索 数据概述:...
-
故事数据集StoryDataset-ahmadrezacuet
故事数据集StoryDataset-ahmadrezacuet 数据来源:互联网公开数据 标签:故事,文本数据,自然语言处理,情感分析,叙事分析,数据集,机器学习,语言模型 数据概述: 该数据集包含大量故事文本,涵盖多种主题和风格。主要特征如下: 时间跨度:数据的时间跨度取决于故事的创作时间,从古代神话传说到现代小说均有收录。...
-
人类文本数据集HumanTextDataset-errordebug
人类文本数据集HumanTextDataset-errordebug 数据来源:互联网公开数据 标签:文本数据,自然语言处理,数据集,机器学习,情感分析,文本分类,语言模型,人工智能 数据概述: 该数据集包含来自互联网公开渠道的人类生成文本数据,记录了各类文本内容的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
-
推特文本清洗与展开缩写数据集CleanTweetswithExpandedContractionsDataset-mgmdif
推特文本清洗与展开缩写数据集CleanTweetswithExpandedContractionsDataset-mgmdif 数据来源:互联网公开数据 标签:推特,文本数据,数据清洗,自然语言处理,缩写展开,情感分析,机器学习,社交媒体 数据概述: 该数据集包含从推特(Twitter)平台收集的文本数据,并进行了清洗和缩写展开处理。主要特征如下:...
-
机器翻译模型输入数据预处理数据集MachineTranslationModelInputDataPreprocessing-linshokaku
机器翻译模型输入数据预处理数据集MachineTranslationModelInputDataPreprocessing-linshokaku 数据来源:互联网公开数据 标签:机器翻译, 文本数据, 数据预处理, 词嵌入, 自然语言处理, 深度学习, 模型训练, 数据集构建 数据概述:...
-
多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo
多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 语言学, 翻译模型, 文本数据, 英语, 德语, 西班牙语 数据概述:...
-
文本情感分析与分类数据集TextSentimentAnalysisandClassificationDataset-tylorkim
文本情感分析与分类数据集TextSentimentAnalysisandClassificationDataset-tylorkim 数据来源:互联网公开数据 标签:文本情感分析, 情感分类, 自然语言处理, 机器学习, 文本数据, 情感倾向, 数据标注, 情绪识别 数据概述:...
-
基因序列信息训练数据集GeneSequenceInformationTrainingDataset-logan1x
基因序列信息训练数据集GeneSequenceInformationTrainingDataset-logan1x 数据来源:互联网公开数据 标签:基因组学, 序列分析, 生物信息学, 基因表达, 机器学习, 数据挖掘, 序列比对, 文本数据 数据概述:...
-
植物基因启动子序列与表达数据集PlantGenePromoterSequenceandExpression-aggarwalvinayak
植物基因启动子序列与表达数据集PlantGenePromoterSequenceandExpression-aggarwalvinayak 数据来源:互联网公开数据 标签:基因表达, 启动子序列, DNA序列, 生物信息学, 基因组学, 文本数据, 生物实验, 数据分析 数据概述:...
-
药物分子结构SMILES数据集DrugMoleculeStructureSMILES-osmanf
药物分子结构SMILES数据集DrugMoleculeStructureSMILES-osmanf 数据来源:互联网公开数据 标签:药物研发, 分子结构, SMILES, 化学信息学, 文本数据, 数据挖掘, 机器学习, 药物设计 数据概述: 该数据集包含来自ChEMBL数据库的药物分子结构数据,记录了药物分子的SMILES表示。主要特征如下:...
-
数据10万条数据与600万FAISS索引上下文数据集-hozaifazaki99
10万条数据与600万FAISS索引上下文数据集-hozaifazaki99 数据来源:互联网公开数据 标签:文本数据,向量检索,FAISS,上下文学习,自然语言处理,信息检索,数据集,机器学习 数据概述: 该数据集包含10万条文本数据及其对应的FAISS索引上下文,用于评估和训练向量检索模型。主要特征如下:...
-
汽车评论情感分析数据集CarReviewsDataset-pranavmanoj
汽车评论情感分析数据集CarReviewsDataset-pranavmanoj 数据来源:互联网公开数据 标签:汽车,评论,情感分析,文本数据,自然语言处理,机器学习,情感分类,舆情分析 数据概述: 该数据集包含了来自互联网的汽车评论数据,旨在用于情感分析和文本挖掘任务。主要特征如下: 时间跨度:...
-
手绘图像笔画数据集Hand-drawnImageStrokes-supernovadkb
手绘图像笔画数据集Hand-drawnImageStrokes-supernovadkb 数据来源:互联网公开数据 标签:手绘图像, 笔画数据, 图像识别, 模式识别, 计算机视觉, 数据集, 文本数据, 机器学习 数据概述: 该数据集包含来自多个类别的手绘图像的笔画数据,记录了不同类别图像的笔画坐标信息,用于图像识别与模式分析。主要特征如下:...
-
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi 数据来源:互联网公开数据 标签:印度英语,语料库,自然语言处理,文本分析,语言学,机器学习,文本数据,语言资源 数据概述: 该数据集包含来自阿迪提语料库的印度英语文本数据,记录了印度英语的各种语言现象。主要特征如下:...
-
越南诗歌文本情感分析数据集VietnamesePoetryTextSentimentAnalysis-nguyenpham551
越南诗歌文本情感分析数据集VietnamesePoetryTextSentimentAnalysis-nguyenpham551 数据来源:互联网公开数据 标签:越南语, 诗歌, 情感分析, 文本数据, 自然语言处理, 情感词典, 文本分类, 诗歌创作 数据概述:...
-
用户行为分类训练数据集UserBehaviorCategorizationTrainingData-lourdesob
用户行为分类训练数据集UserBehaviorCategorizationTrainingData-lourdesob 数据来源:互联网公开数据 标签:用户行为分析, 行为分类, 文本数据, 机器学习, 数据标注, 用户画像, 行为预测, 数据挖掘 数据概述:...
-
越南堤坝巡查文本数据集VietnamDykePatrolTextDataset-minhnguyendichnhat
越南堤坝巡查文本数据集VietnamDykePatrolTextDataset-minhnguyendichnhat 数据来源:互联网公开数据 标签:堤坝巡查, 文本数据, 自然语言处理, 越南语, 水利工程, 堤坝安全, 文本分析, 灾害防治 数据概述:...
-
文本语境理解训练数据集TextContextUnderstandingTrainingDataset-venkatapadavala
文本语境理解训练数据集TextContextUnderstandingTrainingDataset-venkatapadavala 数据来源:互联网公开数据 标签:文本分析, 语境理解, 自然语言处理, 语言模型, 文本数据, 机器学习, 数据集, 训练数据 数据概述:...
-
数据2019年奥斯卡颁奖典礼推文数据集-shaz13
2019年奥斯卡颁奖典礼推文数据集-shaz13 数据来源:互联网公开数据 标签:社交媒体,推文,奥斯卡,情感分析,自然语言处理,电影,文化,文本数据 数据概述: 该数据集包含了关于2019年奥斯卡颁奖典礼的推文数据,记录了用户在Twitter上发布的与奥斯卡相关的讨论和评论。主要特征如下:...



