-
多语言文本识别数据集MultilingualTextIdentification-iitm21f3001013
多语言文本识别数据集MultilingualTextIdentification-iitm21f3001013 数据来源:互联网公开数据 标签:文本识别,多语言,语言分类,自然语言处理,机器翻译,文本分析,语料库,印度语 数据概述: 该数据集包含来自多种印度语言的文本片段,旨在用于语言识别任务。主要特征如下:... -
瑞克与莫蒂剧本对白数据集RickandMortyDialogueDataset-mcuxdaredevil
瑞克与莫蒂剧本对白数据集RickandMortyDialogueDataset-mcuxdaredevil 数据来源:互联网公开数据 标签:剧本分析, 文本数据, 影视剧本, 对白分析, 角色互动, 情感分析, 自然语言处理, 语料库 数据概述: 该数据集包含来自瑞克与莫蒂(Rick and... -
新闻摘要分析数据集NewsSummaryAnalysisDataset-ankitgupta0901
新闻摘要分析数据集NewsSummaryAnalysisDataset-ankitgupta0901 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 自然语言处理, 文本分析, 信息检索, 语料库, 机器学习, 摘要生成 数据概述:... -
写作能力评估文本生成数据集WritingAbilityAssessmentTextGenerationDataset-shouhardiksaha
写作能力评估文本生成数据集WritingAbilityAssessmentTextGenerationDataset-shouhardiksaha 数据来源:互联网公开数据 标签:文本生成, 写作评估, 英语写作, 提示生成, 文本分析, 机器学习, 写作训练, 语料库 数据概述:... -
越南语命名实体识别数据集VietnameseNamedEntityRecognitionDataset-siuthao
越南语命名实体识别数据集VietnameseNamedEntityRecognitionDataset-siuthao 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 越南语, 信息抽取, 序列标注, 机器学习, 语料库 数据概述: 该数据集包含来自越南语文本的标注数据,用于训练和评估命名实体识别模型。主要特征如下:... -
英法双语翻译对照数据集English-FrenchTranslationDataset-mansikasahoo2
英法双语翻译对照数据集English-FrenchTranslationDataset-mansikasahoo2 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 双语对照, 文本数据, 自然语言处理, 语料库, 语言模型, 文本翻译 数据概述: 该数据集包含英法双语对照的翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:... -
文本语料情感分析数据集TextCorpusSentimentAnalysis-ellapetter
文本语料情感分析数据集TextCorpusSentimentAnalysis-ellapetter 数据来源:互联网公开数据 标签:情感分析, 文本数据, 语料库, 自然语言处理, 情感极性, 文本清洗, 数据集, 机器学习 数据概述: 该数据集包含经过清洗的文本数据,记录了用于情感分析的语料。主要特征如下:... -
孟加拉语翻译数据集BanglaTranslationDataset-emammame
孟加拉语翻译数据集BanglaTranslationDataset-emammame 数据来源:互联网公开数据 标签:机器翻译, 孟加拉语, 文本翻译, 自然语言处理, 语言模型, 文本数据, 语料库, 翻译 数据概述: 该数据集包含英语到孟加拉语的翻译文本对,用于机器翻译模型的训练和评估。主要特征如下:... -
水生环境低氧条件与重金属相互作用文本数据集AquaticEnvironmentHypoxiaandHeavyMetalsInteractionTextDa...
水生环境低氧条件与重金属相互作用文本数据集AquaticEnvironmentHypoxiaandHeavyMetalsInteractionTextDataset-san1201 数据来源:互联网公开数据 标签:水生环境, 低氧, 重金属, 文本分析, 生物毒性, 生态学, 语料库, 科学研究 数据概述:... -
仇恨言论文本分类数据集HateSpeechTextClassificationDataset-shoaibkarnure
仇恨言论文本分类数据集HateSpeechTextClassificationDataset-shoaibkarnure 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 情感分析, 社交媒体, 语料库, 机器学习, 自然语言处理, 风险评估 数据概述: 该数据集包含来自社交媒体平台的文本数据,旨在用于仇恨言论的检测与分类。主要特征如下:... -
用户评论情感分析GoJek应用数据集UserReviewSentimentAnalysisforGoJekApplication-dighiohixcgkdgcjfdio
用户评论情感分析GoJek应用数据集UserReviewSentimentAnalysisforGoJekApplication-dighiohixcgkdgcjfdio 数据来源:互联网公开数据 标签:情感分析, 用户评论, 文本分析, GoJek, 移动应用, 情绪识别, 语料库, 自然语言处理 数据概述:... -
多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0
多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0 数据来源:互联网公开数据 标签:文档标识, 多语言, 文本数据, 语料库, 语言识别, 数据清洗, 信息检索, 机器翻译 数据概述: 该数据集包含来自不同语言的文档标识符,记录了多种语言文档的唯一编号。主要特征如下:... -
电影对话情感分析数据集MovieDialogueSentimentAnalysis-avizyt
电影对话情感分析数据集MovieDialogueSentimentAnalysis-avizyt 数据来源:互联网公开数据 标签:电影,对话,情感分析,自然语言处理,文本数据,情感分类,对话分析,语料库 数据概述: 该数据集包含来自电影的对话数据,记录了电影中的人物对话内容。主要特征如下: 时间跨度:数据未标明具体时间,视作静态语料数据集使用。... -
文本指令生成与风格转换数据集TextInstructionGenerationandStyleTransfer-yuanzhezhou
文本指令生成与风格转换数据集TextInstructionGenerationandStyleTransfer-yuanzhezhou 数据来源:互联网公开数据 标签:文本生成, 风格迁移, 指令学习, 自然语言处理, 文本处理, 数据标注, 深度学习, 语料库 数据概述:... -
教育文本文档命名实体识别数据集EducationTextDocumentNamedEntityRecognition-tosanwiarramdhani
教育文本文档命名实体识别数据集EducationTextDocumentNamedEntityRecognition-tosanwiarramdhani 数据来源:互联网公开数据 标签:命名实体识别, 文本标注, 教育, 文本分类, 文本处理, 自然语言处理, 机器学习, 语料库 数据概述:... -
通用主题讨论文本分类数据集GeneralTopicDiscussionTextClassificationDataset-meefr25
通用主题讨论文本分类数据集GeneralTopicDiscussionTextClassificationDataset-meefr25 数据来源:互联网公开数据 标签:文本分类, 讨论主题, 自然语言处理, 机器学习, 情感分析, 语料库, 数据标注, 话题识别 数据概述:... -
文本相似度训练数据集TextSimilarityTrainingDataset-krilin
文本相似度训练数据集TextSimilarityTrainingDataset-krilin 数据来源:互联网公开数据 标签:文本相似度, 机器翻译, 文本匹配, 自然语言处理, 语料库, 文本分析, 语言模型, 相似度评估 数据概述: 该数据集包含来自互联网的文本数据,记录了用于训练文本相似度模型的语料。主要特征如下:... -
词汇语义关联分析数据集LexicalSemanticAssociationAnalysis-murtadhayaseen
词汇语义关联分析数据集LexicalSemanticAssociationAnalysis-murtadhayaseen 数据来源:互联网公开数据 标签:词汇关联, 语义分析, 文本挖掘, 自然语言处理, 语料库, 词向量, 文本特征提取, 数据清洗 数据概述: 该数据集包含从多个来源收集的词汇数据,记录了词汇之间的语义关联信息。主要特征如下:... -
印尼政治人物职位标注数据集IndonesianPoliticianPositionTagging-cindysiregar14
印尼政治人物职位标注数据集IndonesianPoliticianPositionTagging-cindysiregar14 数据来源:互联网公开数据 标签:政治人物, 职位标注, 自然语言处理, 文本分析, 命名实体识别, 印尼语, 数据标注, 语料库 数据概述:... -
用户意图识别文本数据集UserIntentRecognitionTextDataset-rayennacef
用户意图识别文本数据集UserIntentRecognitionTextDataset-rayennacef 数据来源:互联网公开数据 标签:意图识别, 文本分类, 自然语言处理, 对话分析, 机器学习, 语料库, 情感分析, 数据标注 数据概述: 该数据集包含来自用户对话的文本数据,记录了用户表达的意图。主要特征如下:...