-
多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0
多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0 数据来源:互联网公开数据 标签:文档标识, 多语言, 文本数据, 语料库, 语言识别, 数据清洗, 信息检索, 机器翻译 数据概述: 该数据集包含来自不同语言的文档标识符,记录了多种语言文档的唯一编号。主要特征如下:... -
电影对话情感分析数据集MovieDialogueSentimentAnalysis-avizyt
电影对话情感分析数据集MovieDialogueSentimentAnalysis-avizyt 数据来源:互联网公开数据 标签:电影,对话,情感分析,自然语言处理,文本数据,情感分类,对话分析,语料库 数据概述: 该数据集包含来自电影的对话数据,记录了电影中的人物对话内容。主要特征如下: 时间跨度:数据未标明具体时间,视作静态语料数据集使用。... -
文本指令生成与风格转换数据集TextInstructionGenerationandStyleTransfer-yuanzhezhou
文本指令生成与风格转换数据集TextInstructionGenerationandStyleTransfer-yuanzhezhou 数据来源:互联网公开数据 标签:文本生成, 风格迁移, 指令学习, 自然语言处理, 文本处理, 数据标注, 深度学习, 语料库 数据概述:... -
教育文本文档命名实体识别数据集EducationTextDocumentNamedEntityRecognition-tosanwiarramdhani
教育文本文档命名实体识别数据集EducationTextDocumentNamedEntityRecognition-tosanwiarramdhani 数据来源:互联网公开数据 标签:命名实体识别, 文本标注, 教育, 文本分类, 文本处理, 自然语言处理, 机器学习, 语料库 数据概述:... -
通用主题讨论文本分类数据集GeneralTopicDiscussionTextClassificationDataset-meefr25
通用主题讨论文本分类数据集GeneralTopicDiscussionTextClassificationDataset-meefr25 数据来源:互联网公开数据 标签:文本分类, 讨论主题, 自然语言处理, 机器学习, 情感分析, 语料库, 数据标注, 话题识别 数据概述:... -
文本相似度训练数据集TextSimilarityTrainingDataset-krilin
文本相似度训练数据集TextSimilarityTrainingDataset-krilin 数据来源:互联网公开数据 标签:文本相似度, 机器翻译, 文本匹配, 自然语言处理, 语料库, 文本分析, 语言模型, 相似度评估 数据概述: 该数据集包含来自互联网的文本数据,记录了用于训练文本相似度模型的语料。主要特征如下:... -
词汇语义关联分析数据集LexicalSemanticAssociationAnalysis-murtadhayaseen
词汇语义关联分析数据集LexicalSemanticAssociationAnalysis-murtadhayaseen 数据来源:互联网公开数据 标签:词汇关联, 语义分析, 文本挖掘, 自然语言处理, 语料库, 词向量, 文本特征提取, 数据清洗 数据概述: 该数据集包含从多个来源收集的词汇数据,记录了词汇之间的语义关联信息。主要特征如下:... -
印尼政治人物职位标注数据集IndonesianPoliticianPositionTagging-cindysiregar14
印尼政治人物职位标注数据集IndonesianPoliticianPositionTagging-cindysiregar14 数据来源:互联网公开数据 标签:政治人物, 职位标注, 自然语言处理, 文本分析, 命名实体识别, 印尼语, 数据标注, 语料库 数据概述:... -
用户意图识别文本数据集UserIntentRecognitionTextDataset-rayennacef
用户意图识别文本数据集UserIntentRecognitionTextDataset-rayennacef 数据来源:互联网公开数据 标签:意图识别, 文本分类, 自然语言处理, 对话分析, 机器学习, 语料库, 情感分析, 数据标注 数据概述: 该数据集包含来自用户对话的文本数据,记录了用户表达的意图。主要特征如下:... -
印度新闻广播印地语语音转录文本数据集IndianNewsBroadcastHindiSpeechTranscriptDataset-pranav51286
印度新闻广播印地语语音转录文本数据集IndianNewsBroadcastHindiSpeechTranscriptDataset-pranav51286 数据来源:互联网公开数据 标签:语音识别, 文本转录, 印地语, 新闻广播, 语言学, 声音数据, 机器翻译, 语料库 数据概述:... -
电影钢铁侠角色对话数据集Movie-IronMan-CharacterDialogue-prprakash02
电影钢铁侠角色对话数据集Movie-IronMan-CharacterDialogue-prprakash02 数据来源:互联网公开数据 标签:电影,剧本,对话,角色,文本分析,自然语言处理,钢铁侠,语料库 数据概述: 该数据集包含电影《钢铁侠》中的角色对话文本,记录了不同角色在电影中的对白内容。主要特征如下:... -
阿拉伯语文本情感分析数据集ArabicTextSentimentAnalysisDataset-imeneamyy
阿拉伯语文本情感分析数据集ArabicTextSentimentAnalysisDataset-imeneamyy 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 自然语言处理, 情感极性, 语料库, 机器学习, 语言学 数据概述: 该数据集包含阿拉伯语文本数据,记录了文本的情感倾向。主要特征如下:... -
日常对话情感识别数据集DailyDialogueEmotionRecognitionDataset-va6573
日常对话情感识别数据集DailyDialogueEmotionRecognitionDataset-va6573 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 对话系统, 情感识别, 机器学习, 语料库, 情感标注 数据概述: 该数据集包含来自日常对话的数据,记录了对话文本及其对应的情感标签。主要特征如下:... -
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-barunikarthika
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-barunikarthika 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 情感分析, 机器学习, 自然语言处理, 语料库, 数据标注, 社交媒体 数据概述: 该数据集包含来自社交媒体的文本数据,记录了用于识别仇恨言论的样本。主要特征如下:... -
文本聚类分析K-Means数据集TextClusteringAnalysisK-MeansDataset-amitgayar
文本聚类分析K-Means数据集TextClusteringAnalysisK-MeansDataset-amitgayar 数据来源:互联网公开数据 标签:文本聚类, K-Means, 词频统计, 自然语言处理, 数据清洗, 文本分析, 机器学习, 语料库 数据概述:... -
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru 数据来源:互联网公开数据 标签:机器翻译, 语料库, 双语对照, 自然语言处理, 语言学, 文本数据, 英语, 马拉雅拉姆语 数据概述: 该数据集包含英语和马拉雅拉姆语的平行文本,用于机器翻译和跨语言分析。主要特征如下:... -
阿拉伯语文本转写与标注数据集ArabicTextTranscriptionandAnnotation-mariamfaroukgadalla
阿拉伯语文本转写与标注数据集ArabicTextTranscriptionandAnnotation-mariamfaroukgadalla 数据来源:互联网公开数据 标签:阿拉伯语,文本转录,语音识别,自然语言处理,文本标注,语言学,语料库,数据清洗 数据概述:... -
文学作品作者识别数据集LiteraryWorksAuthorIdentification-lohitashwavaswani
文学作品作者识别数据集LiteraryWorksAuthorIdentification-lohitashwavaswani 数据来源:互联网公开数据 标签:文本分析, 作者识别, 自然语言处理, 文本分类, 文学作品, 数据集构建, 机器学习, 语料库 数据概述:... -
政治新闻文本数据集PoliticalNewsTextDataset-nekuitiefangbiediant
政治新闻文本数据集PoliticalNewsTextDataset-nekuitiefangbiediant 数据来源:互联网公开数据 标签:政治, 新闻, 文本, 语料库, 自然语言处理, 文本分析, 政治评论, 数据清洗 数据概述: 该数据集包含从Wikinews收集的政治新闻文本,主要记录了政治相关的新闻报道和评论文章。主要特征如下:... -
多语言社交媒体内容分析数据集MultilingualSocialMediaContentAnalysisDataset-zakubovich
多语言社交媒体内容分析数据集MultilingualSocialMediaContentAnalysisDataset-zakubovich 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 多语言, 内容分类, 情感分析, 机器翻译, 数据清洗, 语料库 数据概述:...