-
情感分析对话语句数据集SentimentAnalysisDialogueUtterances-yansuzs
情感分析对话语句数据集SentimentAnalysisDialogueUtterances-yansuzs 数据来源:互联网公开数据 标签:情感分析, 文本分类, 对话语句, 情绪识别, 标注数据, 自然语言处理, 机器学习, 语料库 数据概述: 该数据集包含来自对话场景的语句,记录了对话语句及其对应的情感标签。主要特征如下:... -
仇恨言论检测数据集HateSpeechDetectionDataset-hilloltabasshum
仇恨言论检测数据集HateSpeechDetectionDataset-hilloltabasshum 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 情感分析, 语言模型, 数据标注, 社交媒体, 机器学习, 语料库 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了用于检测仇恨言论的语句示例。主要特征如下:... -
乌尔都语罗马音情感分析数据集RomanUrduSentimentAnalysisDataset-mattut
乌尔都语罗马音情感分析数据集RomanUrduSentimentAnalysisDataset-mattut 数据来源:互联网公开数据 标签:情感分析,乌尔都语,罗马音,文本情感,自然语言处理,情感分类,社交媒体,语料库 数据概述: 该数据集包含来自社交媒体平台的乌尔都语罗马音文本数据,记录了用户评论及其对应的情感极性。主要特征如下:... -
命名实体识别文本标注数据集NamedEntityRecognitionTextAnnotationDataset-terencenlp
命名实体识别文本标注数据集NamedEntityRecognitionTextAnnotationDataset-terencenlp 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 数据集, 机器学习, 实体识别, 语料库, 中文 数据概述:... -
多语言平行文本翻译数据集MultilingualParallelTextTranslationDataset-rookiejing
多语言平行文本翻译数据集MultilingualParallelTextTranslationDataset-rookiejing 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 多语言, 英语, 阿姆哈拉语, 马拉地语, 泰卢固语, 语料库, 自然语言处理, 语言学 数据概述:... -
波斯语情感分析文本数据集PersianSentimentAnalysisTextDataset-cdgfrm
波斯语情感分析文本数据集PersianSentimentAnalysisTextDataset-cdgfrm 数据来源:互联网公开数据 标签:情感分析, 波斯语, 文本分类, 情感标注, 机器学习, 自然语言处理, 语料库, 多分类 数据概述: 该数据集包含来自社交媒体和在线评论的波斯语文本,记录了用户对不同内容的观点和情感倾向。主要特征如下:... -
命名实体识别文本标注数据集NamedEntityRecognitionTextAnnotationDataset-muhamadnady
命名实体识别文本标注数据集NamedEntityRecognitionTextAnnotationDataset-muhamadnady 数据来源:互联网公开数据 标签:命名实体识别, 文本标注, 自然语言处理, 序列标注, 词性标注, 语料库, 机器学习, 实体识别 数据概述:... -
哈利波特电影角色对话数据集HarryPotterMovieDialogueDataset-cocwithme
哈利波特电影角色对话数据集HarryPotterMovieDialogueDataset-cocwithme 数据来源:互联网公开数据 标签:电影剧本, 文本分析, 角色对话, 自然语言处理, 语料库, 数据标注, 情感分析, 文本挖掘 数据概述: 该数据集包含来自《哈利·波特》系列电影的对话数据,记录了电影中不同角色的对白内容。主要特征如下:... -
特朗普演讲文本内容分析数据集TrumpSpeechTextAnalysis-llamacomma
特朗普演讲文本内容分析数据集TrumpSpeechTextAnalysis-llamacomma 数据来源:互联网公开数据 标签:特朗普, 演讲文本, 自然语言处理, 文本分析, 政治人物, 语料库, 情感分析, 文本挖掘 数据概述: 该数据集包含来自公开渠道的特朗普演讲文本,记录了其在不同场合发表的演讲内容。主要特征如下:... -
英语-泰米尔语翻译数据集English-TamilTranslationDataset-kamal2026
英语-泰米尔语翻译数据集English-TamilTranslationDataset-kamal2026 数据来源:互联网公开数据 标签:机器翻译, 语言学, 泰米尔语, 英语, 文本翻译, 自然语言处理, 双语对照, 语料库 数据概述: 该数据集包含英语与泰米尔语的翻译对照,旨在为机器翻译模型提供训练数据。主要特征如下:... -
文本情感分析情绪标注数据集TextSentimentAnalysisEmotionLabelingDataset-emilyzairi
文本情感分析情绪标注数据集TextSentimentAnalysisEmotionLabelingDataset-emilyzairi 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情绪识别, 自然语言处理, 数据标注, 机器学习, 情感词典, 语料库 数据概述:... -
印度总理-曼德-基-巴特-广播节目文本数据集IndianPrimeMinisterMannKiBaatBroadcastText-alphamuth
印度总理-曼德-基-巴特-广播节目文本数据集IndianPrimeMinisterMannKiBaatBroadcastText-alphamuth 数据来源:互联网公开数据 标签:政治, 广播, 文本分析, 印度, 公共演讲, 语料库, 社交媒体, 语言学 数据概述: 该数据集包含印度总理“曼德·基·巴特”(Mann Ki... -
阿拉伯语讽刺文本分类数据集ArabicSatireNon-satireTextClassificationDataset-rinenami
阿拉伯语讽刺文本分类数据集ArabicSatireNon-satireTextClassificationDataset-rinenami 数据来源:互联网公开数据 标签:文本分类, 阿拉伯语, 讽刺, 非讽刺, 自然语言处理, 情感分析, 语料库, 机器学习 数据概述:... -
文本可读性评估数据集TextReadabilityEvaluationDataset-yinhuhumin
文本可读性评估数据集TextReadabilityEvaluationDataset-yinhuhumin 数据来源:互联网公开数据 标签:文本分析, 可读性, 自然语言处理, 文本特征, 语料库, 机器学习, 阅读难度, 文本评估 数据概述: 该数据集包含经过处理的文本数据,记录了多种文本可读性评估指标。主要特征如下:... -
实体识别与链接训练数据集EntityRecognitionandLinkingTrainingDataset-dngfra
实体识别与链接训练数据集EntityRecognitionandLinkingTrainingDataset-dngfra 数据来源:互联网公开数据 标签:实体识别, 命名实体识别, 实体链接, 自然语言处理, 文本标注, 机器学习, 知识图谱, 语料库 数据概述:... -
法律文本改写训练数据集LegalTextRewritingTrainingDataset-wenzhengcai
法律文本改写训练数据集LegalTextRewritingTrainingDataset-wenzhengcai 数据来源:互联网公开数据 标签:法律文本, 文本改写, 自然语言处理, 法律分析, 文本生成, 机器翻译, 数据集构建, 语料库 数据概述: 该数据集包含法律案例的原文文本,以及根据特定提示改写后的文本。主要特征如下:... -
文学作品作者与文本内容数据集LiteraryWorksAuthorandTextContent-saptarshi45
文学作品作者与文本内容数据集LiteraryWorksAuthorandTextContent-saptarshi45 数据来源:互联网公开数据 标签:文学作品, 作者, 文本分析, 自然语言处理, 语料库, 文本挖掘, 情感分析, 语言模型 数据概述: 该数据集包含来自文学作品的作者及其对应的文本内容。主要特征如下:... -
阿拉伯新闻文本分类数据集ArabicNewsTextClassificationDataset-meshaalalharthy
阿拉伯新闻文本分类数据集ArabicNewsTextClassificationDataset-meshaalalharthy 数据来源:互联网公开数据 标签:阿拉伯语新闻, 文本分类, 自然语言处理, 新闻主题, 语料库, 机器学习, 情感分析, 文本挖掘 数据概述:... -
赌博成瘾研究文章数据集GamblingAddictionResearchArticles-pratt3000
赌博成瘾研究文章数据集GamblingAddictionResearchArticles-pratt3000 数据来源:互联网公开数据 标签:赌博成瘾, 行为心理学, 文本分析, 自然语言处理, 语料库, 公共健康, 机器学习, 研究文章 数据概述: 该数据集包含来自公开渠道的文章,记录了关于赌博成瘾的研究内容。主要特征如下:... -
多语言语音转录时长数据集MultilingualSpeechTranscriptionDurationDataset-max164
多语言语音转录时长数据集MultilingualSpeechTranscriptionDurationDataset-max164 数据来源:互联网公开数据 标签:语音识别, 语音转录, 多语言, 时长分析, 文本分析, 语料库, 语音数据, 机器学习 数据概述:...