-
大型语言模型检测结果数据集LLMDetectionResultDataset-umgeeyo
大型语言模型检测结果数据集LLMDetectionResultDataset-umgeeyo 数据来源:互联网公开数据 标签:语言模型,数据集,机器学习,自然语言处理,模型评估,人工智能,模型检测,技术评估 数据概述: 该数据集包含来自大型语言模型(LLM)的检测结果,记录了模型在自然语言处理任务中的表现和评估数据。主要特征如下:... -
社交媒体仇恨言论检测数据集HateSpeechDetectionDataset-subhajeetdas
社交媒体仇恨言论检测数据集HateSpeechDetectionDataset-subhajeetdas 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述: 该数据集包含了来自社交媒体平台的文本数据,并标注了是否包含仇恨言论。主要特征如下:... -
阿萨姆语女声语音数据集-miralmaradiya
阿萨姆语女声语音数据集-miralmaradiya 数据来源:互联网公开数据 标签:语音识别,数据集,语音合成,阿萨姆语,自然语言处理,声学模型,语言学,音频数据 数据概述:该数据集包含阿萨姆语女声的语音数据,记录了不同说话者朗读的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不确定,具体取决于数据集的构建时间。... -
国家数据科学挑战赛NDSC第一届数据集-christiandaomara
国家数据科学挑战赛NDSC第一届数据集-christiandaomara 数据来源:互联网公开数据 标签:数据科学,竞赛数据集,机器学习,文本分析,社交媒体,自然语言处理,情感分析,用户行为 数据概述: 该数据集是国家数据科学挑战赛(NDSC)第一届比赛所使用的数据集,主要包含社交媒体数据,用于多方面的分析和建模任务。主要特征如下:... -
新闻文章内容相似度分析矩阵数据集-manishkumar866115
新闻文章内容相似度分析矩阵数据集-manishkumar866115 数据来源:互联网公开数据 标签:新闻,文本分析,相似度,自然语言处理,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含新闻文章内容相似度分析矩阵数据,记录了不同新闻文章之间的相似度得分。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于新闻文章的发布时间。... -
密码破译数据集CipherDataset-tarunjaikumar
密码破译数据集CipherDataset-tarunjaikumar 数据来源:互联网公开数据 标签:密码学,数据集,文本分析,机器学习,自然语言处理,信息安全,密码破译,编码 数据概述: 该数据集包含用于密码破译的各种加密文本和相应的明文,用于研究和训练密码破译算法。主要特征如下: 时间跨度:数据涵盖了不同时期和类型的加密文本。... -
食品与健康数据分析集
标题:食品与健康数据分析集 数据来源:互联网公开数据 数据内容: 本数据集包含以下数据元素: 1. 食品名称(Title):记录了不同食品的名称。 2. 食材(Ingredients):列出了制作每道食品所需的食材。 3. 制作步骤(Instructions):详细描述了每道食品的制作过程。 4.... -
西班牙政治新闻数据集SpanishPoliticalNewsDataset-javierespaol
西班牙政治新闻数据集SpanishPoliticalNewsDataset-javierespaol 数据来源:互联网公开数据 标签:政治新闻,新闻分析,数据集,文本挖掘,自然语言处理,机器学习,舆情分析,社会科学 数据概述: 该数据集包含来自西班牙媒体的新闻报道,记录了与政治相关的事件和议题。主要特征如下:... -
音乐旋律与歌词数据集MelodiesandLyricsDataset-maorsagi
音乐旋律与歌词数据集MelodiesandLyricsDataset-maorsagi 数据来源:互联网公开数据 标签:音乐,歌词,数据集,自然语言处理,音频分析,文本分析,机器学习,音乐信息检索 数据概述: 该数据集包含音乐旋律和歌词数据,旨在用于音乐与歌词相关的研究和应用。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据集的构成。... -
自然语言处理文本转语音数据集NLP-TTSDataset-nimalesh
自然语言处理文本转语音数据集NLP-TTSDataset-nimalesh 数据来源:互联网公开数据 标签:自然语言处理,文本转语音,数据集,语音合成,深度学习,语音识别,人工智能,音频处理 数据概述: 该数据集包含用于训练和评估文本转语音(TTS)模型的数据,记录了文本与其对应的语音数据。主要特征如下:... -
法语电影评论及英译数据集
法语电影评论及英译数据集 数据来源:互联网公开数据 标签:电影评论,法语,情感分析,翻译,自然语言处理,文本数据,电影产业 数据概述: 本数据集包含从法国知名电影网站Allociné收集的法语电影评论及其英文翻译版本。原始数据由Théophile... -
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:... -
在线学校情感分析数据集Sentiment-Sekolah-OnlineDataset-agielasyari1
在线学校情感分析数据集Sentiment-Sekolah-OnlineDataset-agielasyari1 数据来源:互联网公开数据 标签:情感分析,在线教育,数据集,自然语言处理,文本挖掘,机器学习,教育技术,用户反馈 数据概述: 该数据集包含来自在线学校平台的用户评论和反馈数据,记录了学生对课程,教师和平台的情感态度。主要特征如下:... -
人群偏见检测与消除数据集CrowsPairsDNRTrain-TestDataset-danushkhanna
人群偏见检测与消除数据集CrowsPairsDNRTrain-TestDataset-danushkhanna 数据来源:互联网公开数据 标签:社会偏见,数据集,文本分析,自然语言处理,机器学习,社会研究,伦理研究,偏见检测 数据概述: 该数据集来自Crows... -
问答数据集涵盖广泛主题的高质量问答内容
标题:问答数据集涵盖广泛主题的高质量问答内容 数据内容:该数据集包含问答对的结构化信息,主要包括以下字段: - question:问题描述,包含3510种不同值 - answer:对应问题的答案,包含3512种不同值 - (未命名字段):3725种不同值,可能是问题类别或其他元数据 数据来源:互联网公开数据... -
意图分类数据集IntentClassificationDataset-sukuujodd
意图分类数据集IntentClassificationDataset-sukuujodd 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,机器学习,文本分类,智能客服,语音助手,人工智能 数据概述: 该数据集包含来自公开来源的文本数据,记录了用户输入的文本及其对应的意图标签。主要特征如下: 时间跨度:数据记录的时间范围从近年至今。... -
多领域问答数据集-包含4万条带上下文信息的数据集
多领域问答数据集-包含4万条带上下文信息的数据集 数据来源:互联网公开数据 标签:问答,上下文,多领域,文本数据,自然语言处理,机器学习,数据清洗,数据预处理 数据概述:... -
新闻深度处理数据集NewsDeepProcessedDataset-mario123475
新闻深度处理数据集NewsDeepProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻处理,深度学习,自然语言处理,文本分析,机器学习,数据集,信息提取,学术资源 数据概述: 该数据集包含来自互联网公开资源的新闻文章,经过深度处理,适用于自然语言处理任务,如文本分类,情感分析等。主要特征如下:... -
网络语言脏话数据集SwearTotalData-parkgarden
网络语言脏话数据集SwearTotalData-parkgarden 数据来源:互联网公开数据 标签:网络语言,脏话,文本分析,自然语言处理,数据集,社交媒体,文本挖掘,语言研究 数据概述:该数据集包含来自网络平台和社交媒体的脏话数据,记录了不同用户在各种网络场景下的脏话使用情况。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
基于ChatGPT的邮政编码生成数据集PostcodeGeneratorUsingChatGPTDataset-oladayoowoeye
基于ChatGPT的邮政编码生成数据集PostcodeGeneratorUsingChatGPTDataset-oladayoowoeye 数据来源:互联网公开数据 标签:邮政编码,数据生成,自然语言处理,人工智能,机器学习,数据集,文本生成,智能编码 数据概述:...