-
板球比赛场景解说映射数据集-aniketh12
板球比赛场景解说映射数据集-aniketh12 数据来源:互联网公开数据 标签:板球,比赛解说,数据集,自然语言处理,文本分析,机器学习,体育,数据挖掘 数据概述: 该数据集包含了板球比赛的场景描述及其对应的解说文本,旨在用于研究板球比赛的解说生成和理解。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了多个板球比赛季。... -
语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500
语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,语言模型,机器学习,人工智能,机器翻译,对话系统 数据概述: 该数据集包含来自Alpaca和FLAN语言模型的生成文本数据,记录了语言模型在多种任务中的文本生成结果。主要特征如下:... -
推特情感分析数据集TweetFullDatasetSentiment-misfyre
推特情感分析数据集TweetFullDatasetSentiment-misfyre 数据来源:互联网公开数据 标签:推特,情感分析,数据集,自然语言处理,机器学习,文本挖掘,社交媒体,情感分类 数据概述: 该数据集包含来自推特(Twitter)的推文数据,用于情感分析任务。主要特征如下:... -
社交多注释者标注的英文仇恨言论数据集
社交多注释者标注的英文仇恨言论数据集 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,情感分析,社会研究,机器学习,言论分析,多层次标注 数据集简介: 本数据集由 Kennedy... -
文章热度预测数据集DatasetforArticlePopularityPrediction-akalyasubramanian
文章热度预测数据集DatasetforArticlePopularityPrediction-akalyasubramanian 数据来源:互联网公开数据 标签:文章分析,热度预测,数据集,自然语言处理,机器学习,社交媒体,新闻传播,数据挖掘 数据概述: 该数据集包含来自互联网公开平台的文章数据,记录了各类文章的发布信息及热度指标。主要特征如下:... -
阿拉伯语方言数据集ArabiziDialectDataset-samawel97
阿拉伯语方言数据集ArabiziDialectDataset-samawel97 数据来源:互联网公开数据 标签:阿拉伯语,方言,语言学,数据集,文本分析,自然语言处理,机器学习,文化研究 数据概述:该数据集包含来自多个阿拉伯语国家和地区的信息,记录了阿拉伯语方言(Arabizi)的文本数据。主要特征如下:... -
葡萄酒评论数据集WineReviewsDataset-sailesh07
葡萄酒评论数据集WineReviewsDataset-sailesh07 数据来源:互联网公开数据 标签:葡萄酒,评论,数据集,品酒,消费者行为,市场分析,自然语言处理,葡萄酒文化 数据概述: 该数据集包含来自专业评论家对葡萄酒的评论数据,记录了不同葡萄酒的详细信息和评价。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含不同年份的葡萄酒。... -
大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks
大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,微调,文本生成,机器翻译,问答系统,深度学习 数据概述: 该数据集包含用于微调大规模语言模型的数据,涵盖了多种自然语言处理任务。主要特征如下:... -
英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal
英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal 数据来源:互联网公开数据 标签:机器翻译,英阿翻译,数据集,自然语言处理,文本分析,语言学,深度学习,NLP 数据概述: 该数据集包含英阿双语的翻译文本数据,记录了英语到阿拉伯语的翻译内容。主要特征如下: 时间跨度:... -
深度伪造与虚假信息数据集DeepfakeandMisinformationDataset-musabshaikh9029
深度伪造与虚假信息数据集DeepfakeandMisinformationDataset-musabshaikh9029 数据来源:互联网公开数据 标签:深度伪造,虚假信息,数据集,图像识别,自然语言处理,机器学习,内容分析,社交媒体 数据概述:... -
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26 数据来源:互联网公开数据 标签:语料库,词频分析,逆文档频率,自然语言处理,数据集,文本挖掘,机器学习,信息检索 数据概述:... -
自然语言处理仇恨言论检测数据集NLPHateSpeechDetectionDataset-dheerajpranav
自然语言处理仇恨言论检测数据集NLPHateSpeechDetectionDataset-dheerajpranav 数据来源:互联网公开数据 标签:自然语言处理,仇恨言论检测,文本分类,机器学习,社交媒体,情感分析,文本分析,NLP 数据概述: 该数据集包含来自社交媒体平台的文本数据,用于仇恨言论检测任务。主要特征如下:... -
机器翻译模型数据集TranslationModelDataset-osamaabobakr
机器翻译模型数据集TranslationModelDataset-osamaabobakr 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言模型,深度学习,人工智能,文本分析,多语言翻译 数据概述: 该数据集包含来自多个来源的多语言文本数据,用于训练和评估机器翻译模型。主要特征如下:... -
问答系统评估数据集Qwen-AnswersDataset-martintura
问答系统评估数据集Qwen-AnswersDataset-martintura 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,人工智能,知识图谱,信息检索,文本生成 数据概述: 该数据集包含来自问答系统Qwen的问答对数据,记录了用户提出的问题和系统生成的答案。主要特征如下:... -
音乐歌词数据集MusicLyricsDataset-jpscardoso
音乐歌词数据集MusicLyricsDataset-jpscardoso 数据来源:互联网公开数据 标签:音乐,歌词,数据集,文本分析,自然语言处理,情感分析,机器学习,文化研究 数据概述: 该数据集包含来自多个音乐平台和歌词库的音乐歌词数据,记录了不同风格,语言和时期的歌曲歌词。主要特征如下: 时间跨度:数据记录的时间范围从20世纪至今。... -
五轮权重训练数据集WeightsTrainedfor5EpochsDataset-karinana
五轮权重训练数据集WeightsTrainedfor5EpochsDataset-karinana 数据来源:互联网公开数据 标签:机器学习,数据集,权重,训练,深度学习,模型评估,计算机视觉,自然语言处理 数据概述: 该数据集包含了经过五轮训练的机器学习模型权重数据,记录了模型在训练过程中的优化结果。主要特征如下:... -
性别歧视与仇恨言论中文数据集SexismandHateSpeechinChineseDataset-charliegong
性别歧视与仇恨言论中文数据集SexismandHateSpeechinChineseDataset-charliegong 数据来源:互联网公开数据 标签:仇恨言论,性别歧视,数据集,自然语言处理,文本分类,情感分析,社会研究,机器学习 数据概述: 该数据集包含来自互联网公开平台上的中文文本数据,记录了包含性别歧视和仇恨言论的言论内容。主要特征如下:... -
AI开放学术挑战赛第二届数据集AIOpenAcademicChallenge2Dataset-justusilemobayo
AI开放学术挑战赛第二届数据集AIOpenAcademicChallenge2Dataset-justusilemobayo 数据来源:互联网公开数据 标签:学术研究,数据集,自然语言处理,文本分析,机器学习,情感分析,知识图谱,人工智能 数据概述: 该数据集是第二届AI开放学术挑战赛(AI Open Academic Challenge... -
电商平台商品描述数据集ProductDescriptionsDataset-anggidwifiani
电商平台商品描述数据集ProductDescriptionsDataset-anggidwifiani 数据来源:互联网公开数据 标签:电商,商品描述,数据集,自然语言处理,文本分析,机器学习,产品推荐,文本挖掘 数据概述: 该数据集包含来自电商平台的商品描述数据,记录了各种商品的详细信息,旨在用于文本分析,商品推荐等任务。主要特征如下:... -
文本情感分析数据集EmotionsinaTextDataset-emanchauhdary
文本情感分析数据集EmotionsinaTextDataset-emanchauhdary 数据来源:互联网公开数据 标签:情感分析,文本数据,自然语言处理,机器学习,情绪识别,文本分类,情感词典,人工智能 数据概述: 该数据集包含了从文本中提取的情感信息,用于情感分析和情绪识别任务。主要特征如下:...