-
多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang
多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,深度学习,语言模型,文本生成,人工智能 数据概述: 该数据集包含来自多种语言的数据,记录了用于机器翻译和语言模型训练的文本数据。主要特征如下:... -
新冠疫情推文情感分析数据集COVID-19TweetSentimentAnalysisDataset-fidelicajeanny
新冠疫情推文情感分析数据集COVID-19TweetSentimentAnalysisDataset-fidelicajeanny 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,公共卫生,数据挖掘,自然语言处理,疫情研究 数据概述:... -
孟加拉语新闻分类数据集BanglaNewsClassificationDataset-anikchandra70
孟加拉语新闻分类数据集BanglaNewsClassificationDataset-anikchandra70 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,语言处理,孟加拉语,分类算法 数据概述: 该数据集包含来自孟加拉语新闻网站的数据,记录了各类新闻文章的文本内容和分类标签。主要特征如下:... -
常识问答数据集CommonsenseQADataset-dschettler8845
常识问答数据集CommonsenseQADataset-dschettler8845 数据来源:互联网公开数据 标签:常识推理,问答,自然语言处理,机器学习,人工智能,知识图谱,语义理解,数据集 数据概述: 该数据集包含来自常识问答任务的数据,旨在评估模型对常识知识的理解和推理能力。主要特征如下:... -
推特社交媒体情感分析数据集TweetsAnalysisDataset-aswitharamasamy
推特社交媒体情感分析数据集TweetsAnalysisDataset-aswitharamasamy 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,文本挖掘,自然语言处理,机器学习,舆情分析,社交网络 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,用于情感分析和舆情分析研究。主要特征如下:... -
俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik
俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,风格分析,机器学习,语言研究,情感分析,多语言处理 数据概述: 该数据集包含来自俄罗斯互联网公开来源的文本数据,记录了不同风格和语境下的文本样本。主要特征如下:... -
文件词汇统计数据集WordsFileDataset-jordansiem
文件词汇统计数据集WordsFileDataset-jordansiem 数据来源:互联网公开数据 标签:文本分析,词汇统计,数据集,自然语言处理,数据挖掘,语言学,机器学习,教育研究 数据概述: 该数据集包含来自多个文本文件的数据,记录了不同文件中的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
抵制宝莱坞推特趋势数据集2023年
抵制宝莱坞推特趋势数据集2023年 数据来源:互联网公开数据 标签:抵制运动,宝莱坞,推特,自然语言处理,NLP,社交媒体分析,趋势研究 数据概述:... -
学术论文研究数据集ResearchPapersDataset-seemachavan
学术论文研究数据集ResearchPapersDataset-seemachavan 数据来源:互联网公开数据 标签:学术论文,数据集,文献分析,机器学习,自然语言处理,研究领域,学术资源,知识图谱 数据概述: 该数据集包含来自学术数据库的学术论文数据,记录了各类学术论文的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪至今。... -
孟加拉语情感语音识别数据集Ben10SmileBengaliAIREGBENASRSmileFeaturesDataset-sushmit0109
孟加拉语情感语音识别数据集Ben10SmileBengaliAIREGBENASRSmileFeaturesDataset-sushmit0109 数据来源:互联网公开数据 标签:语音识别,情感分析,孟加拉语,数据集,机器学习,音频处理,自然语言处理,人工智能... -
大规模多语种文本训练数据集ALL-MASCTrainDatasets-saeed1507100
大规模多语种文本训练数据集ALL-MASCTrainDatasets-saeed1507100 数据来源:互联网公开数据 标签:文本数据,多语种,自然语言处理,机器学习,语料库,文本分析,语言学,训练数据 数据概述: 该数据集包含大规模多语种文本训练数据,主要用于自然语言处理(NLP)模型的训练和评估。主要特征如下:... -
埃克曼情绪情感分析数据集Ekman-sEmotionsSentimentAnalysisDataset-mrsalty
埃克曼情绪情感分析数据集Ekman-sEmotionsSentimentAnalysisDataset-mrsalty 数据来源:互联网公开数据 标签:情感分析,情绪识别,数据集,文本挖掘,自然语言处理,心理学,机器学习,表情识别 数据概述: 该数据集基于埃克曼的情绪理论,包含了各种情绪相关的文本数据,用于情感分析和情绪识别任务。主要特征如下:... -
美式橄榄球联盟词云数据集NFLWordCloudDataset-julianmacnamara
美式橄榄球联盟词云数据集NFLWordCloudDataset-julianmacnamara 数据来源:互联网公开数据 标签:美式橄榄球,词云,数据集,体育分析,文本挖掘,自然语言处理,机器学习,社交媒体分析 数据概述:该数据集包含了美式橄榄球联盟(NFL)相关的文本数据,主要用于生成词云以直观展示与NFL相关的话题和关键词。主要特征如下:... -
推特新闻头条数据集TwitterNewsHeadlinesDataset-sruti002
推特新闻头条数据集TwitterNewsHeadlinesDataset-sruti002 数据来源:互联网公开数据 标签:推特,新闻头条,数据集,自然语言处理,文本分析,情感分析,社交媒体,舆情分析 数据概述: 该数据集包含来自推特平台的新闻头条数据,记录了用户分享的新闻链接和相关文本信息。主要特征如下:... -
新冠病毒推文数据集CoronavirusTweetsDataset-souren
新冠病毒推文数据集CoronavirusTweetsDataset-souren 数据来源:互联网公开数据 标签:新冠病毒,社交媒体,推文数据,疫情分析,公共卫生,自然语言处理,文本分析,社会影响 数据概述: 该数据集包含来自社交媒体平台的与新冠病毒相关的推文数据,记录了全球范围内公众对于新冠病毒疫情的关注和讨论。主要特征如下: 时间跨度:... -
句子类别分类数据集Kategori-KalimatSentenceClassificationDataset-brigitashoreacalista
句子类别分类数据集Kategori-KalimatSentenceClassificationDataset-brigitashoreacalista 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,语言模型,数据分析,人工智能,教育技术 数据概述:... -
女性服装评论数据集Women-sClothingReviewsDataset-preethampandiri
女性服装评论数据集Women-sClothingReviewsDataset-preethampandiri 数据来源:互联网公开数据 标签:服装,评论分析,数据集,消费者行为,自然语言处理,情感分析,电商,零售业 数据概述: 该数据集包含来自电商平台女性服装产品的用户评论数据,记录了消费者对服装产品的评价和反馈。主要特征如下:... -
数据2022年关于阿琼-特恩杜拉Tweets数据集2022TweetsonArjunTendulkarDataset-naveenkumar10m
2022年关于阿琼-特恩杜拉Tweets数据集2022TweetsonArjunTendulkarDataset-naveenkumar10m 数据来源:互联网公开数据 标签:社交媒体,推特,数据集,文本分析,情感分析,机器学习,自然语言处理,体育 数据概述: 该数据集包含来自推特平台的数据,记录了2022年关于阿琼·特恩杜拉的相关推文。主要特征如下:... -
加密提示数据集CipheredPromptsDataset-noob456
加密提示数据集CipheredPromptsDataset-noob456 数据来源:互联网公开数据 标签:数据集,密码学,文本处理,机器学习,自然语言处理,数据安全,提示工程,人工智能 数据概述:该数据集包含经过加密处理的文本提示数据,记录了多种加密算法下的提示信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
机器翻译与评测数据集WMTDataset-English-FrenchMachineTranslationEvaluationDataset-ramya1235
机器翻译与评测数据集WMTDataset-English-FrenchMachineTranslationEvaluationDataset-ramya1235 数据来源:互联网公开数据 标签:机器翻译,数据集,英语,法语,翻译评测,自然语言处理,文本生成,人工智能 数据概述: 该数据集来自WMT(Workshop on Machine...