-
kompas-articles-full-text-category-link-time数据集Kompas新闻文章全文本分类链接时间数据集-yusriyahim
kompas-articles-full-text-category-link-time数据集Kompas新闻文章全文本分类链接时间数据集-yusriyahim 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,分类,机器学习,自然语言处理,媒体研究,时间序列 数据概述:... -
查询语句数据集QueryCSVDataset-moustaphaayinlasanni
查询语句数据集QueryCSVDataset-moustaphaayinlasanni 数据来源:互联网公开数据 标签:查询语句,CSV,数据集,数据分析,自然语言处理,文本挖掘,机器学习,数据科学 数据概述:该数据集包含来自各种来源的查询语句,记录了用户输入的文本查询。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于数据集的来源和更新频率。... -
Linux系统英文单词数据集LinuxWordsDataset-durrivedfunktor
Linux系统英文单词数据集LinuxWordsDataset-durrivedfunktor 数据来源:互联网公开数据 标签:计算机科学,数据集,文本分析,英文单词,操作系统,软件工程,自然语言处理,信息检索 数据概述: 该数据集包含来自 Linux 系统的英文单词列表,记录了 Linux 操作系统中所包含的常用英文单词。主要特征如下:... -
相机负面评价数据集CameraNegativeReviewsDataset-agalya26
相机负面评价数据集CameraNegativeReviewsDataset-agalya26 数据来源:互联网公开数据 标签:相机, 评价, 数据集, 消费者反馈, 自然语言处理, 情感分析, 产品评价, 用户体验 数据概述: 该数据集包含来自互联网上的相机负面评价数据,记录了用户对相机产品的不满意反馈。主要特征如下:... -
手表评分与评论数据集WatchesRatingandCommentsDatasetforNLP-harishshivaramappa
手表评分与评论数据集WatchesRatingandCommentsDatasetforNLP-harishshivaramappa 数据来源:互联网公开数据 标签:自然语言处理,数据集,评论分析,评分预测,文本挖掘,情感分析,消费者行为,产品评论 数据概述:... -
孟加拉语虚假新闻数据集
孟加拉语虚假新闻数据集 数据来源:互联网公开数据 标签:孟加拉语,虚假新闻检测,自然语言处理,数据分类,机器学习,低资源语言,信息真实性评估 数据概述:... -
商品类别预测NLP应用数据集NLPforPredictingCategoriesofItemsDataset-shivam1298
商品类别预测NLP应用数据集NLPforPredictingCategoriesofItemsDataset-shivam1298 数据来源:互联网公开数据 标签:自然语言处理,商品分类,数据集,文本分析,机器学习,零售业,人工智能,数据挖掘 数据概述:... -
英语-印地语翻译训练数据集English-HindiTranslationTrainingDataset-jaydee29
英语-印地语翻译训练数据集English-HindiTranslationTrainingDataset-jaydee29 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,语言技术,翻译模型,人工智能,语言学习 数据概述:该数据集包含英语到印地语的平行语料,主要用于机器翻译模型的训练和评估。主要特征如下:... -
印尼虚假新闻数据集HoaxNewsIndonesiaDataset-vijayandika
印尼虚假新闻数据集HoaxNewsIndonesiaDataset-vijayandika 数据来源:互联网公开数据 标签:虚假新闻,谣言,印尼,新闻分析,文本挖掘,自然语言处理,社交媒体,舆情分析 数据概述: 该数据集包含了来自印尼社交媒体和新闻网站的虚假新闻数据,旨在用于虚假新闻检测和分析。主要特征如下:... -
-
-
大规模LLM提示语料库数据集LargeLanguageModelPromptCorpusDataset-mrt0933
大规模LLM提示语料库数据集LargeLanguageModelPromptCorpusDataset-mrt0933 数据来源:互联网公开数据 标签:自然语言处理,LLM,提示词,数据集,文本生成,人工智能,机器学习,语料库,Prompt 数据概述:... -
土耳其TRT新闻文化艺术新闻数据集TRTHaberKültürSanatDataset-denizhanahin
土耳其TRT新闻文化艺术新闻数据集TRTHaberKültürSanatDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻,文化,艺术,土耳其,文本分析,自然语言处理,舆情分析,数据集 数据概述: 该数据集包含来自土耳其国家广播电视台TRT Haber的文化艺术新闻数据,记录了TRT... -
阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled
阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled 数据来源:互联网公开数据 标签:问答系统,自然语言处理,阿拉伯语,数据集,文本分析,信息检索,机器学习,语言学 数据概述: 该数据集收录了阿拉伯语维基百科中的问答对,旨在促进阿拉伯语问答系统的研究和开发。主要特征如下:... -
推特灾害预测数据集TwitterDisasterPredictionDataset-ghanender
推特灾害预测数据集TwitterDisasterPredictionDataset-ghanender 数据来源:互联网公开数据 标签:社交媒体,灾害预测,数据集,机器学习,自然语言处理,文本分类,数据挖掘,突发事件 数据概述: 该数据集包含来自推特(Twitter)平台的数据,记录了用户发布的与灾害相关的推文。主要特征如下:... -
音乐生成MIDI音符数据集MIDITokenizedDataset-shusrith
音乐生成MIDI音符数据集MIDITokenizedDataset-shusrith 数据来源:互联网公开数据 标签:音乐生成,MIDI,数据集,自然语言处理,深度学习,音乐信息检索,序列建模,音频分析 数据概述: 该数据集包含了经过token化处理的MIDI音乐数据,旨在用于音乐生成模型的训练和评估。主要特征如下: 时间跨度:... -
文本分类训练数据集CorpusCategoriasTreino-brunocomitre
文本分类训练数据集CorpusCategoriasTreino-brunocomitre 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,分类任务,文本分析,葡萄牙语,训练集 数据概述: 该数据集包含了用于文本分类任务的葡萄牙语文本数据。主要特征如下: 时间跨度:数据未明确标注具体时间范围,但主要包含当代文本。... -
抑郁症分析数据集DepressionDataset-ahmedshaheen1999
抑郁症分析数据集DepressionDataset-ahmedshaheen1999 数据来源:互联网公开数据 标签:抑郁症,心理健康,数据集,情绪分析,自然语言处理,文本挖掘,医学,社交媒体 数据概述:该数据集包含来自Dr. Shaheen的关于抑郁症的数据,记录了与抑郁症相关的文本信息。主要特征如下:... -
政府机构社交媒体数据分析数据集GovernmentOrganizationsSocialMediaDataAnalysisDataset-danielhain
政府机构社交媒体数据分析数据集GovernmentOrganizationsSocialMediaDataAnalysisDataset-danielhain 数据来源:互联网公开数据 标签:社交媒体,政府机构,数据分析,文本挖掘,情感分析,舆情监测,公共管理,自然语言处理 数据概述:... -
政治评论文本情感分析数据集PoliticalCommentsSentimentAnalysisDataset-mdrahitazim
政治评论文本情感分析数据集PoliticalCommentsSentimentAnalysisDataset-mdrahitazim 数据来源:互联网公开数据 标签:政治评论,情感分析,自然语言处理,数据集,文本挖掘,机器学习,舆情分析,社会科学 数据概述: 该数据集包含了来自互联网的政治评论文本数据,主要用于情感分析研究。主要特征如下: 时间跨度:...