-
技能映射数据集SkillMappingDataset-cyanblot
技能映射数据集SkillMappingDataset-cyanblot 数据来源:互联网公开数据 标签:技能,映射,数据集,知识图谱,自然语言处理,机器学习,职业发展,人才管理 数据概述: 该数据集包含有关技能与职业之间关系的数据,旨在帮助用户理解和分析不同技能在各种职业中的应用。主要特征如下:... -
文本生成预测数据集NextWordGenerateDataset-anirudhasutar
文本生成预测数据集NextWordGenerateDataset-anirudhasutar 数据来源:互联网公开数据 标签:文本生成,数据集,自然语言处理,机器学习,人工智能,语言模型,文本预测,深度学习 数据概述:该数据集包含用于文本生成预测的数据,记录了大量文本数据以训练和评估语言模型。主要特征如下:... -
总统演讲文本分析数据集PresidentSpeechTextAnalysisDataset-ahmetsinasoygan
总统演讲文本分析数据集PresidentSpeechTextAnalysisDataset-ahmetsinasoygan 数据来源:互联网公开数据 标签:政治,演讲,文本分析,自然语言处理,机器学习,数据挖掘,公共管理,社会科学 数据概述: 该数据集包含来自多个国家总统的演讲文本数据,记录了不同时期,不同场合的演讲内容。主要特征如下:... -
阿拉伯语新闻分类数据集-essasartawi
阿拉伯语新闻分类数据集-essasartawi 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,阿拉伯语处理,信息检索,文本挖掘 数据概述:该数据集包含来自阿拉伯语新闻媒体的新闻文章,旨在用于新闻分类任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
图卢维基百科数据转储2023年数据集-moreducks
图卢维基百科数据转储2023年数据集-moreducks 数据来源:互联网公开数据 标签:维基百科,数据集,自然语言处理,文本分析,机器学习,知识图谱,语言学,信息检索 数据概述: 该数据集包含来自图卢维基百科的2023年数据转储,记录了图卢维基百科上的文章内容和元数据。主要特征如下: 时间跨度:数据记录的时间范围从图卢维基百科创建到2023年。... -
恐怖小说作者识别数据集SpookyAuthorsCSVDataset-gdberrio
恐怖小说作者识别数据集SpookyAuthorsCSVDataset-gdberrio 数据来源:互联网公开数据 标签:文本分类,作者识别,数据集,机器学习,自然语言处理,文学分析,数据挖掘,人工智能 数据概述: 该数据集包含来自三位恐怖小说作家的文本数据,主要用于作者身份识别和文本分类任务。主要特征如下:... -
美国经济新闻数据集UnitedStatesEconomicNewsDataset-mohamedmustafashaban
美国经济新闻数据集UnitedStatesEconomicNewsDataset-mohamedmustafashaban 数据来源:互联网公开数据 标签:经济新闻,数据集,新闻分析,时间序列,机器学习,自然语言处理,财经研究,商业智能 数据概述:... -
恶意软件一元词数据集Malware1-gramSampleDataset-syira19
恶意软件一元词数据集Malware1-gramSampleDataset-syira19 数据来源:互联网公开数据 标签:恶意软件,数据集,一元词,文本分析,机器学习,安全研究,恶意代码检测,自然语言处理 数据概述: 该数据集包含恶意软件样本的一元词数据,用于恶意软件检测和分析。主要特征如下:... -
企业财报电话会议元数据数据集EarningsCallsCleanedMetadataDataset-ashwinm500
企业财报电话会议元数据数据集EarningsCallsCleanedMetadataDataset-ashwinm500 数据来源:互联网公开数据 标签:企业财报,电话会议,元数据,数据分析,商业智能,自然语言处理,金融分析,数据挖掘 数据概述: 该数据集包含来自各类企业的财报电话会议的元数据,记录了电话会议的关键信息。主要特征如下:... -
文本摘要任务数据集FinalTextSummarizationDataset-devtousif
文本摘要任务数据集FinalTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,深度学习,机器翻译,文本分析,人工智能,NLP 数据概述: 该数据集包含用于文本摘要任务的文本数据,旨在评估和训练文本摘要模型。主要特征如下:... -
客户编辑数据集Customer-EditedDataset-zoooooone
客户编辑数据集Customer-EditedDataset-zoooooone 数据来源:互联网公开数据 标签:客户反馈,数据集,编辑内容,用户生成,数据处理,自然语言处理,客户服务,数据挖掘 数据概述: 该数据集包含来自多个在线平台和服务的客户编辑内容,记录了用户对产品,服务或内容的修改和编辑信息。主要特征如下: 时间跨度:... -
国际会议论文引用网络数据集ConferencePaperCitationNetworkDataset-pranalisuryavanshi
国际会议论文引用网络数据集ConferencePaperCitationNetworkDataset-pranalisuryavanshi 数据来源:互联网公开数据 标签:论文引用,数据集,学术研究,文献计量学,网络分析,机器学习,自然语言处理,信息检索 数据概述:... -
呼叫中心通话记录数据集CallCentreDataset-jwilsh
呼叫中心通话记录数据集CallCentreDataset-jwilsh 数据来源:互联网公开数据 标签:呼叫中心,通话记录,文本分析,情感分析,自然语言处理,客户服务,机器学习,语音识别 数据概述: 该数据集包含来自呼叫中心的通话记录数据,记录了客户与客服之间的对话内容。主要特征如下:... -
教育领域知识嵌入与混合数据集EEDIEMBEDMIXSILVERV3Dataset-conjuring92
教育领域知识嵌入与混合数据集EEDIEMBEDMIXSILVERV3Dataset-conjuring92 数据来源:互联网公开数据 标签:教育技术,知识嵌入,混合数据集,机器学习,数据集,教育研究,深度学习,自然语言处理 数据概述: 该数据集由教育领域知识嵌入与混合项目(EEDI EMBED... -
内容推荐系统数据集Content-BasedRecommendationDataset-denizmac
内容推荐系统数据集Content-BasedRecommendationDataset-denizmac 数据来源:互联网公开数据 标签:推荐系统,内容推荐,数据集,机器学习,用户行为,文本分析,信息检索,自然语言处理 数据概述:该数据集包含来自多个来源的用户内容互动数据,记录了用户与内容项之间的交互信息。主要特征如下:... -
谣言识别与评估数据集RumourEval-NewDataset-latapangteyy
谣言识别与评估数据集RumourEval-NewDataset-latapangteyy 数据来源:互联网公开数据 标签:谣言识别,社交媒体,数据集,自然语言处理,文本分析,深度学习,信息传播,情感分析 数据概述:该数据集包含了来自社交媒体平台(如Twitter)的关于各种主题的谣言信息,旨在用于谣言的检测,评估和分析。主要特征如下:... -
土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin
土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻分析,数据集,自然语言处理,文本分类,机器学习,新闻媒体,土耳其,多语言 数据概述: 该数据集包含来自土耳其知名新闻媒体Son D News的新闻文章数据,记录了该媒体发布的新闻内容。主要特征如下:... -
电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-rohanroy1
电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-rohanroy1 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,机器学习,文本分类,数据集,情感倾向,电影行业 数据概述:该数据集包含来自互联网的电影评论数据,主要用于情感分析任务,旨在识别电影评论中的情感倾向。主要特征如下:... -
MTGA中文本地化数据集MTGAChineseLocalizationDataset-lieyanqzu
MTGA中文本地化数据集MTGAChineseLocalizationDataset-lieyanqzu 数据来源:互联网公开数据 标签:游戏本地化,中文翻译,数据集,机器学习,自然语言处理,游戏开发,数据标注,人工智能 数据概述: 该数据集包含来自《万智牌竞技场》(Magic: The Gathering... -
双子星长文本数据集GeminiLongContextDataset-akinduhiman
双子星长文本数据集GeminiLongContextDataset-akinduhiman 数据来源:互联网公开数据 标签:自然语言处理,长文本分析,数据集,机器学习,文本生成,语言模型,学术研究,人工智能 数据概述:该数据集包含来自双子星项目的长文本数据,记录了多种类型的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...