-
MBTI人格类型与恋爱主题文本数据集-yamaerenay
MBTI人格类型与恋爱主题文本数据集-yamaerenay 数据来源:互联网公开数据 标签:MBTI,人格类型,恋爱,文本分析,NLP,分类,关键词提取,Enneagram,心理学 数据概述:... -
美国国家公共电台新闻数据集NPRNewsDataset-gauravduttakiit
美国国家公共电台新闻数据集NPRNewsDataset-gauravduttakiit 数据来源:互联网公开数据 标签:新闻数据,数据集,自然语言处理,文本分析,机器学习,新闻学,媒体研究,社会研究 数据概述:该数据集包含来自美国国家公共电台(NPR)的新闻数据,记录了NPR发布的新闻文章和广播节目的详细信息。主要特征如下:... -
印地语-英语截断语料库数据集Hindi-EnglishTruncatedCorpusDataset-kalyanitewari
印地语-英语截断语料库数据集Hindi-EnglishTruncatedCorpusDataset-kalyanitewari 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,双语语料,文本分析,计算机科学,多语言处理 数据概述:... -
欺诈邮件内容数据集FraudulentEmailBodiesDataset-azunre
欺诈邮件内容数据集FraudulentEmailBodiesDataset-azunre 数据来源:互联网公开数据 标签:网络安全,欺诈检测,数据集,文本分析,机器学习,自然语言处理,邮件安全,异常检测 数据概述: 该数据集包含来自公开来源的欺诈邮件内容数据,记录了各类欺诈邮件的文本信息。主要特征如下:... -
金融交易与自然语言处理情绪分析数据集TradingDataSetUsingNLPSentiment-panchacookie
金融交易与自然语言处理情绪分析数据集TradingDataSetUsingNLPSentiment-panchacookie 数据来源:互联网公开数据 标签:金融交易,自然语言处理,情绪分析,数据集,股票市场,机器学习,文本分析,经济研究 数据概述: 该数据集包含来自金融市场的交易数据,结合了自然语言处理技术对相关文本的情绪分析。主要特征如下:... -
乌克兰危机背景下法国政治言论数据集Ukraine-FrenchCrisisPoliticalDiscourseDataset-khemkhammohamed
乌克兰危机背景下法国政治言论数据集Ukraine-FrenchCrisisPoliticalDiscourseDataset-khemkhammohamed 数据来源:互联网公开数据 标签:乌克兰危机,法国,政治言论,文本分析,情感分析,舆情分析,自然语言处理,国际关系 数据概述:... -
英语词汇频率统计数据集WordsCSVDataset-jasperbutcher
英语词汇频率统计数据集WordsCSVDataset-jasperbutcher 数据来源:互联网公开数据 标签:自然语言处理,文本分析,词频统计,数据集,语言学,词汇学习,机器学习,统计分析 数据概述: 该数据集包含了来自互联网的大量文本数据,记录了英语词汇的出现频率。主要特征如下:... -
阿拉伯诗歌韵律模式数据集ArabicPoemPatternDataset-m7mdalbaddawi
阿拉伯诗歌韵律模式数据集ArabicPoemPatternDataset-m7mdalbaddawi 数据来源:互联网公开数据 标签:诗歌,韵律,阿拉伯文学,数据集,语言研究,文本分析,文化研究,机器学习 数据概述: 该数据集包含来自阿拉伯文学领域的诗歌韵律数据,记录了阿拉伯诗歌的韵律模式,结构和风格特征。主要特征如下:... -
StackOverflow问答数据集StackOverflowQuestionsDataset-sukuzhanay
StackOverflow问答数据集StackOverflowQuestionsDataset-sukuzhanay 数据来源:互联网公开数据 标签:问答系统,编程,数据集,自然语言处理,文本分析,机器学习,开发者社区,数据挖掘 数据概述:该数据集包含来自 Stack Overflow... -
歌曲创作与语言分析平台歌词数据集
歌曲创作与语言分析平台歌词数据集 数据来源:互联网公开数据 标签:歌词,音乐,歌曲,语言,文本分析,自然语言处理,创作,文化,流派 数据概述:... -
Reddit短内容数据集RedditShortDataset-swathikone
Reddit短内容数据集RedditShortDataset-swathikone 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,情感分析,机器学习,自然语言处理,网络行为,内容分类 数据概述:该数据集包含来自Reddit平台的短内容数据,记录了用户发布在各个板块的简短文本信息。主要特征如下:... -
arXiv论文摘要数据集FDL-Arxiv-FinalDataset-alssioalfonso
arXiv论文摘要数据集FDL-Arxiv-FinalDataset-alssioalfonso 数据来源:互联网公开数据 标签:自然语言处理,机器学习,论文摘要,文本分析,数据集,学术研究,论文推荐,深度学习 数据概述: 该数据集包含来自arXiv(预印本服务器)的论文摘要数据,主要用于自然语言处理,机器学习等相关研究。主要特征如下:... -
今日俄罗斯新闻Telegram频道头条新闻数据集-2013年至2023年12月22日-goshaserbin
今日俄罗斯新闻Telegram频道头条新闻数据集-2013年至2023年12月22日-goshaserbin 数据来源:互联网公开数据 标签:俄罗斯,新闻,Telegram,头条新闻,政治,社会,国际关系,媒体,时间序列,文本分析 数据概述: 本数据集收录了今日俄罗斯(RT, Russia... -
金融新闻情感分析数据集EliciaNewsFinBERTDataset-a0204261w
金融新闻情感分析数据集EliciaNewsFinBERTDataset-a0204261w 数据来源:互联网公开数据 标签:金融新闻,情感分析,自然语言处理,数据集,机器学习,文本分析,金融科技,新闻媒体 数据概述: 该数据集包含来自Elicia新闻的金融新闻数据,记录了新闻文章及其对应的情感标签。主要特征如下:... -
欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar
欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar 数据来源:互联网公开数据 标签:语言处理,数据集,自然语言,机器学习,文本分析,意大利语,代词研究,多语言 数据概述: 该数据集来源于欧洲议会会议记录,专注于意大利语中的代词使用情况。主要特征如下:... -
美国和加州立法提案摘要数据集-undersc0re
美国和加州立法提案摘要数据集-undersc0re 数据来源:互联网公开数据 标签:立法,提案,摘要,文本分析,自然语言处理,美国,加州,法律,文本长度 数据概述: 本数据集包含了美国联邦立法提案和加州立法提案的摘要信息,总计超过23000条记录。数据分为训练集(train)、加州测试集(ca_test)和测试集(test)三个部分。... -
欺凌事件标注数据集2018年-felicitaarcadia
欺凌事件标注数据集2018年-felicitaarcadia 数据来源:互联网公开数据 标签:欺凌,校园欺凌,数据集,文本分析,自然语言处理,情感分析,社会学,教育 数据概述: 该数据集包含2018年收集的欺凌事件相关文本数据,记录了各种形式的欺凌行为描述。主要特征如下: 时间跨度:数据记录的时间范围为2018年。... -
国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn
国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn 数据来源:互联网公开数据 标签:法律文本,信息检索,图卷积网络,数据集,自然语言处理,机器学习,法律科技,文本分析 数据概述: 该数据集来源于国际法律信息检索竞赛(COLIEE... -
推特社交平台网络欺凌数据集TwitterCyberbullyingDataset-saitejave
推特社交平台网络欺凌数据集TwitterCyberbullyingDataset-saitejave 数据来源:互联网公开数据 标签:社交媒体,网络欺凌,数据集,文本分析,情感分析,自然语言处理,机器学习,社会学 数据概述:... -
孟加拉电子产品分词数据集BanglaElectronicsLemmatizedFinalDataset-nirajmahi
孟加拉电子产品分词数据集BanglaElectronicsLemmatizedFinalDataset-nirajmahi 数据来源:互联网公开数据 标签:电子产品,数据集,分词,自然语言处理,机器学习,文本分析,语言学,数据挖掘 数据概述: 该数据集包含来自孟加拉国电子产品领域的分词数据,记录了电子产品相关的文本信息。主要特征如下:...