-
阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21
阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21 数据来源:互联网公开数据 标签:语言学研究,代码切换,数据集,自然语言处理,双语处理,机器学习,文本分析,语言模型 数据概述:... -
词义消歧数据集WSDData-abdelrahmanelbakouri
词义消歧数据集WSDData-abdelrahmanelbakouri 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,数据集,语义分析,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含了用于词义消歧(Word Sense Disambiguation,... -
推特情感分析阿尔巴尼亚数据集TweetSentimentAnalysisAlbaniaDataset-itoeiji
推特情感分析阿尔巴尼亚数据集TweetSentimentAnalysisAlbaniaDataset-itoeiji 数据来源:互联网公开数据 标签:推特,情感分析,阿尔巴尼亚,社交媒体,NLP,自然语言处理,文本分析,数据集 数据概述: 该数据集包含了来自阿尔巴尼亚地区的推特数据,主要用于情感分析研究。主要特征如下:... -
医疗会议情绪分析数据集MedicalConferenceSentimentAnalysisDataset-vinjamuripavan
医疗会议情绪分析数据集MedicalConferenceSentimentAnalysisDataset-vinjamuripavan 数据来源:互联网公开数据 标签:情绪分析,医疗会议,数据集,自然语言处理,文本分析,医疗研究,机器学习,情感识别 数据概述:... -
代码托管平台源代码词汇特征数据集-nompamh
代码托管平台源代码词汇特征数据集-nompamh 数据来源:互联网公开数据 标签:源代码,词汇特征,自然语言处理,机器学习,代码分析,软件工程,数据集,文本分析 数据概述: 该数据集包含来自代码托管平台(如GitHub)的源代码数据,记录了源代码的词汇特征信息。主要特征如下: 时间跨度:数据记录的时间范围取决于源代码的更新时间,通常涵盖多个时间段。... -
电影讨论与评价数据集RedditMoviesAvengersData-snigdhab26
电影讨论与评价数据集RedditMoviesAvengersData-snigdhab26 数据来源:互联网公开数据 标签:电影评论,社交媒体,数据集,用户行为,文本分析,情感分析,自然语言处理,电影研究 数据概述: 该数据集包含来自Reddit平台的电影讨论数据,主要记录了用户对电影《复仇者联盟》系列的评价和讨论内容。主要特征如下:... -
近期Reddit帖子数据集RecentRedditPostDataset-agrimjain0206
近期Reddit帖子数据集RecentRedditPostDataset-agrimjain0206 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,流行文化,机器学习,网络行为,自然语言处理,数据挖掘 数据概述: 该数据集包含来自Reddit平台的近期帖子数据,记录了用户发布的文本内容,互动情况等信息。主要特征如下:... -
人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara
人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara 数据来源:互联网公开数据 标签:人工智能,电子邮件,数据集,自然语言处理,文本生成,机器学习,文本分析,文本挖掘 数据概述: 该数据集包含由人工智能生成的电子邮件数据,记录了不同主题和场景下的电子邮件内容。主要特征如下:... -
-
法律电子卷宗推理结果数据集LegalElectronicCaseFileInferenceResultDataset-guillemgarciatarrach
法律电子卷宗推理结果数据集LegalElectronicCaseFileInferenceResultDataset-guillemgarciatarrach 数据来源:互联网公开数据 标签:法律,电子卷宗,数据集,推理结果,人工智能,自然语言处理,司法科技,机器学习 数据概述:... -
恶意软件分析文本数据集MalwareAnalysisTextDataset-ridam2k
恶意软件分析文本数据集MalwareAnalysisTextDataset-ridam2k 数据来源:互联网公开数据 标签:恶意软件,文本分析,数据集,自然语言处理,安全研究,威胁情报,恶意代码,机器学习 数据概述: 该数据集包含来自各种恶意软件样本的文本数据,旨在促进对恶意软件行为和特征的分析。主要特征如下:... -
合并简历数据集MergedResumeDataset-ginkog33
合并简历数据集MergedResumeDataset-ginkog33 数据来源:互联网公开数据 标签:简历分析,数据集,自然语言处理,求职招聘,人力资源,数据分析,机器学习,人才库 数据概述: 该数据集包含了来自多个来源的合并简历数据,记录了求职者的详细信息,适用于简历分析,求职招聘等任务。主要特征如下:... -
Redditr-books版块热门帖子数据集r-booksHottest500PostsDataset-haverstein
Redditr-books版块热门帖子数据集r-booksHottest500PostsDataset-haverstein 数据来源:互联网公开数据 标签:社交媒体,书籍,讨论,数据集,文本分析,自然语言处理,情感分析,内容推荐 数据概述:... -
数据2020年美食数据集中的食物条目数据集-promptcloud
2020年美食数据集中的食物条目数据集-promptcloud 数据来源:互联网公开数据 标签:美食,食物,数据集,餐饮业,图像识别,自然语言处理,数据挖掘,美食文化 数据概述: 该数据集包含来自2020年美食数据集的食物条目数据,记录了各种食物的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为2020年。... -
情感分析社交媒体数据集SentimentAnalysisSocialMediaDataset-gauravsrivastav2507
情感分析社交媒体数据集SentimentAnalysisSocialMediaDataset-gauravsrivastav2507 数据来源:互联网公开数据 标签:情感分析,数据集,社交媒体,自然语言处理,机器学习,文本挖掘,社会媒体分析,文本分类... -
虚假新闻检测数据集BalancedFakeNewsDataset-arifkaggle979
虚假新闻检测数据集BalancedFakeNewsDataset-arifkaggle979 数据来源:互联网公开数据 标签:虚假新闻,新闻检测,数据集,自然语言处理,文本分类,机器学习,信息真实性,舆情分析 数据概述: 该数据集包含了经过平衡处理的真实新闻和虚假新闻数据,主要用于训练和评估虚假新闻检测模型。主要特征如下: 时间跨度:... -
阿拉伯语序列标注IOB数据集ArabicIOBforSequenceLabelingDataset-yassinabdulmahdi
阿拉伯语序列标注IOB数据集ArabicIOBforSequenceLabelingDataset-yassinabdulmahdi 数据来源:互联网公开数据 标签:序列标注,自然语言处理,数据集,命名实体识别,机器学习,语言处理,NLP,文本分析 数据概述: 该数据集包含阿拉伯语的序列标注数据,采用IOB标注格式记录了文本中的命名实体。主要特征如下:... -
Reddit电影评论数据集RedditMovieCommentsDataset-sergunow
Reddit电影评论数据集RedditMovieCommentsDataset-sergunow 数据来源:互联网公开数据 标签:社交媒体,电影评论,数据集,自然语言处理,情感分析,文本挖掘,机器学习,数据挖掘 数据概述:该数据集包含来自Reddit平台的用户对电影的评论数据,记录了用户对各类电影的评论内容和相关元数据。主要特征如下:... -
元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata
元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,信息检索,数据挖掘,语料库,语言模型 数据概述: 该数据集包含来自多个来源的语料库数据,记录了不同领域的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
Udemy课程描述数据集2022年UdemyCourseDescriptionDataset2022-guancioul
Udemy课程描述数据集2022年UdemyCourseDescriptionDataset2022-guancioul 数据来源:互联网公开数据 标签:在线教育,课程描述,数据集,自然语言处理,机器学习,教育技术,文本分析,课程分类 数据概述: 该数据集包含来自Udemy平台的课程描述数据,记录了2022年平台上部分课程的详细信息。主要特征如下:...