-
新浪滚动新闻数据集SinaaRollNewsDataset-cugytt
新浪滚动新闻数据集SinaaRollNewsDataset-cugytt 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,数据集,舆情分析,情感分析,新闻推荐,中文 数据概述: 该数据集包含来自新浪网的滚动新闻数据,记录了新闻标题,发布时间,新闻内容等信息。主要特征如下:... -
机器学习特征提取与CommonLit数据集MLFeaturesCommonLitDataset-bulivington
机器学习特征提取与CommonLit数据集MLFeaturesCommonLitDataset-bulivington 数据来源:互联网公开数据 标签:机器学习,特征提取,数据集,文本分析,自然语言处理,教育研究,情感分析,文本分类 数据概述: 该数据集包含来自CommonLit平台的文本数据,记录了用于机器学习特征提取的文本样本。主要特征如下:... -
写作过程与质量数据集WritingProcesstoQualityDataset-zainalinasir
写作过程与质量数据集WritingProcesstoQualityDataset-zainalinasir 数据来源:互联网公开数据 标签:写作过程,文本质量,数据集,自然语言处理,机器学习,学术研究,教育,文本分析 数据概述: 该数据集包含写作过程中生成的文本及其对应的文本质量评分,记录了写作过程的关键步骤和最终产出的质量。主要特征如下:... -
社交媒体用户反应数据集DemoSocialMediaReactionDataset-saadhassan41199
社交媒体用户反应数据集DemoSocialMediaReactionDataset-saadhassan41199 数据来源:互联网公开数据 标签:社交媒体,用户反应,情感分析,数据集,文本分析,机器学习,用户行为,舆情分析 数据概述: 该数据集包含了来自社交媒体平台的用户反应数据,主要记录了用户对特定内容的各种反应和互动。主要特征如下: 时间跨度:... -
预训练BERT大型语言模型数据集PreprosBERTLargeDataset-fattahpradiptak
预训练BERT大型语言模型数据集PreprosBERTLargeDataset-fattahpradiptak 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,数据集,机器学习,文本分析,深度学习,语言学,人工智能 数据概述: 该数据集为BERT大型语言模型的预训练数据,主要包含用于训练BERT模型的文本数据。主要特征如下:... -
抑郁症和焦虑症患者数据集DepressionandAnxietyPatientDataset-basitkhan12
抑郁症和焦虑症患者数据集DepressionandAnxietyPatientDataset-basitkhan12 数据来源:互联网公开数据 标签:心理健康,抑郁症,焦虑症,数据集,文本分析,自然语言处理,情感分析,医疗健康 数据概述: 该数据集包含来自社交媒体平台的用户生成内容,记录了用户关于抑郁症和焦虑症的讨论及相关情绪表达。主要特征如下:... -
新闻分类数据集NewsCategoriesDataset-noorsaeed
新闻分类数据集NewsCategoriesDataset-noorsaeed 数据来源:互联网公开数据 标签:新闻,分类,文本分析,自然语言处理,机器学习,数据集,新闻报道,文本挖掘 数据概述: 该数据集包含了来自不同新闻来源的新闻文章,旨在用于新闻文本的分类任务。主要特征如下: 时间跨度:数据记录的时间范围为2016年至2017年。... -
用户问题数据集UserQuestionsDataFramesCSVDataset-saijasthi
用户问题数据集UserQuestionsDataFramesCSVDataset-saijasthi 数据来源:互联网公开数据 标签:用户问题,数据集,数据分析,机器学习,自然语言处理,数据挖掘,信息检索,文本分析 数据概述: 该数据集包含来自用户问题的数据,记录了用户提出的问题及相关信息。主要特征如下:... -
自然语言处理推文数据集NLPTweetDataset-muhammadtakytahmid
自然语言处理推文数据集NLPTweetDataset-muhammadtakytahmid 数据来源:互联网公开数据 标签:自然语言处理,文本分析,社交媒体,情感分析,机器学习,数据挖掘,情感计算,文本分类 数据概述: 该数据集包含来自社交媒体平台推文的数据,记录了用户在推文中的文本内容及相关标签。主要特征如下:... -
产品评论分析比较数据集ProductReviewAnalysisComparisonDataset-aslemimolu
产品评论分析比较数据集ProductReviewAnalysisComparisonDataset-aslemimolu 数据来源:互联网公开数据 标签:产品评论,数据集,文本分析,情感分析,自然语言处理,机器学习,消费者行为,市场研究 数据概述: 该数据集包含来自多个电商平台的产品评论数据,记录了消费者对不同产品的评价和反馈。主要特征如下:... -
保加利亚文章关键词数据集
保加利亚文章关键词数据集 数据来源:互联网公开数据 标签:保加利亚文章,关键词提取,文本分析,自然语言处理,GPT预训练,文本摘要 数据概述: 本数据集包含一个CSV文件(kw-dataset.csv),记录了多篇保加利亚文章的标题、正文及其对应的关键词。每条数据包括以下字段: - title(文章标题):展示文章的核心主题。 -... -
阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21
阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21 数据来源:互联网公开数据 标签:语言学研究,代码切换,数据集,自然语言处理,双语处理,机器学习,文本分析,语言模型 数据概述:... -
词义消歧数据集WSDData-abdelrahmanelbakouri
词义消歧数据集WSDData-abdelrahmanelbakouri 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,数据集,语义分析,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含了用于词义消歧(Word Sense Disambiguation,... -
推特情感分析阿尔巴尼亚数据集TweetSentimentAnalysisAlbaniaDataset-itoeiji
推特情感分析阿尔巴尼亚数据集TweetSentimentAnalysisAlbaniaDataset-itoeiji 数据来源:互联网公开数据 标签:推特,情感分析,阿尔巴尼亚,社交媒体,NLP,自然语言处理,文本分析,数据集 数据概述: 该数据集包含了来自阿尔巴尼亚地区的推特数据,主要用于情感分析研究。主要特征如下:... -
医疗会议情绪分析数据集MedicalConferenceSentimentAnalysisDataset-vinjamuripavan
医疗会议情绪分析数据集MedicalConferenceSentimentAnalysisDataset-vinjamuripavan 数据来源:互联网公开数据 标签:情绪分析,医疗会议,数据集,自然语言处理,文本分析,医疗研究,机器学习,情感识别 数据概述:... -
代码托管平台源代码词汇特征数据集-nompamh
代码托管平台源代码词汇特征数据集-nompamh 数据来源:互联网公开数据 标签:源代码,词汇特征,自然语言处理,机器学习,代码分析,软件工程,数据集,文本分析 数据概述: 该数据集包含来自代码托管平台(如GitHub)的源代码数据,记录了源代码的词汇特征信息。主要特征如下: 时间跨度:数据记录的时间范围取决于源代码的更新时间,通常涵盖多个时间段。... -
电影讨论与评价数据集RedditMoviesAvengersData-snigdhab26
电影讨论与评价数据集RedditMoviesAvengersData-snigdhab26 数据来源:互联网公开数据 标签:电影评论,社交媒体,数据集,用户行为,文本分析,情感分析,自然语言处理,电影研究 数据概述: 该数据集包含来自Reddit平台的电影讨论数据,主要记录了用户对电影《复仇者联盟》系列的评价和讨论内容。主要特征如下:... -
近期Reddit帖子数据集RecentRedditPostDataset-agrimjain0206
近期Reddit帖子数据集RecentRedditPostDataset-agrimjain0206 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,流行文化,机器学习,网络行为,自然语言处理,数据挖掘 数据概述: 该数据集包含来自Reddit平台的近期帖子数据,记录了用户发布的文本内容,互动情况等信息。主要特征如下:... -
人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara
人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara 数据来源:互联网公开数据 标签:人工智能,电子邮件,数据集,自然语言处理,文本生成,机器学习,文本分析,文本挖掘 数据概述: 该数据集包含由人工智能生成的电子邮件数据,记录了不同主题和场景下的电子邮件内容。主要特征如下:... -
恶意软件分析文本数据集MalwareAnalysisTextDataset-ridam2k
恶意软件分析文本数据集MalwareAnalysisTextDataset-ridam2k 数据来源:互联网公开数据 标签:恶意软件,文本分析,数据集,自然语言处理,安全研究,威胁情报,恶意代码,机器学习 数据概述: 该数据集包含来自各种恶意软件样本的文本数据,旨在促进对恶意软件行为和特征的分析。主要特征如下:...