-
通用文学网站完整文本数据集DatasetfromCommonLitWebsitewithFullText-yuewang123
通用文学网站完整文本数据集DatasetfromCommonLitWebsitewithFullText-yuewang123 数据来源:互联网公开数据 标签:文本分析,教育研究,数据集,自然语言处理,机器学习,文学研究,课程资源,学术资源 数据概述:... -
亚马逊图书评论数据集AmazonBookReviewsDataset-jayllan23
亚马逊图书评论数据集AmazonBookReviewsDataset-jayllan23 数据来源:互联网公开数据 标签:图书评论,消费者行为,数据集,文本分析,机器学习,情感分析,电子商务,数据挖掘 数据概述: 该数据集包含来自亚马逊平台的图书评论数据,记录了用户对图书的评分,评论内容及相关元信息。主要特征如下:... -
萨提亚-纳德拉推文数据集2009-2023SatyaNadellaTweetsDataset2009-2023-muhammadavici
萨提亚-纳德拉推文数据集2009-2023SatyaNadellaTweetsDataset2009-2023-muhammadavici 数据来源:互联网公开数据 标签:社交媒体,推文,数据集,文本分析,机器学习,领导力,科技行业,时间序列... -
哈利波特魔法学院分院数据集HarryPotterHousesDataset-sanjay0614
哈利波特魔法学院分院数据集HarryPotterHousesDataset-sanjay0614 数据来源:互联网公开数据 标签:哈利波特,数据集,分院,机器学习,文本分析,角色分析,电影,文学 数据概述: 该数据集包含了哈利波特系列电影和书籍中主要角色的相关数据,用于分析角色特征和预测分院结果。主要特征如下:... -
笑话综合数据集CombinedJokesDataset-ihdufxr2024
笑话综合数据集CombinedJokesDataset-ihdufxr2024 数据来源:互联网公开数据 标签:笑话,数据集,自然语言处理,文本分析,娱乐,机器学习,语言学,文化研究 数据概述:该数据集包含来自多个来源的笑话数据,记录了各类笑话的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
多选题与文本上下文数据集-hark99
多选题与文本上下文数据集-hark99 数据来源:互联网公开数据 标签:多选题,上下文理解,自然语言处理,数据集,文本分析,机器学习,考试,语言模型 数据概述:该数据集包含多选题及其对应的文本上下文,旨在用于研究和评估模型在理解文本和回答选择题方面的能力。主要特征如下: 时间跨度:数据收集的时间范围不限。... -
生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602
生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602 数据来源:互联网公开数据 标签:文本生成,自然语言处理,数据集,机器学习,文本分析,人工智能,语言模型,文本挖掘 数据概述: 该数据集包含来自多个公开源文本生成的数据,记录了不同场景下的文本内容和特征。主要特征如下:... -
DACON语言翻译输出数据集-geying
DACON语言翻译输出数据集-geying 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,深度学习,翻译质量评估,文本分析,人工智能 数据概述: 该数据集包含来自DACON竞赛的语言翻译输出数据,主要记录了机器翻译模型对输入文本的翻译结果。主要特征如下: 时间跨度:数据记录的时间范围为比赛期间。... -
新冠疫情期间推特疫情信息数据集COVID-19TwitterDataset-tg2004
新冠疫情期间推特疫情信息数据集COVID-19TwitterDataset-tg2004 数据来源:互联网公开数据 标签:新冠疫情,推特,社交媒体,数据集,文本分析,自然语言处理,舆情分析,疫情传播 数据概述: 该数据集包含来自推特平台关于新冠疫情的相关推文数据,记录了疫情期间公众对疫情的讨论,观点和信息传播。主要特征如下:... -
电影关键词数据集MoviesKeywordsDataset-leonatorres
电影关键词数据集MoviesKeywordsDataset-leonatorres 数据来源:互联网公开数据 标签:电影,关键词,数据集,文本分析,自然语言处理,推荐系统,电影研究,文化研究 数据概述:该数据集包含来自电影数据库的数据,记录了电影的关键词。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2023年。... -
主题分类数据集TopicsClassificationDataset-luisfredgs
主题分类数据集TopicsClassificationDataset-luisfredgs 数据来源:互联网公开数据 标签:主题分类,数据集,文本分析,机器学习,自然语言处理,信息检索,分类算法,数据分析 数据概述:该数据集包含来自多个来源的文本数据,记录了不同主题的文档或文本片段。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
网约车平台用户评价情感分析数据集GojekReviewSentimentDataset-achmadshidiq
网约车平台用户评价情感分析数据集GojekReviewSentimentDataset-achmadshidiq 数据来源:互联网公开数据 标签:情感分析,用户评价,数据集,机器学习,自然语言处理,文本分析,网约车,消费者行为 数据概述:该数据集包含来自网约车平台Gojek的用户评价数据,记录了用户对平台服务的评价内容及其情感倾向。主要特征如下:... -
僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda
僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,语言研究,新闻媒体,信息提取 数据概述: 该数据集包含来自僧伽罗语新闻媒体的数据,记录了僧伽罗语新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta
推特情感分析抓取推文数据集ScrapedTweetsforSentimentAnalysisDataset-sarthak7gupta 数据来源:互联网公开数据 标签:推特,社交媒体,情感分析,自然语言处理,数据集,文本分析,机器学习,舆情分析 数据概述: 该数据集包含了从推特(Twitter)上抓取的推文数据,用于情感分析研究。主要特征如下:... -
单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1
单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1 数据来源:互联网公开数据 标签:自然语言处理,词频统计,数据集,文本分析,机器学习,语言模型,统计学,数据挖掘 数据概述: 该数据集包含来自多种文本来源的单字词频统计信息,记录了不同语言或文本中单个字的出现频率。主要特征如下:... -
情绪识别平衡数据集PrimaryBalancedEmotionDataset-rahulshelke98
情绪识别平衡数据集PrimaryBalancedEmotionDataset-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,数据集,机器学习,情感分析,心理学,自然语言处理,文本分析,人工智能 数据概述: 该数据集包含来自多个来源的情绪识别数据,主要记录了人类情绪的文本表达,适用于情绪分类和情感分析等任务。主要特征如下:... -
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh
简历数据分析数据集ResumeDataAnalysisDataset-someetsingh 数据来源:互联网公开数据 标签:简历,NLP,文本分析,数据集,自然语言处理,信息提取,机器学习,招聘 数据概述: 该数据集包含来自互联网的简历数据,记录了求职者的个人信息,教育背景,工作经历,技能等。主要特征如下:... -
数据2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber
2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,反馈分析,机器学习,写作质量评估,语言模型,教育 数据概述:... -
维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1
维基百科科学主题条目数据集WikipediaScienceTopicDataset-shams1 数据来源:互联网公开数据 标签:科学知识,维基百科,数据集,自然语言处理,文本分析,教育研究,信息检索,数据挖掘 数据概述: 该数据集包含来自维基百科的科学主题条目数据,记录了维基百科上关于科学领域的条目信息。主要特征如下:... -
预处理输入数据数据集-isabbaggin
预处理输入数据数据集-isabbaggin 数据来源:互联网公开数据 标签:数据预处理,自然语言处理,数据集,文本分析,机器学习,数据清洗,文本挖掘,数据科学 数据概述:该数据集包含了用于数据预处理的各种输入数据样本,旨在帮助用户理解和实践数据清洗,转换和准备工作。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于输入数据的类型和来源。...