-
谷歌图书搜索结果数据集GoogleBooksDataResponseDataset-navyachallagulla
谷歌图书搜索结果数据集GoogleBooksDataResponseDataset-navyachallagulla 数据来源:互联网公开数据 标签:图书,搜索,数据集,自然语言处理,文本分析,信息检索,机器学习,学术研究 数据概述: 该数据集包含来自谷歌图书搜索的响应数据,记录了用户在谷歌图书上进行搜索后得到的图书信息。主要特征如下:... -
Letterboxd电影标题和评论数据集-ecelker
Letterboxd电影标题和评论数据集-ecelker 数据来源:互联网公开数据 标签:电影,评论,数据集,文本分析,情感分析,自然语言处理,电影推荐,用户行为 数据概述: 该数据集包含来自Letterboxd网站的电影标题和用户评论数据,记录了用户对电影的评价和观影体验。主要特征如下:... -
谷歌搜索信息数据集GoogleSearchInformationDataset-mugentk
谷歌搜索信息数据集GoogleSearchInformationDataset-mugentk 数据来源:互联网公开数据 标签:搜索引擎,搜索行为,数据集,自然语言处理,用户行为分析,数据挖掘,信息检索,文本分析 数据概述: 该数据集包含来自谷歌搜索的公开信息,记录了用户的搜索查询,搜索结果,以及相关的用户交互行为。主要特征如下:... -
新冠疫情相关文章数据集COVID-19RelatedArticlesDataset-parkyoona
新冠疫情相关文章数据集COVID-19RelatedArticlesDataset-parkyoona 数据来源:互联网公开数据 标签:公共卫生,新冠疫情,数据集,文本分析,自然语言处理,疾病传播,信息检索,医学研究 数据概述: 该数据集包含来自互联网公开渠道的新冠疫情相关文章数据,记录了关于新冠疫情的各类报道,研究论文和新闻资讯。主要特征如下:... -
社交媒体用户行为数据集AccioJobMLCapstoneSocialMediaDataset-sirajahmad
社交媒体用户行为数据集AccioJobMLCapstoneSocialMediaDataset-sirajahmad 数据来源:互联网公开数据 标签:社交媒体,用户行为,机器学习,文本分析,用户画像,情感分析,数据挖掘,自然语言处理 数据概述:... -
大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan
大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,人工智能,语言模型,文本数据,模型训练 数据概述: 该数据集包含用于训练大型语言模型的原始文本数据,记录了多种来源的文本内容。主要特征如下:... -
学术论文文本分析数据集EssayDataset-hienbm02
学术论文文本分析数据集EssayDataset-hienbm02 数据来源:互联网公开数据 标签:文本分析,教育研究,数据集,自然语言处理,机器学习,学术写作,文献分析,语言模型 数据概述: 该数据集包含来自学术论文和学术写作的文本数据,记录了学术文献的文本内容和相关特征。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
标注清晰数据集AnnotatedCleanDataset-bf3magic
标注清晰数据集AnnotatedCleanDataset-bf3magic 数据来源:互联网公开数据 标签:数据标注,数据集,机器学习,数据清洗,人工智能,自然语言处理,数据科学,数据分析 数据概述: 该数据集包含经过标注和清洗的数据,记录了经过标准化处理的数据样本。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
电商用户评论与评分数据集-wajidlinux
电商用户评论与评分数据集-wajidlinux 数据来源:互联网公开数据 标签:电商,用户评论,评分,情感分析,文本挖掘,机器学习,自然语言处理,消费者行为 数据概述:该数据集包含来自电商平台的消费者评论文本及其对应的评分数据,记录了用户对商品或服务的评价。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了大量用户评论。... -
垃圾邮件与正常邮件分类数据集-平衡数据集
垃圾邮件与正常邮件分类数据集-平衡数据集 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,文本分类,电子邮件,自然语言处理,机器学习,数据集 数据概述:... -
CommonLit阅读理解竞赛排行榜数据集-fritzcremer
CommonLit阅读理解竞赛排行榜数据集-fritzcremer 数据来源:互联网公开数据 标签:阅读理解,数据集,自然语言处理,机器学习,文本分析,教育,竞赛,排行榜 数据概述:该数据集包含CommonLit阅读理解竞赛的排行榜数据,记录了参赛者的成绩和排名。主要特征如下: 时间跨度:数据记录的时间范围为竞赛期间。... -
流行歌曲歌词创作与专辑数据分析数据集
流行歌曲歌词创作与专辑数据分析数据集 数据来源:互联网公开数据 标签:歌词,歌曲,音乐,流行音乐,NLP,自然语言处理,创作,专辑,歌手,情感分析 数据概述: 本数据集收录了超过25,000首歌曲的详细信息及其歌词文本,并包含了这些歌曲所属专辑的相关信息。数据涵盖了150位歌手的歌词,其中包含了Taylor Swift、Ariana... -
教育平台学生答题数据分析数据集EediParaphrasedDataset-evanarlian
教育平台学生答题数据分析数据集EediParaphrasedDataset-evanarlian 数据来源:互联网公开数据 标签:教育,答题数据,数据集,学生表现,自然语言处理,机器学习,教育评估,学习分析 数据概述: 该数据集源自Eedi教育平台,包含了学生在数学答题过程中产生的详细数据,经过了释义处理。主要特征如下:... -
移动应用用户评论情感分析数据集ReviewMobileJKNDataset-saprinasaputri
移动应用用户评论情感分析数据集ReviewMobileJKNDataset-saprinasaputri 数据来源:互联网公开数据 标签:移动应用,用户评论,情感分析,自然语言处理,机器学习,文本挖掘,情感分类,应用商店 数据概述: 该数据集包含来自移动应用的用户评论数据,主要用于情感分析和用户反馈研究。主要特征如下: 时间跨度:... -
阿萨姆语多类别仇恨言论标注数据集AssameseMulti-ClassHateSpeechTaggedDataset-ashisdta
阿萨姆语多类别仇恨言论标注数据集AssameseMulti-ClassHateSpeechTaggedDataset-ashisdta 数据来源:互联网公开数据 标签:仇恨言论,数据集,自然语言处理,多类别分类,文本标注,社交媒体,阿萨姆语,人工智能 数据概述:... -
新闻媒体情感分析数据集KompasDataset-anandaprayoga
新闻媒体情感分析数据集KompasDataset-anandaprayoga 数据来源:互联网公开数据 标签:新闻媒体,情感分析,数据集,文本分析,自然语言处理,机器学习,社会研究,新闻学 数据概述: 该数据集包含来自印尼新闻网站Kompas.com的文章,记录了大量新闻报道的内容及其对应的情感标签,适用于新闻情感分析和机器学习任务。主要特征如下:... -
客户支持对话文本数据集Bitext客户支持训练数据集-pragadeeshn01
客户支持对话文本数据集Bitext客户支持训练数据集-pragadeeshn01 数据来源:互联网公开数据 标签:客户支持,对话,文本分析,自然语言处理,机器学习,数据集,语义理解,客户服务 数据概述: 该数据集包含来自 Bitext 公司的客户支持对话文本,旨在用于训练和评估客户支持相关的自然语言处理模型。主要特征如下: 时间跨度:... -
微软OCR无缩放数据集MicrosoftOCRWithoutResizeDataset-mostafaatta222
微软OCR无缩放数据集MicrosoftOCRWithoutResizeDataset-mostafaatta222 数据来源:互联网公开数据 标签:OCR, 数据集, 文本识别, 机器学习, 图像处理, 自然语言处理, 文档分析, 软件工程 数据概述:... -
知乎用户行为数据集ZhihuUserBehaviorDataset-yougebuding
知乎用户行为数据集ZhihuUserBehaviorDataset-yougebuding 数据来源:互联网公开数据 标签:社交媒体,用户行为,数据集,数据分析,机器学习,知识图谱,用户画像,自然语言处理 数据概述: 该数据集包含来自知乎平台的用户行为数据,记录了用户在知乎上的各种活动信息。主要特征如下: 时间跨度:数据记录的时间范围为特定时期。... -
贝叶斯特征分析数据集BayesFeaturesDataset-faisalmabood
贝叶斯特征分析数据集BayesFeaturesDataset-faisalmabood 数据来源:互联网公开数据 标签:贝叶斯分析,特征提取,数据集,机器学习,概率模型,自然语言处理,数据挖掘,统计分析 数据概述: 该数据集包含来自多个来源的贝叶斯特征数据,记录了基于贝叶斯统计方法提取的特征信息。主要特征如下:...