-
法语目的地和起点映射数据集
法语目的地和起点映射数据集 数据来源:互联网公开数据 标签:法语,地理定位,自然语言处理,方向描述,时间查询,句子结构分析,地理信息系统 数据概述:... -
亚马逊电子产品评论情感分析数据集
亚马逊电子产品评论情感分析数据集 数据来源:互联网公开数据 标签:亚马逊,电子产品,评论,情感分析,消费者行为,文本数据,机器学习,自然语言处理 数据概述: 本数据集包含约3000条来自亚马逊电子产品部门的约200个产品的产品评论,旨在用于深入理解亚马逊平台上产品的用户情感。数据集包含了用户对产品的文字评价,为情感分析提供了基础。... -
生成式语言模型文章数据集
生成式语言模型文章数据集 数据来源:互联网公开数据 标签:生成式语言模型,文章生成,自然语言处理,文本检测,机器学习,深度学习,LLM 数据概述: 本数据集由GPT4、GPT2、Mistral和Gemma四种生成式语言模型生成,涵盖了一个特定的作文提示,该提示来自Kaggle的llm-detect-ai-generated-... -
Rawat图书出版物主题分类数据集
Rawat图书出版物主题分类数据集 数据来源:互联网公开数据 标签:图书,出版,学术,人文社科,ISBN,作者,主题分类,文本分析,自然语言处理,Rawat图书 数据概述: 本数据集包含了Rawat图书网站上公开列出的图书信息,涵盖了广泛的学术和人文社科领域。... -
Reddit社区点击诱饵文章摘要数据集-r-SavedYouAClick-TOP1000-ish
Reddit社区点击诱饵文章摘要数据集-r-SavedYouAClick-TOP1000-ish 数据来源:互联网公开数据 标签:Reddit,点击诱饵,文章摘要,社交媒体,文本分析,自然语言处理,TLDR,网络社区 数据概述:... -
印度网民对科技产品情感分析数据集2021
印度网民对科技产品情感分析数据集2021 数据来源:互联网公开数据 标签:情感分析,社交媒体分析,自然语言处理,消费者反馈,科技产品,印度,文本分类 数据概述:... -
霍尼韦尔自动化员工评论数据集
霍尼韦尔自动化员工评论数据集 数据来源:互联网公开数据 标签:霍尼韦尔自动化,员工评论,工作环境,公司文化,职业发展,工作生活平衡,人力资源,自然语言处理,情感分析,数据分析 数据概述: 霍尼韦尔自动化员工评论数据集汇集了来自Ambition... -
孟加拉语动词拆解数据集1963-2021
孟加拉语动词拆解数据集1963-2021 数据来源:互联网公开数据 标签:孟加拉语,动词拆解,词性标注,语言学,自然语言处理 数据概述: 本数据集收录了孟加拉语中的所有根动词,并将其映射到相应的词性标注。数据集为孟加拉语的语言学研究提供了基础性的词汇和语法资源。 数据用途概述:... -
来自X的仇恨言论和冒犯性语言数据集
来自X的仇恨言论和冒犯性语言数据集 数据来源:互联网公开数据 标签:仇恨言论,冒犯性语言,社交媒体数据,文本分析,自然语言处理,三元分类,数据清理 数据概述: 本数据集通过名为“Instant Data... -
电商平台用户评论情感与主题分类数据集1963-2021
电商平台用户评论情感与主题分类数据集1963-2021 数据来源:互联网公开数据 标签:用户评论,情感分析,主题分类,电商平台,数据挖掘,机器学习,自然语言处理 数据概述:... -
职位描述分类任务数据集
职位描述分类任务数据集 数据来源:互联网公开数据 标签:职位描述,分类任务,机器学习,自然语言处理,文本分析,人力资源管理 数据概述: 本数据集包含多个职位描述的文本样本,每个样本均标注有对应的分类标签。数据集内容涵盖各种行业和岗位的职位描述,旨在为构建职位描述分类任务提供高质量的训练数据。 数据用途概述:... -
职位技能集数据集
职位技能集数据集 数据来源:互联网公开数据 标签:职位技能,招聘,技能提取,自然语言处理,职位匹配,推荐系统,行业分析 数据概述: 职位技能集数据集旨在用于与职位匹配、技能提取和自然语言处理相关的机器学习项目。数据集包含了职位角色、描述及其相关技能集的详细信息,使开发者和研究者能够构建和评估职业生涯推荐系统、简历解析和技能推断的模型。... -
每日韩语对话数据集2017-2020
每日韩语对话数据集2017-2020 数据来源:互联网公开数据 标签:韩语学习,对话数据,双语对照,教育工具,语言研究,文本挖掘,自然语言处理 数据概述: 本数据集包含了2017年12月4日至2020年8月19日期间,从Naver Dictionary每日对话栏目中提取的韩语-... -
知识符号关联与大语言模型数据集
知识符号关联与大语言模型数据集 数据来源:互联网公开数据 标签:知识符号关联,大语言模型,LLM,机器学习,自然语言处理,提示生成,知识表示 数据概述:... -
-
-
推特情感分析竞赛伪标签推文数据集-2020年
推特情感分析竞赛伪标签推文数据集-2020年 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,伪标签,文本分类,竞赛,机器学习,社交媒体 数据概述:... -
Reddit印度板块帖子标签预测数据集-2024
Reddit印度板块帖子标签预测数据集-2024 数据来源:互联网公开数据 标签:Reddit,印度,社交媒体,文本分析,机器学习,自然语言处理,标签预测,内容分类,PRAW API 数据概述: 本数据集来源于Reddit社交平台上的r/india子版块,通过PRAW... -
俄罗斯传记文本语料库1963-2021
俄罗斯传记文本语料库1963-2021 数据来源:互联网公开数据 标签:传记文本,俄罗斯,自然语言处理,文本挖掘,生物信息提取,主题分类 数据概述:... -
科学文献关键词分析数据集1963-2021
科学文献关键词分析数据集1963-2021 数据来源:互联网公开数据 标签:科学文献,关键词,作者关键词,自动关键词,Web of Science,文本分析,自然语言处理 数据概述: 本数据集包含了从Web of Science...