-
序列分类数据集
序列分类数据集 数据来源:互联网公开数据 标签:序列分类,多分类任务,文本分类,自然语言处理,机器学习,小语言模型,数据标注,分类模型,分类任务 数据概述:... -
-
登山项目路线与论坛数据集
登山项目路线与论坛数据集 数据来源:互联网公开数据 标签:登山项目,爬山路线,论坛讨论,品牌评价,情感分析,自然语言处理,数据爬取 数据概述: 本数据集来源于对MountainProject.com和Trailspace.com网站的公开数据爬取,包含以下五个部分:... -
印度新闻摘要清理数据集1963-2021
印度新闻摘要清理数据集1963-2021 数据来源:互联网公开数据 标签:新闻摘要,印度,数据清理,文本处理,自然语言处理,机器学习 数据概述: 本数据集是Kondalarao... -
海量网页文本内容采集数据集-CommonCrawl样本数据
海量网页文本内容采集数据集-CommonCrawl样本数据 数据来源:互联网公开数据 标签:网页文本,互联网,爬虫,数据挖掘,自然语言处理,文本分析,网页内容,Common Crawl 数据概述: 本数据集是Common Crawl数据集的一个样本,包含来自互联网的网页文本内容。Common... -
Jigsaw评论社区毒性评级数据集
Jigsaw评论社区毒性评级数据集 数据来源:互联网公开数据 标签:评论,毒性,NLP,文本分析,自然语言处理,情感分析,社交媒体,评论内容,Jigsaw,Kaggle 数据概述: 本数据集包含用于Jigsaw 毒性评论评级比赛(2021)的定制数据。数据集来源于Jigsaw... -
患者医生问答TR321179数据集
患者医生问答TR321179数据集 数据来源:互联网公开数据 标签:患者医生问答,土耳其语,医疗沟通,自然语言处理,医疗研究,教育培训 数据概述: 本数据集是通过合并并重新整理 Patient Doctor Q&A TR 19583、Patient Doctor Q&A TR 167732、Patient Doctor Q&A... -
新闻真伪识别数据集-文本内容与标签-训练与测试集
新闻真伪识别数据集-文本内容与标签-训练与测试集 数据来源:互联网公开数据 标签:假新闻检测,文本分类,自然语言处理,机器学习,新闻,真伪,文本分析 数据概述: 本数据集旨在支持假新闻检测的研究与开发,包含用于训练、测试模型的数据。数据集由三个CSV文件构成: 1.... -
问题回答问答数据集
问题回答问答数据集 数据来源:互联网公开数据 标签:问题回答,自然语言处理,问答系统,文本理解,信息抽取,文本定位,模型训练 数据概述: 本数据集包含多个问题回答任务相关的文本数据,旨在为自然语言处理和问答系统的研究提供支持。数据集中的每条记录包括以下字段: - Story:一段完整的文本内容,通常为叙述性或说明性段落。 -... -
Jigsaw毒性评论多语言分类数据集
Jigsaw毒性评论多语言分类数据集 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 自然语言处理, 多语言, 评论, 社交媒体, 文本分析, 机器学习 数据概述: 本数据集由Pavel Ostyakov创建,旨在支持多语言环境下的毒性评论分类任务。 数据集包含了多种语言的文本评论,并标注了毒性标签。... -
IEEEXplore机器学习论文关键词数据集
IEEEXplore机器学习论文关键词数据集 数据来源:互联网公开数据 标签:机器学习,论文,关键词,IEEE Xplore,自然语言处理,学术研究,数据挖掘,文本分析 数据概述: 本数据集包含了从IEEE... -
YouTube视频评论情感分析数据集百万级标注评论
YouTube视频评论情感分析数据集百万级标注评论 数据来源:互联网公开数据 标签:YouTube,评论,情感分析,自然语言处理,NLP,情感分类,文本数据,机器学习,深度学习 数据概述:... -
-
五十位维多利亚时代小说家的作者归属数据集
五十位维多利亚时代小说家的作者归属数据集 数据来源:互联网公开数据 标签:小说,文学分析,作者归属,文本挖掘,维多利亚时代,自然语言处理,文学研究,文本分类 数据概述:... -
法律文档检索数据集
法律文档检索数据集 数据来源:互联网公开数据 标签:法律文档,文本检索,问答系统,自然语言处理,信息抽取,司法应用,机器学习 数据概述: 本数据集旨在支持法律文档检索和问答系统的开发,包含三个主要文件:corpus.csv、train.csv 和 public_test.csv。 1. corpus.csv:存储法律文本及其唯一标识符,字段包括: -... -
新冠疫情社交媒体信息传播分析推特数据集-2020年3-4月
新冠疫情社交媒体信息传播分析推特数据集-2020年3-4月 数据来源:互联网公开数据 标签:新冠疫情,推特,社交媒体,文本分析,自然语言处理,疫情传播,舆情分析,时间序列 数据概述:... -
推特情绪分析数据集-用户推文情感分类数据集-2009
推特情绪分析数据集-用户推文情感分类数据集-2009 数据来源:互联网公开数据 标签:推特,情绪分析,情感分类,社交媒体,文本数据,自然语言处理,机器学习,情感,用户行为 数据概述: 本数据集包含推特(Twitter)用户发布的推文数据,并附带了相应的情感标签。数据集主要关注推文的情感倾向,为情感分析研究提供了基础。 数据集中的每条记录都包含以下字段:... -
电影字幕多语言平行数据集
电影字幕多语言平行数据集 数据来源:互联网公开数据 标签:电影字幕,多语言平行数据,英语到阿拉伯语,英语到法语,英语到印度尼西亚语,英语到泰语,时间对齐,机器翻译,自然语言处理 数据概述:... -
酒店评论情感分析数据集
酒店评论情感分析数据集 数据来源:互联网公开数据 标签:酒店评论,情感分析,文本分类,机器学习,自然语言处理,情感极性,TF-IDF,词向量,深度学习 数据概述:... -
自然语言处理情感分析数据集
自然语言处理情感分析数据集 数据来源:互联网公开数据 标签:自然语言处理,情感分析,文本挖掘,机器学习,数据标注,社交媒体分析 数据概述: 本数据集包含来自社交媒体平台的大量文本数据,每条记录均标注了对应的情感类别,如正面、负面和中性等。数据集涵盖了不同领域的话题,为自然语言处理和情感分析的研究提供了丰富的资源。 数据用途概述:...