-
IMDB电影评论未标注数据集
IMDB电影评论未标注数据集 数据来源:互联网公开数据 标签:电影评论,未标注数据,情感分析,自然语言处理,分类算法,斯坦福大学 数据概述: 本数据集包含IMDB电影评论的未标注内容,来源于斯坦福大学公开数据集。数据集为一个简单的n x 2维度结构,包含两列:评论内容和情感(未标注)。该数据集适用于构建和测试电影评论的情感分类模型。 数据用途概述:... -
基于知识图谱的故事数据集
基于知识图谱的故事数据集 数据来源:互联网公开数据 标签:故事生成,知识图谱,自然语言处理,机器学习,推理,上下文理解,文本生成 数据概述: 本数据集基于知识图谱技术,旨在构建和分析包含丰富语义信息的故事数据。数据集整合了多个项目的研究成果,包括COMET(commonsense transformers for automatic knowledge... -
Reddit问答社区百万提问数据分析数据集-AskReddit-时间序列-问答内容-不限时间
Reddit问答社区百万提问数据分析数据集-AskReddit-时间序列-问答内容-不限时间 数据来源:互联网公开数据 标签:Reddit,问答,提问,社交媒体,文本分析,自然语言处理,问答系统,问答社区,情感分析 数据概述:... -
大型语言模型训练合成数据-Synthia-v1-3数据集
大型语言模型训练合成数据-Synthia-v1-3数据集 数据来源:互联网公开数据 标签:大型语言模型,合成数据,训练数据,自然语言处理,文本生成,机器翻译,问答系统,对话生成 数据概述: 本数据集是专为大型语言模型(LLM)开发和改进而设计的合成训练数据集,主要用于研究和优化migel... -
-
-
AI文本检测数据预处理数据集
AI文本检测数据预处理数据集 数据来源:互联网公开数据 标签:AI文本检测,自然语言处理,文本分类,数据预处理,机器学习,特征工程,文本清洗 数据概述: 本数据集是原始AI文本检测数据集的预处理版本,原始数据来源于Kaggle平台(https://www.kaggle.com/datasets/thedrcat/daigt-v2-train-... -
SQuAD2-0问答系统训练数据集
SQuAD2-0问答系统训练数据集 数据来源:互联网公开数据 标签:问答系统,开放域,自然语言处理,机器学习,训练数据 数据概述: 本数据集是SQuAD 2.0训练数据集的CSV格式版本,适用于构建复杂的开放域问答系统。数据集包含问题、答案及其对应的文章段落,有助于训练模型理解上下文并生成准确的回答。 数据用途概述:... -
土耳其地震推文数据集
土耳其地震推文数据集 数据来源:互联网公开数据 标签:地震,推文,紧急呼吁,救援,文本标注,BERT模型,自然语言处理,社会应急响应 数据概述: 本数据集包含2020年伊兹密尔地震发生后,与地震相关的土耳其推文数据,主要分为三个部分: 1.... -
印度卡纳达语新冠疫情情感分析数据集2020-2021
印度卡纳达语新冠疫情情感分析数据集2020-2021 数据来源:互联网公开数据 标签:新冠疫情,卡纳达语,情感分析,文本翻译,自然语言处理,数据提取,机器学习 数据概述:... -
电影评论情感分析数据集-IMDB电影评论-文本数据
电影评论情感分析数据集-IMDB电影评论-文本数据 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本数据,机器学习,情感分类,IMDB,电影,评论 数据概述:... -
OYO酒店评论情感分析数据集2021
OYO酒店评论情感分析数据集2021 数据来源:互联网公开数据 标签:OYO酒店,评论,情感分析,客户满意度,改进意见,数据驱动决策,自然语言处理,机器学习 数据概述:... -
政治思想作品语料库数据集1963-2021
政治思想作品语料库数据集1963-2021 数据来源:互联网公开数据 标签:政治思想,语料库,历史,现代,文本分析,自然语言处理,词频分析,推荐系统 数据概述:... -
Alpaca编程风格代码生成指令数据集
Alpaca编程风格代码生成指令数据集 数据来源:互联网公开数据 标签:代码生成,编程风格,Alpaca,自然语言处理,机器学习,风格迁移,代码转换,NLP 数据概述:... -
每日星座运势数据集
每日星座运势数据集 数据来源:互联网公开数据 标签:星座,运势,每日预测,文本生成,聊天机器人,占星学,自然语言处理 数据概述: 本数据集收录了每个星座的每日运势信息,涵盖12个星座,从多个公开来源收集整理而成。数据内容包括星座名称、日期范围、运势描述等字段,为从事自然语言处理和文本生成研究提供了丰富的语料支持。 数据用途概述:... -
-
土耳其新闻70000数据集
土耳其新闻70000数据集 数据来源:互联网公开数据 标签:土耳其新闻,新闻分类,文本数据,机器学习,自然语言处理,媒体分析,信息抽取 数据概述:... -
AZLyrics歌词数据集
AZLyrics歌词数据集 数据来源:互联网公开数据 标签:歌词,歌曲,艺术家,文本挖掘,自然语言处理,音乐分析,内容创作 数据概述: 本数据集包含来自AZLyrics.com的歌词信息,数据按照歌曲艺术家名称的首字母进行分类整理。每个数据文件为CSV格式,包含以下字段: - ARTIST_NAME:艺术家名称 - ARTIST_URL:艺术家页面链接... -
IMDbTop250电视剧用户评论与评分数据集-2024
IMDbTop250电视剧用户评论与评分数据集-2024 数据来源:互联网公开数据 标签:IMDb, 电视剧, 评论, 评分, 用户评价, NLP, 自然语言处理, 情感分析, 文本挖掘 数据概述: 本数据集收录了截至2024年IMDb Top... -
可再生能源事故检测数据集
可再生能源事故检测数据集 数据来源:互联网公开数据 标签:可再生能源, 事故检测, 自然语言处理, 深度学习, 文本分类, 行业安全, 数据标注 数据概述:...