-
乌尔都语古体诗歌之歌集数据集19世纪-20世纪
乌尔都语古体诗歌之歌集数据集19世纪-20世纪 数据来源:互联网公开数据 标签:乌尔都语,诗歌,歌集,古体文学,名诗人,文化研究,语言学分析 数据概述:...
-
爸爸笑话幽默语料库
爸爸笑话幽默语料库 数据来源:互联网公开数据 标签:笑话,幽默,家庭,语言,语料库,娱乐,轻松一刻 数据概述: 本数据集收录了大量经典的爸爸笑话,涵盖各类搞笑的一 liners、双关语和幽默段子。数据集内容包括笑话文本、关键词提取以及分类标签,便于研究和应用。笑话内容以轻松幽默为主,适合家庭和社交场景,旨在为用户提供欢乐和轻松的体验。 数据用途概述:...
-
客户服务电子邮件情感分析与问题诊断数据集
客户服务电子邮件情感分析与问题诊断数据集 数据来源:互联网公开数据 标签:客户服务,电子邮件,情感分析,自然语言处理,问题诊断,文本数据,合成数据 数据概述: 本数据集包含由Gemini...
-
古吉拉特语推文数据集
古吉拉特语推文数据集 数据来源:互联网公开数据 标签:推文,古吉拉特语,情感分析,翻译,社交媒体,文本分析,自然语言处理 数据概述: 本数据集包含超过25000条英文推文及其对应的古吉拉特语翻译,并附带每条推文的情感评分。数据集内容丰富,涵盖了多种主题和情感类型,为研究社交媒体文本及其情感特征提供了宝贵的数据资源。 数据用途概述:...
-
颜色名称数据集
颜色名称数据集 数据来源:互联网公开数据 标签:颜色名称,RGB值,颜色编码,设计,艺术,可视化,用户界面 数据概述: 本数据集包含了超过1200种颜色的名称及其对应的RGB值,为用户提供了一个全面的颜色参考库。数据涵盖了广泛的颜色范围,适用于各种设计和开发需求。 数据用途概述:...
-
大型语言模型论文数据集
大型语言模型论文数据集 数据来源:互联网公开数据 标签:大型语言模型,论文生成,GPT-3.5-turbo,GPT-4,提示ID,文本分析,机器学习,自然语言处理 数据概述:...
-
Goodreads网站精选名言数据集
Goodreads网站精选名言数据集 数据来源:互联网公开数据 标签:名言,语录,励志,格言,作者,文学,情感分析,文本生成,NLP 数据概述:...
-
-
仇恨言论数据集-01
仇恨言论数据集-01 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,推特,文本分析,机器学习,自然语言处理 数据概述: 本数据集包含用于识别仇恨言论的推特训练集和测试集,涵盖了2010年至2021年间推特平台上发布的大量文本数据。数据集经过标注,区分了包含仇恨言论和非仇恨言论的推文,适用于仇恨言论检测任务的研究和开发。 数据用途概述:...
-
泰卢固语问答系统数据集
泰卢固语问答系统数据集 数据来源:互联网公开数据 标签:泰卢固语,问答系统,自然语言处理,机器学习,文本分析 数据概述: 本数据集专为构建泰卢固语问答系统而设计,包含了大量的泰卢固语问题及其对应的答案。数据集涵盖了多个领域的问题,包括但不限于科学、技术、文化、历史等,为开发和优化泰卢固语的问答系统提供了丰富的语言和知识基础。 数据用途概述:...
-
印度道路交通事故社交媒体推文数据集2023
印度道路交通事故社交媒体推文数据集2023 数据来源:互联网公开数据 标签:道路交通事故,社交媒体推文,印度,文本分析,安全研究,社会感知,交通管理 数据概述:...
-
印地语-英语混合数据集
印地语-英语混合数据集 数据来源:互联网公开数据 标签:印地语,英语,混合语言,评论数据,网络欺凌,文本分类,社会媒体分析 数据概述: 本数据集包含超过9000条标注的印地语-英语混合语言(Hinglish)评论。每条评论都被标注为0或1,分别表示非欺凌评论和欺凌评论。数据集提供了丰富的多语言文本样本,适用于分析和研究网络环境中的欺凌行为。...
-
BBC新闻数据集用于提取摘要
BBC新闻数据集用于提取摘要 数据来源:互联网公开数据 标签:BBC新闻,新闻摘要,自然语言处理,文本分析,机器学习,数据挖掘 数据概述: 本数据集来源于Kaggle平台,收录了BBC新闻的文章及其对应的摘要。数据集涵盖了五个不同的新闻类别:商业、科技、娱乐、体育和政治。每篇文章都配有一个简短的摘要,便于进行文本摘要技术的研究和应用。 数据用途概述:...
-
Reddit用户自杀意念文本数据集
Reddit用户自杀意念文本数据集 数据来源:互联网公开数据 标签:Reddit,自杀意念,文本数据,情感分析,自然语言处理,心理健康,社交媒体,情感识别 数据概述: 本数据集包含了Reddit平台上的用户帖子,这些帖子基于其内容被人工标注为“有自杀意念”或“无自杀意念”两类。标注过程严格遵循以下规则: 有自杀意念文本:...
-
泰米尔古语诗歌泰律罗卡数据集1963-2021
泰米尔古语诗歌泰律罗卡数据集1963-2021 数据来源:互联网公开数据 标签:泰律罗卡,泰米尔语,文学,翻译,教育,文本分析,机器学习 数据概述: 本数据集包含了《泰律罗卡》这部经典泰米尔文献的所有章节,共计1330行,6列数据。数据集详细记录了每个章节的原文、英译文及其在泰米尔语和英语中的解释,并对每个章节进行了主题分类。 数据用途概述:...
-
IMDB电影评论情感分类数据集1963-2021
IMDB电影评论情感分类数据集1963-2021 数据来源:互联网公开数据 标签:电影评论,情感分类,自然语言处理,机器学习,文本分析,训练数据,测试数据 数据概述:...
-
金融领域术语可读性评估数据集-FinRAD-2022
金融领域术语可读性评估数据集-FinRAD-2022 数据来源:互联网公开数据 标签:金融,可读性,自然语言处理,文本分析,术语,数据集,金融科技,语言学 数据概述: 本数据集,即FinRAD(Financial Readability Assessment...
-
数据2020年新闻数据集
数据2020年新闻数据集 数据来源:互联网公开数据 标签:新闻文章,ANI新闻,推荐系统,情感分析,时间戳,标签,数据收集 数据概述: 本数据集包含约2000篇从ANI新闻网站爬取的新闻文章。数据集涵盖了新闻文章的标题、链接、正文、发布时间、相关标签等多个关键信息,适用于构建高效的推荐系统、进行情感分析等多种应用场景。 数据用途概述:...
-
亚马逊食品产品评价数据集1963-2021
亚马逊食品产品评价数据集1963-2021 数据来源:互联网公开数据 标签:亚马逊,食品,产品信息,用户评价,产品名称,评分,文本分析,市场研究 数据概述:...
-



