-
-
多语言视觉问答数据集
多语言视觉问答数据集 数据来源:互联网公开数据 标签:多语言,视觉问答,英语,越南语,日语,图像分析,自然语言处理,跨语言学习 数据概述: 本数据集是首个包含英语、越南语和日语三种语言的多语言视觉问答数据集,包含33,000多个由人工创建的问题-... -
亚马逊商品评论情感细粒度分析数据集-训练与测试集
亚马逊商品评论情感细粒度分析数据集-训练与测试集 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本数据,机器学习,自然语言处理,训练集,测试集 数据概述:... -
印度Reddit论坛所有帖子数据集2023
印度Reddit论坛所有帖子数据集2023 数据来源:互联网公开数据 标签:Reddit,印度论坛,帖子数据,机器学习,文本分析,自然语言处理,数据分析 数据概述: 本数据集包含了印度 Reddit 论坛(r/india)上的所有帖子数据,旨在为构建帖子标签预测模型提供充足的数据支持。数据通过 Pushshift API... -
Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间
Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间 数据来源:互联网公开数据 标签:Reddit,社区,帖子,主题分类,文本分类,自然语言处理,机器学习,社交媒体,推荐系统 数据概述:... -
-
-
推特趋势话题与用户数据集
推特趋势话题与用户数据集 数据来源:互联网公开数据 标签:推特,趋势话题,用户行为,社交网络分析,自然语言处理,聚类分析,推荐系统,机器人检测 数据概述:... -
IMDB电影评论情感分析数据集-2021-mirnasherif
IMDB电影评论情感分析数据集-2021-mirnasherif 数据来源:互联网公开数据 标签:IMDB,电影评论,情感分析,NLP,文本分析,机器学习,深度学习,自然语言处理 数据概述: 本数据集来源于IMDB,包含332,220条电影评论,以及对应的电影标题和IMDB的唯一标识符(tconst),旨在支持情感分析任务。数据集包含以下字段:... -
印度语短文本摘要语料库数据集
印度语短文本摘要语料库数据集 数据来源:互联网公开数据 标签:印度语,文本摘要,新闻文章,自然语言处理,机器学习,语料库 数据概述: 本数据集包含约330,000篇来自印度新闻网站的文章及其标题,是首个用于基准测试的印度语文本摘要数据集。数据集保留了原文中的标点符号、数字等信息,为研究和开发印度语文本摘要技术提供了丰富的数据基础。 数据用途概述:... -
科学论文与新闻稿匹配数据集-chenxinye
科学论文与新闻稿匹配数据集-chenxinye 数据来源:互联网公开数据 标签:科学,论文,新闻,匹配,自然语言处理,文本分析,科研,媒体,标题,摘要 数据概述:... -
孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan
孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan 数据来源:互联网公开数据 标签:孟加拉语,新闻,文本,自然语言处理,NLP,文本分析,孟加拉国,BD-Pratidin,语料库 数据概述: 本数据集包含了从2017年12月13日至2020年9月9日期间,孟加拉国日报(BD-... -
美国东北地区法院意见情感分析数据集
美国东北地区法院意见情感分析数据集 数据来源:互联网公开数据 标签:法院意见,情感分析,法律研究,美国东北地区,历史案例,文本挖掘,自然语言处理,司法数据,法律科技 数据概述:... -
问答知识库构建与内容检索数据集QuestionAnsweringKnowledgeBaseConstructionandContentRetrievalD...
问答知识库构建与内容检索数据集QuestionAnsweringKnowledgeBaseConstructionandContentRetrievalDataset-ouaillaamiri02 数据来源:互联网公开数据 标签:问答系统, 知识库构建, 内容检索, 自然语言处理, 文本分析, 信息抽取, 机器学习, 语料库 数据概述:... -
-
学术论文摘要分析数据集AcademicPaperAbstractAnalysis-mengjie12138
学术论文摘要分析数据集AcademicPaperAbstractAnalysis-mengjie12138 数据来源:互联网公开数据 标签:学术论文, 摘要分析, 自然语言处理, 文本挖掘, 论文检索, 学术研究, 文本分类, 数据集 数据概述: 该数据集包含来自学术论文的数据,记录了不同年份的论文摘要信息,主要用于文本分析和研究。主要特征如下:... -
宝可梦图像描述生成训练数据集PokemonImageCaptioningTrainingDataset-utkarshshukla070
宝可梦图像描述生成训练数据集PokemonImageCaptioningTrainingDataset-utkarshshukla070 数据来源:互联网公开数据 标签:宝可梦, 图像描述, 图像识别, 自然语言处理, 机器学习, 文本生成, 数据集, 计算机视觉 数据概述:... -
文本分类情感分析数据集TextClassificationSentimentAnalysis-quoniammm
文本分类情感分析数据集TextClassificationSentimentAnalysis-quoniammm 数据来源:互联网公开数据 标签:情感分析, 文本分类, 机器学习, 自然语言处理, 情感极性, 数据标注, 文本数据, 情感识别 数据概述: 该数据集包含用于情感分析任务的文本数据,记录了文本内容及其对应的情感标签。主要特征如下:... -
孟加拉新闻真假识别数据集BanglaNewsFakeDetectionDataset-sertgwkwu
孟加拉新闻真假识别数据集BanglaNewsFakeDetectionDataset-sertgwkwu 数据来源:互联网公开数据 标签:新闻真伪, 文本分类, 自然语言处理, 机器学习, 孟加拉语, 舆情分析, 虚假信息, 情感分析 数据概述:... -
语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi
语法规则解析与文本片段生成数据集GrammarRuleParsingandTextFragmentGeneration-kiiroi 数据来源:互联网公开数据 标签:自然语言处理, 语法分析, 文本生成, 规则提取, 语料库, 机器学习, 文本片段, 语言模型 数据概述:...