-
商品标题文本信息分析数据集ProductTitleTextInformationAnalysis-its4iris
商品标题文本信息分析数据集ProductTitleTextInformationAnalysis-its4iris 数据来源:互联网公开数据 标签:商品标题, 文本分析, 商品分类, 文本挖掘, 机器学习, 电商, 自然语言处理, 产品描述 数据概述: 该数据集包含来自电商平台的商品标题信息,记录了商品的名称、描述以及产品类型等关键信息。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-virendrasinhchavda
电影评论情感分析数据集MovieReviewSentimentAnalysis-virendrasinhchavda 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论数据,记录了电影评论文本及其对应的情感极性标签。主要特征如下:... -
Quora问题真实性预测文本数据集-2017年-minakshikarwa
Quora问题真实性预测文本数据集-2017年-minakshikarwa 数据来源:互联网公开数据 标签:自然语言处理,文本分类,问题,Quora,真实性,机器学习,NLTK,TfidfVectorizer,朴素贝叶斯 数据概述:... -
维基百科人物传记文本生成数据集-thedevastator
维基百科人物传记文本生成数据集-thedevastator 数据来源:互联网公开数据 标签:维基百科,人物传记,文本生成,自然语言处理,机器学习,文本摘要,信息抽取 数据概述:... -
社交媒体推文情感分析数据集SocialMediaTweetsSentimentAnalysis-sucsebd
社交媒体推文情感分析数据集SocialMediaTweetsSentimentAnalysis-sucsebd 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本挖掘, 自然语言处理, 推文, 情感分类, 舆情分析, 数据标注 数据概述:... -
文本摘要与分类数据集TextSummarizationandClassificationDataset-abhishek11102000
文本摘要与分类数据集TextSummarizationandClassificationDataset-abhishek11102000 数据来源:互联网公开数据 标签:文本摘要, 文本分类, 自然语言处理, 机器学习, 数据集, 语料库, 文本分析, 信息检索 数据概述:... -
-
-
汽车与酒店评论情感分析数据集-2007至2009年-memoonashah
汽车与酒店评论情感分析数据集-2007至2009年-memoonashah 数据来源:互联网公开数据 标签:汽车评论,酒店评论,情感分析,机器学习,自然语言处理,UCI数据集,OpinRank 数据概述: 本数据集来源于2011年由Ganesan, Kavita和Zhai, ChengXiang编纂的OpinRank Review... -
环境污染与文本分析数据集EnvironmentalPollutionandTextAnalysis-tabualkher
环境污染与文本分析数据集EnvironmentalPollutionandTextAnalysis-tabualkher 数据来源:互联网公开数据 标签:环境污染, 文本分析, 负面情绪, 文本情感分析, 自然语言处理, 污染治理, 机器学习, 语料库 数据概述:... -
政治新闻真伪识别数据集PoliticalNewsTruthfulnessIdentificationDataset-bandimohitha
政治新闻真伪识别数据集PoliticalNewsTruthfulnessIdentificationDataset-bandimohitha 数据来源:互联网公开数据 标签:新闻真伪, 政治新闻, 文本分类, 假新闻检测, 机器学习, 自然语言处理, 舆情分析, 数据标注 数据概述:... -
旅游景点评论情感分析数据集TourismAttractionReviewSentimentAnalysis-daniabizara
旅游景点评论情感分析数据集TourismAttractionReviewSentimentAnalysis-daniabizara 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 旅游评论, 景点评价, 自然语言处理, 情感极性, 数据标注, 机器学习 数据概述:... -
新闻问答语料库问题集NewsQuestionCorpus-oralia
新闻问答语料库问题集NewsQuestionCorpus-oralia 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本分析, 信息检索, 知识图谱, 语料库, 文本挖掘, 机器学习 数据概述: 该数据集包含来自新闻问答语料库的问题集,记录了各种新闻报道相关的提问。主要特征如下: 时间跨度:数据未标明具体时间,视作静态问题集合。... -
音频字幕情感分析数据集AudioSubtitleSentimentAnalysis-abhigyanbasak
音频字幕情感分析数据集AudioSubtitleSentimentAnalysis-abhigyanbasak 数据来源:互联网公开数据 标签:情感分析, 音频数据, 字幕数据, 语音识别, 文本分类, 自然语言处理, 数据标注, 情绪识别 数据概述: 该数据集包含音频文件及其对应的字幕文本,记录了不同情感表达的语音片段。主要特征如下:... -
大规模语言检测数据集
大规模语言检测数据集 数据来源:互联网公开数据 标签:语言检测,ISO 639-3,自然语言处理,多语言支持,文本分析,语言识别,机器学习 数据概述: 本数据集包含一个约10^7行的.csv文件,每行记录包含一个句子及其对应的ISO 639-3语言代码。此外,数据集还包括一个.json文件,用于映射ISO... -
日英字幕语料库数据集-2020年-onslaught
日英字幕语料库数据集-2020年-onslaught 数据来源:互联网公开数据 标签:日英翻译,字幕,机器翻译,语言处理,语料库,自然语言处理,信息提取 数据概述:... -
以色列国防军加沙战争2024新闻数据集
以色列国防军加沙战争2024新闻数据集 数据来源:互联网公开数据 标签:以色列国防军,加沙战争,2024,新闻,自然语言处理,实体识别,趋势分析 数据概述:... -
图卢语言辅助任务数据集-2023-thedevastator
图卢语言辅助任务数据集-2023-thedevastator 数据来源:互联网公开数据 标签:Tulu语言,自然语言处理,辅助技术,机器学习,数据集,科学研究,语音识别,人工智能,语言模型 数据概述:... -
COVID-19问答数据集-StackExchange-2021
COVID-19问答数据集-StackExchange-2021 数据来源:互联网公开数据 标签:COVID-19,问答,StackExchange,训练数据,自然语言处理,机器学习,疫情信息 数据概述: 本数据集是用于COVID-... -
SWE-bench软件工程任务数据集聚合版
SWE-bench软件工程任务数据集聚合版 数据来源:互联网公开数据 标签:软件工程,基准测试,代码,任务,评估,机器学习,自然语言处理,Python,SWE-bench,Full,Lite,Verified 数据概述: 本数据集是SWE-bench(Software Engineering...