-
旅游景点评论情感分析数据集TourismAttractionReviewSentimentAnalysis-daniabizara
旅游景点评论情感分析数据集TourismAttractionReviewSentimentAnalysis-daniabizara 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 旅游评论, 景点评价, 自然语言处理, 情感极性, 数据标注, 机器学习 数据概述:... -
新闻问答语料库问题集NewsQuestionCorpus-oralia
新闻问答语料库问题集NewsQuestionCorpus-oralia 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本分析, 信息检索, 知识图谱, 语料库, 文本挖掘, 机器学习 数据概述: 该数据集包含来自新闻问答语料库的问题集,记录了各种新闻报道相关的提问。主要特征如下: 时间跨度:数据未标明具体时间,视作静态问题集合。... -
音频字幕情感分析数据集AudioSubtitleSentimentAnalysis-abhigyanbasak
音频字幕情感分析数据集AudioSubtitleSentimentAnalysis-abhigyanbasak 数据来源:互联网公开数据 标签:情感分析, 音频数据, 字幕数据, 语音识别, 文本分类, 自然语言处理, 数据标注, 情绪识别 数据概述: 该数据集包含音频文件及其对应的字幕文本,记录了不同情感表达的语音片段。主要特征如下:... -
大规模语言检测数据集
大规模语言检测数据集 数据来源:互联网公开数据 标签:语言检测,ISO 639-3,自然语言处理,多语言支持,文本分析,语言识别,机器学习 数据概述: 本数据集包含一个约10^7行的.csv文件,每行记录包含一个句子及其对应的ISO 639-3语言代码。此外,数据集还包括一个.json文件,用于映射ISO... -
日英字幕语料库数据集-2020年-onslaught
日英字幕语料库数据集-2020年-onslaught 数据来源:互联网公开数据 标签:日英翻译,字幕,机器翻译,语言处理,语料库,自然语言处理,信息提取 数据概述:... -
以色列国防军加沙战争2024新闻数据集
以色列国防军加沙战争2024新闻数据集 数据来源:互联网公开数据 标签:以色列国防军,加沙战争,2024,新闻,自然语言处理,实体识别,趋势分析 数据概述:... -
图卢语言辅助任务数据集-2023-thedevastator
图卢语言辅助任务数据集-2023-thedevastator 数据来源:互联网公开数据 标签:Tulu语言,自然语言处理,辅助技术,机器学习,数据集,科学研究,语音识别,人工智能,语言模型 数据概述:... -
COVID-19问答数据集-StackExchange-2021
COVID-19问答数据集-StackExchange-2021 数据来源:互联网公开数据 标签:COVID-19,问答,StackExchange,训练数据,自然语言处理,机器学习,疫情信息 数据概述: 本数据集是用于COVID-... -
SWE-bench软件工程任务数据集聚合版
SWE-bench软件工程任务数据集聚合版 数据来源:互联网公开数据 标签:软件工程,基准测试,代码,任务,评估,机器学习,自然语言处理,Python,SWE-bench,Full,Lite,Verified 数据概述: 本数据集是SWE-bench(Software Engineering... -
NEO-NDA增强数据集-文本分类应用数据集-2023-lucaszl
NEO-NDA增强数据集-文本分类应用数据集-2023-lucaszl 数据来源:互联网公开数据 标签:NEO-NDA,增强数据,文本分类,数据集,自然语言处理,NLP,机器学习,文本数据 数据概述: 本数据集包含使用NEO-... -
电影剧情问答数据集Wikipedia-IMDb-thedevastator
电影剧情问答数据集Wikipedia-IMDb-thedevastator 数据来源:互联网公开数据 标签:问答,自然语言处理,电影,剧情,Wikipedia,IMDb,文本,机器阅读理解,语义理解 数据概述:... -
Jigsaw毒性分类训练数据集-2019-zaheenchoudhry
Jigsaw毒性分类训练数据集-2019-zaheenchoudhry 数据来源:互联网公开数据 标签:Jigsaw, 毒性分类, 训练数据, GloVe嵌入, 文本处理, 机器学习, 自然语言处理, 数据预处理 数据概述: 本数据集是Jigsaw Unintended Bias in Toxicity... -
金融社区讨论文本数据集-2021至2023年-paolodelia
金融社区讨论文本数据集-2021至2023年-paolodelia 数据来源:互联网公开数据 标签:金融,投资,市场趋势,文本分析,自然语言处理,Reddit,社会媒体,话题建模 数据概述: 本数据集包含从多个主要金融Reddit社区(r/investing, r/finance, r/options等)收集的帖子文本数据。数据通过Python... -
印度语地名识别标注数据集HindiNamedEntityRecognitionDataset-vishal19217
印度语地名识别标注数据集HindiNamedEntityRecognitionDataset-vishal19217 数据来源:互联网公开数据 标签:自然语言处理, 命名实体识别, 地名识别, 印度语, 文本标注, 语言学, 机器学习, 文本分析 数据概述: 该数据集包含来自印度语文本的数据,记录了经过标注的句子,用于识别其中的地名实体。主要特征如下:... -
自然语言处理与图像识别多模态数据集MultimodalDatasetforNaturalLanguageProcessingandImageRecogni...
自然语言处理与图像识别多模态数据集MultimodalDatasetforNaturalLanguageProcessingandImageRecognition-wangrunye 数据来源:互联网公开数据 标签:自然语言处理, 图像识别, 多模态, 文本数据, 图像数据, 数据集, 机器学习, 深度学习 数据概述:... -
社交媒体灾难信息文本分类数据集SocialMediaDisasterInformationTextClassification-frank3305
社交媒体灾难信息文本分类数据集SocialMediaDisasterInformationTextClassification-frank3305 数据来源:互联网公开数据 标签:文本分类, 灾难信息, 社交媒体, 机器学习, 自然语言处理, 情感分析, 关键词提取, 地理位置 数据概述:... -
情感分析预测提交数据集SentimentAnalysisPredictionSubmission-anechkaa
情感分析预测提交数据集SentimentAnalysisPredictionSubmission-anechkaa 数据来源:互联网公开数据 标签:情感分析,文本情感,预测提交,自然语言处理,机器学习,情感分类,数据提交,模型评估 数据概述: 该数据集包含一个用于情感分析预测任务的提交文件,记录了待预测文本的ID以及预测的情感极性。主要特征如下:... -
情感分析多模态视频评论数据集SentimentAnalysisMultimodalVideoCommentDataset-cucspark
情感分析多模态视频评论数据集SentimentAnalysisMultimodalVideoCommentDataset-cucspark 数据来源:互联网公开数据 标签:情感分析, 多模态, 视频评论, 文本分析, 情感标注, 机器学习, 视频理解, 自然语言处理 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-cyrillicw
电影评论情感分析数据集MovieReviewSentimentAnalysis-cyrillicw 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含来自电影评论网站的评论文本,记录了观众对电影的评价信息。主要特征如下:...