-
-
网络欺凌文本数据集-rohansandipborhade
网络欺凌文本数据集-rohansandipborhade 数据来源:互联网公开数据 标签:网络欺凌,文本数据,情感分析,自然语言处理,欺凌检测,社交媒体,数据集,恶意内容 数据概述: 该数据集包含了关于网络欺凌行为的文本数据,旨在用于研究和开发自动检测和分析网络欺凌的工具。主要特征如下: 时间跨度:... -
大型语言模型与人工智能文本数据集LLM-AI-TextDataset-snehapriyaamp
大型语言模型与人工智能文本数据集LLM-AI-TextDataset-snehapriyaamp 数据来源:互联网公开数据 标签:人工智能,语言模型,文本数据,自然语言处理,机器学习,深度学习,数据集,多语言处理 数据概述: 该数据集包含来自多个来源的文本数据,记录了大型语言模型(LLM)和人工智能(AI)生成的文本内容。主要特征如下:... -
电影预告片评论数据集ZeroMovieTrailerCommentsDataset-nandivardhanreddy
电影预告片评论数据集ZeroMovieTrailerCommentsDataset-nandivardhanreddy 数据来源:互联网公开数据 标签:电影,预告片,评论,情感分析,自然语言处理,文本数据,机器学习,用户行为 数据概述: 该数据集包含了电影预告片的评论数据,旨在用于情感分析,用户行为研究等相关任务。主要特征如下:... -
罗马乌尔都语文本情感分析数据集-adilahmedcs
罗马乌尔都语文本情感分析数据集-adilahmedcs 数据来源:互联网公开数据 标签:乌尔都语,罗马乌尔都语,情感分析,自然语言处理,文本数据,机器学习,语言学,社交媒体 数据概述: 该数据集包含来自互联网的罗马乌尔都语文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了从社交媒体,论坛等平台收集的近期数据。... -
Metacritic游戏评论文本情感分析数据集1998-2018
Metacritic游戏评论文本情感分析数据集1998-2018 数据来源:互联网公开数据 标签:游戏评论,Metacritic,情感分析,自然语言处理,推荐系统,用户评价,游戏行业,文本数据 数据概述:... -
多语言问答数据集-TyDiQA可回答问题子集
多语言问答数据集-TyDiQA可回答问题子集 数据来源:互联网公开数据 标签:自然语言处理,NLP,问答系统,机器阅读理解,多语言,文本数据,AI,语言学,TydiQA,Hugging Face 数据概述: Answerable-TyDiQA数据集是TyDi QA数据集的子集,TyDi QA是一个涵盖11种语言的问答数据集。Answerable-... -
StackOverflowPython问题与解答数据集
StackOverflowPython问题与解答数据集 数据来源:互联网公开数据 标签:Stack Overflow, Python, 问答, 编程, 数据集, 自然语言处理, 机器学习, 文本数据, 问答对 数据概述: 本数据集是从Stack Exchange数据资源管理器中提取的,包含了50000条带有"python"标签的Stack... -
乌尔都语罗马字符文本数据集RomanUrduDatasets-sameedrazi
乌尔都语罗马字符文本数据集RomanUrduDatasets-sameedrazi 数据来源:互联网公开数据 标签:乌尔都语,罗马字符,文本数据,自然语言处理,NLP,语言学,数据集,文本分析 数据概述: 该数据集包含使用罗马字符书写的乌尔都语文本数据,旨在促进乌尔都语的自然语言处理研究。主要特征如下:... -
大规模通用文本数据集LLM-Text-Data-abramova
大规模通用文本数据集LLM-Text-Data-abramova 数据来源:互联网公开数据 标签:文本数据,自然语言处理,大型语言模型,数据集,文本分析,机器学习,数据挖掘,通用领域 数据概述:该数据集包含了大规模的通用文本数据,旨在支持大型语言模型(LLM)的训练,评估和研究。主要特征如下:... -
Reddit社区评论情感分析数据集RedditCommentsSentimentAnalysisDataset-diyashreedevadiga
Reddit社区评论情感分析数据集RedditCommentsSentimentAnalysisDataset-diyashreedevadiga 数据来源:互联网公开数据 标签:社交媒体,情感分析,自然语言处理,文本数据,机器学习,评论数据,舆情分析,文本挖掘 数据概述:... -
增强情感文本数据集AugmentedEmotextDataset-sidd3k
增强情感文本数据集AugmentedEmotextDataset-sidd3k 数据来源:互联网公开数据 标签:情感分析,文本数据,数据集,自然语言处理,机器学习,情感分类,社交媒体,情绪识别 数据概述: 该数据集包含增强的情感文本数据,主要来源于社交媒体平台和评论文本,旨在用于情感分析,情绪识别等自然语言处理任务。主要特征如下:... -
自然语言处理NLP实践数据集-north151
自然语言处理NLP实践数据集-north151 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本数据,机器学习,语言模型,文本分类,情感分析,信息抽取,数据集 数据概述: 该数据集包含用于自然语言处理(NLP)实践的文本数据,主要用于训练和评估NLP模型。主要特征如下: 时间跨度:数据无明确时间范围,涵盖多种文本数据类型。... -
孟加拉语文本情感分析数据集-shadikaafroze
孟加拉语文本情感分析数据集-shadikaafroze 数据来源:互联网公开数据 标签:自然语言处理,情感分析,文本数据,孟加拉语,机器学习,情感分类,数据集,语言学 数据概述: 该数据集包含孟加拉语文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据收集时间跨度未知,但包含了近期和历史的孟加拉语文本。... -
阿拉伯语文本情感分析数据集-akshat18
阿拉伯语文本情感分析数据集-akshat18 数据来源:互联网公开数据 标签:自然语言处理,情感分析,阿拉伯语,文本数据,机器学习,语言学,舆情分析,文本分类 数据概述: 该数据集包含了大量的阿拉伯语文本,并标注了相应的情感极性。主要特征如下: 时间跨度: 数据未明确时间跨度,但数据内容反映了当前社会和文化背景。 地理范围:... -
伊朗地区波斯语推特文本数据集LimitedPersianIRTwitterTextDataset-amirali10281
伊朗地区波斯语推特文本数据集LimitedPersianIRTwitterTextDataset-amirali10281 数据来源:互联网公开数据 标签:波斯语,推特,文本数据,自然语言处理,情感分析,社交媒体,伊朗,机器学习 数据概述: 该数据集包含了来自伊朗地区的波斯语推特文本数据,旨在为自然语言处理和文本分析研究提供支持。主要特征如下:... -
乌尔都语情感分析语料库数据集UrduSentimentCorpusNLPDataset-muhammadrabeebinamir
乌尔都语情感分析语料库数据集UrduSentimentCorpusNLPDataset-muhammadrabeebinamir 数据来源:互联网公开数据 标签:情感分析,自然语言处理,乌尔都语,文本数据,数据集,情感分类,语言学,机器学习 数据概述: 该数据集包含乌尔都语文本数据,用于情感分析任务。主要特征如下:... -
光学字符识别文本数据集OCRTextDataset-hardik836
光学字符识别文本数据集OCRTextDataset-hardik836 数据来源:互联网公开数据 标签:光学字符识别,文本数据,数据集,机器学习,图像处理,自然语言处理,人工智能,计算机视觉 数据概述: 该数据集包含了来自多种来源的扫描文档和图像的文本数据,适用于光学字符识别(OCR)技术的研究和应用。主要特征如下:... -
-
英语学习文本数据集en-train-csv-elguapo
英语学习文本数据集en-train-csv-elguapo 数据来源:互联网公开数据 标签:英语学习,文本数据,自然语言处理,语言模型,数据集,语料库,机器学习,文本分析 数据概述: 该数据集包含了用于英语学习的文本数据,记录了大量的英语句子,段落及文章。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时期的英语文本。 地理范围:...