-
问答平台相似问题配对数据集QuoraPairsDataset-develina
问答平台相似问题配对数据集QuoraPairsDataset-develina 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,文本相似度,机器学习,数据挖掘,人工智能,语言模型 数据概述: 该数据集来源于问答平台Quora,包含了大量用户提交的问题对,用于判断问题是否相似或重复。主要特征如下:... -
写作质量评估特征重要性数据集WritingQualityAssessmentFeatureImportanceDataset-abbccaabb
写作质量评估特征重要性数据集WritingQualityAssessmentFeatureImportanceDataset-abbccaabb 数据来源:互联网公开数据 标签:写作质量评估, 自然语言处理, 特征工程, 机器学习, 文本分析, 情感分析, 文本分类, 模型评估 数据概述:... -
社交平台评论文本毒性分析数据集SocialPlatformCommentTextToxicityAnalysis-httpwwwfszyc
社交平台评论文本毒性分析数据集SocialPlatformCommentTextToxicityAnalysis-httpwwwfszyc 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 机器学习, 自然语言处理, 评论数据, 多标签分类, 社交媒体 数据概述:... -
社交媒体用户页面内容与开放式问答互动数据集SocialMediaUserPageContent-Open-endedQuestionInteraction...
社交媒体用户页面内容与开放式问答互动数据集SocialMediaUserPageContent-Open-endedQuestionInteraction-marupedia 数据来源:互联网公开数据 标签:社交媒体, 用户行为分析, 文本分析, 开放式问答, 互动内容, 机器学习, 自然语言处理, 数据挖掘 数据概述:... -
孟加拉语文本摘要数据集BengaliTextSummarizationDataset-hasanmoni
孟加拉语文本摘要数据集BengaliTextSummarizationDataset-hasanmoni 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,语言技术,孟加拉语,文本分析,信息提取 数据概述:该数据集包含来自互联网公开资源的孟加拉语文本及其对应的摘要,适用于文本摘要生成和自然语言处理研究。主要特征如下:... -
堤坝安全法律文本语料数据集LegalDocumentCorpusforDamSafety-ictworld
堤坝安全法律文本语料数据集LegalDocumentCorpusforDamSafety-ictworld 数据来源:互联网公开数据 标签:法律文本, 堤坝安全, 水利工程, 自然语言处理, 文本分析, 语料库, 法律法规, 文本挖掘 数据概述:... -
社交媒体平台ChatGPT相关推文数据集SocialMediaPlatformChatGPTTweets-giancarloespitiarmz
社交媒体平台ChatGPT相关推文数据集SocialMediaPlatformChatGPTTweets-giancarloespitiarmz 数据来源:互联网公开数据 标签:ChatGPT, 社交媒体, 文本分析, 推文, 自然语言处理, 情感分析, 用户行为, 机器学习 数据概述:... -
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-preetrajgupta
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-preetrajgupta 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分析, 舆情分析, 自然语言处理, 情感分类, 情绪识别, 用户行为 数据概述: 该数据集包含来自社交媒体平台的用户生成文本数据,记录了用户表达的情感倾向。主要特征如下:... -
法律领域摘要数据集-valleyy
法律领域摘要数据集-valleyy 数据来源:互联网公开数据 标签:法律,数据集,文本摘要,自然语言处理,机器学习,法律文书,信息检索,人工智能 数据概述: 该数据集包含了来自法律领域的文本数据,主要用于文本摘要任务。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同时期的法律文书。 地理范围:... -
英国维基百科图片OCR识别数据集UKWikipediaImageOCRRecognition-thnhhunhtn
英国维基百科图片OCR识别数据集UKWikipediaImageOCRRecognition-thnhhunhtn 数据来源:互联网公开数据 标签:OCR, 图像识别, 文本识别, 维基百科, 英国, 图像数据, 自然语言处理, 数据集 数据概述:... -
虚假新闻分类与检测数据集FakeNewsClassifierProcessedDataset-rikbandhopadhaya
虚假新闻分类与检测数据集FakeNewsClassifierProcessedDataset-rikbandhopadhaya 数据来源:互联网公开数据 标签:新闻分类,虚假信息,数据集,自然语言处理,机器学习,文本分析,信息传播,数据分析 数据概述: 该数据集包含经过处理的虚假新闻和真实新闻文本数据,用于虚假新闻的识别与分类。主要特征如下:... -
多选题混合数据集v3MCQ-MIX-V3Dataset-conjuring92
多选题混合数据集v3MCQ-MIX-V3Dataset-conjuring92 数据来源:互联网公开数据 标签:教育评估,多选题,数据集,机器学习,自然语言处理,教育技术,考试分析,智能学习 数据概述: 该数据集包含来自不同学科领域的高质量多选题数据,记录了题干、选项、正确答案及解析等信息。主要特征如下:... -
门控循环单元权重数据集GRUWeightsDataset-lolik228
门控循环单元权重数据集GRUWeightsDataset-lolik228 数据来源:互联网公开数据 标签:神经网络,深度学习,数据集,序列建模,自然语言处理,GRU模型,时间序列,人工智能 数据概述: 该数据集包含门控循环单元(GRU)神经网络的权重参数,适用于序列数据处理和建模任务。主要特征如下:... -
多模态情感分析数据集MultimodalSentimentAnalysisDataset-lakinenapavani
多模态情感分析数据集MultimodalSentimentAnalysisDataset-lakinenapavani 数据来源:互联网公开数据 标签:情感分析,多模态,数据集,自然语言处理,计算机视觉,机器学习,情感识别,文本分析 数据概述:... -
神经科学前沿论文数据集FrontiersinNeuroscienceArticlesDataset-markoarezina
神经科学前沿论文数据集FrontiersinNeuroscienceArticlesDataset-markoarezina 数据来源:互联网公开数据 标签:神经科学,论文,数据集,学术研究,机器学习,文本分析,自然语言处理,生物医学 数据概述: 该数据集包含来自神经科学前沿期刊(Frontiers in... -
数据2020年3月新冠疫情推文数据集-a1079602570
2020年3月新冠疫情推文数据集-a1079602570 数据来源:互联网公开数据 标签:新冠疫情,推文,社交媒体,文本分析,自然语言处理,情感分析,疫情传播,舆情分析 数据概述:该数据集包含了2020年3月期间在推特(Twitter)上发布的关于新冠疫情的推文数据,记录了全球用户对疫情的讨论和观点。主要特征如下:... -
俄语文本情感分析数据集RussianTextSentimentAnalysisDataset-eugenegolovanoov
俄语文本情感分析数据集RussianTextSentimentAnalysisDataset-eugenegolovanoov 数据来源:互联网公开数据 标签:情感分析, 俄语, 文本分类, 情感极性, 数据标注, 机器学习, 自然语言处理, 语言学 数据概述: 该数据集包含来自不同来源的俄语文本数据,旨在用于情感分析任务。主要特征如下:... -
文本嵌入向量处理数据集-mrwynx
文本嵌入向量处理数据集-mrwynx 数据来源:互联网公开数据 标签:自然语言处理,文本分析,嵌入向量,数据集,机器学习,语义分析,信息检索,向量空间 数据概述: 该数据集包含了经过处理的文本嵌入向量,旨在用于各种自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不限,取决于原始文本数据的时间范围。... -
Reddit社区帖子与评论数据集RedditRaitaPostandCommentsDataset-oliverposewitz
Reddit社区帖子与评论数据集RedditRaitaPostandCommentsDataset-oliverposewitz 数据来源:互联网公开数据 标签:社交媒体,网络论坛,数据集,文本分析,情感分析,自然语言处理,机器学习,社区互动 数据概述:... -
社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer
社交媒体虚假新闻检测数据集SocialMediaFakeNewsDetectionDataset-pornimaveer 数据来源:互联网公开数据 标签:社交媒体,虚假新闻,NLP,文本分类,机器学习,自然语言处理,信息检索,谣言检测 数据概述: 该数据集包含来自社交媒体平台的文本数据,用于虚假新闻的检测与分析。主要特征如下:...