找到5,740个数据集

标签: 文本分析

过滤结果
  • 安倍晋三推特数据集AbeShinzoTweetsDataset-lazon282

    2025年4月25日   

    安倍晋三推特数据集AbeShinzoTweetsDataset-lazon282 数据来源:互联网公开数据 标签:推特数据,政治人物,社交媒体,文本分析,自然语言处理,舆情分析,日本政治,数据集 数据概述: 该数据集包含来自日本前首相安倍晋三的推特数据,记录了其在推特平台上发布的所有推文。主要特征如下:...
    packageimg
  • 俄罗斯诗歌数据集RussianPoetryDataset-mira318

    2025年4月25日   

    俄罗斯诗歌数据集RussianPoetryDataset-mira318 数据来源:互联网公开数据 标签:诗歌,文学,俄语,数据集,文本分析,自然语言处理,文化研究,语言学 数据概述: 该数据集包含来自俄罗斯的诗歌作品,收录了不同时期,不同作者的诗歌,旨在为研究俄罗斯文学和语言提供数据支持。主要特征如下:...
    packageimg
  • 英汉平行语料数据集English-to-HindiParallelDataset-kuldeepsingharya

    2025年4月25日   

    英汉平行语料数据集English-to-HindiParallelDataset-kuldeepsingharya 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,印地语,英语,平行语料,语言学,文本分析 数据概述: 该数据集包含了英语和印地语的平行文本数据,旨在用于机器翻译模型的训练和评估。主要特征如下:...
    packageimg
  • 生物医学预印本数据集BioRxivCleanCSVDataset-zhaotxtina

    2025年4月25日   

    生物医学预印本数据集BioRxivCleanCSVDataset-zhaotxtina 数据来源:互联网公开数据 标签:生物医学,预印本,数据集,数据挖掘,机器学习,医学研究,文本分析,学术资源 数据概述: 该数据集包含来自BioRxiv(生物医学预印本平台)的预印本论文数据,记录了生物医学领域的学术论文信息。主要特征如下: 时间跨度:...
    packageimg
  • 情绪词汇提取数据集EmotionalWordExtractionDataset-luoshiyong

    2025年4月25日   

    情绪词汇提取数据集EmotionalWordExtractionDataset-luoshiyong 数据来源:互联网公开数据 标签:情绪词汇,数据集,自然语言处理,文本分析,情感计算,社会心理学,机器学习,语言学 数据概述: 该数据集包含来自多个来源的情绪词汇,记录了不同词汇对应的情绪类别及其相关特征。主要特征如下:...
    packageimg
  • Reddit用户评论数据集RedditUserCommentsDataset-robinlim6

    2025年4月25日   

    Reddit用户评论数据集RedditUserCommentsDataset-robinlim6 数据来源:互联网公开数据 标签:社交媒体,评论,数据集,文本分析,情感分析,自然语言处理,用户行为,数据挖掘 数据概述: 该数据集包含来自Reddit平台的公开用户评论数据,记录了用户在不同版块和帖子下的评论内容。主要特征如下:...
    packageimg
  • 重点分析数据集EmphasesAnalysisDataset-juliocaquino

    2025年4月25日   

    重点分析数据集EmphasesAnalysisDataset-juliocaquino 数据来源:互联网公开数据 标签:文本分析,主题建模,情感分析,数据集,自然语言处理,新闻报道,社会科学,舆情分析 数据概述: 该数据集包含来自新闻报道的文本数据,记录了不同时间段内关于特定主题的报道内容。主要特征如下:...
    packageimg
  • 智能手机用户反馈数据集SmartphoneUserFeedbackDataset-honinhvit

    2025年4月25日   

    智能手机用户反馈数据集SmartphoneUserFeedbackDataset-honinhvit 数据来源:互联网公开数据 标签:智能手机,用户反馈,数据集,消费者行为,市场研究,文本分析,自然语言处理,产品改进 数据概述:该数据集包含来自智能手机用户的反馈数据,记录了用户对智能手机产品使用体验的详细评价。主要特征如下:...
    packageimg
  • 编程课程分类数据集ProgrammingCourseClassificationDataset-smeetagrawal

    2025年4月25日   

    编程课程分类数据集ProgrammingCourseClassificationDataset-smeetagrawal 数据来源:互联网公开数据 标签:教育,课程分类,数据集,机器学习,文本分析,编程,教育技术,数据分析 数据概述: 该数据集包含来自多个在线教育平台的编程课程数据,记录了各类编程课程的信息。主要特征如下:...
    packageimg
  • 主题模型分析数据集LDADataset-raditsoic

    2025年4月25日   

    主题模型分析数据集LDADataset-raditsoic 数据来源:互联网公开数据 标签:主题模型,LDA,文本分析,自然语言处理,数据集,机器学习,文档分析,数据挖掘 数据概述: 该数据集包含用于主题模型分析的文本数据,旨在探索和发现文本集合中隐藏的主题结构。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体文本内容的时间属性。...
    packageimg
  • 地点提取推文数据集TweetsforLocationExtractionDataset-helendzashe

    2025年4月25日   

    地点提取推文数据集TweetsforLocationExtractionDataset-helendzashe 数据来源:互联网公开数据 标签:推文,数据集,地点提取,自然语言处理,地理信息,社交媒体,文本分析,大数据 数据概述: 该数据集包含来自社交媒体平台的推文数据,主要用于地点信息的提取和分析。主要特征如下:...
    packageimg
  • 网络欺凌检测数据集DetectingCyberbullyingDataset-sanzidasiddike3633

    2025年4月25日   

    网络欺凌检测数据集DetectingCyberbullyingDataset-sanzidasiddike3633 数据来源:互联网公开数据 标签:网络欺凌,数据集,文本分析,社交媒体,机器学习,情感分析,数据挖掘,网络安全 数据概述: 该数据集包含来自社交媒体和网络平台的数据,记录了与网络欺凌相关的文本内容。主要特征如下:...
    packageimg
  • Quora问答平台用户收入预测数据集QuoraQuestionswithEarningsDataset-alexgibso

    2025年4月25日   

    Quora问答平台用户收入预测数据集QuoraQuestionswithEarningsDataset-alexgibso 数据来源:互联网公开数据 标签:问答平台,用户收入,数据集,机器学习,自然语言处理,文本分析,社交媒体,收入预测 数据概述:...
    packageimg
  • 总统演讲文本分析数据集PresidentSpeechTextAnalysisDataset-ahmetsinasoygan

    2025年4月25日   

    总统演讲文本分析数据集PresidentSpeechTextAnalysisDataset-ahmetsinasoygan 数据来源:互联网公开数据 标签:政治,演讲,文本分析,自然语言处理,机器学习,数据挖掘,公共管理,社会科学 数据概述: 该数据集包含来自多个国家总统的演讲文本数据,记录了不同时期,不同场合的演讲内容。主要特征如下:...
    packageimg
  • 阿拉伯语新闻分类数据集-essasartawi

    2025年4月25日   

    阿拉伯语新闻分类数据集-essasartawi 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,阿拉伯语处理,信息检索,文本挖掘 数据概述:该数据集包含来自阿拉伯语新闻媒体的新闻文章,旨在用于新闻分类任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 图卢维基百科数据转储2023年数据集-moreducks

    2025年4月25日   

    图卢维基百科数据转储2023年数据集-moreducks 数据来源:互联网公开数据 标签:维基百科,数据集,自然语言处理,文本分析,机器学习,知识图谱,语言学,信息检索 数据概述: 该数据集包含来自图卢维基百科的2023年数据转储,记录了图卢维基百科上的文章内容和元数据。主要特征如下: 时间跨度:数据记录的时间范围从图卢维基百科创建到2023年。...
    packageimg
  • 恶意软件一元词数据集Malware1-gramSampleDataset-syira19

    2025年4月25日   

    恶意软件一元词数据集Malware1-gramSampleDataset-syira19 数据来源:互联网公开数据 标签:恶意软件,数据集,一元词,文本分析,机器学习,安全研究,恶意代码检测,自然语言处理 数据概述: 该数据集包含恶意软件样本的一元词数据,用于恶意软件检测和分析。主要特征如下:...
    packageimg
  • 文本摘要任务数据集FinalTextSummarizationDataset-devtousif

    2025年4月25日   

    文本摘要任务数据集FinalTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,深度学习,机器翻译,文本分析,人工智能,NLP 数据概述: 该数据集包含用于文本摘要任务的文本数据,旨在评估和训练文本摘要模型。主要特征如下:...
    packageimg
  • Twitter推文数据集2022年9月GEJAYAN事件相关推文-adhamelite

    2025年4月25日   

    Twitter推文数据集2022年9月GEJAYAN事件相关推文-adhamelite 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,机器学习,舆情监测,大数据,传播学 数据概述:该数据集包含来自Twitter平台的数据,记录了2022年9月与GEJAYAN事件相关的推文内容。主要特征如下:...
    packageimg
  • 呼叫中心通话记录数据集CallCentreDataset-jwilsh

    2025年4月25日   

    呼叫中心通话记录数据集CallCentreDataset-jwilsh 数据来源:互联网公开数据 标签:呼叫中心,通话记录,文本分析,情感分析,自然语言处理,客户服务,机器学习,语音识别 数据概述: 该数据集包含来自呼叫中心的通话记录数据,记录了客户与客服之间的对话内容。主要特征如下:...
    packageimg