找到5,735个数据集

标签: 文本分析

过滤结果
  • 全球顶尖跨国公司MNCs社交媒体数据分析数据集-nirbhayk

    2025年4月23日   

    全球顶尖跨国公司MNCs社交媒体数据分析数据集-nirbhayk 数据来源:互联网公开数据 标签:跨国公司,社交媒体,数据集,品牌分析,市场营销,文本分析,舆情分析,商业智能 数据概述: 该数据集包含了来自社交媒体平台的数据,记录了全球顶尖跨国公司(MNCs)的社交媒体活动和用户互动信息。主要特征如下:...
    packageimg
  • Kaggle文档合成数据集KaggleDocsSyntheticDataset-zohadev

    2025年4月23日   

    Kaggle文档合成数据集KaggleDocsSyntheticDataset-zohadev 数据来源:互联网公开数据 标签:数据集,合成数据,文本分析,机器学习,自然语言处理,数据挖掘,文档处理,人工智能 数据概述: 该数据集包含来自Kaggle平台文档的合成数据,记录了文档内容的结构化信息。主要特征如下:...
    packageimg
  • 标注词语数据集AnnotatedWordsDataset-abdelhakch

    2025年4月23日   

    标注词语数据集AnnotatedWordsDataset-abdelhakch 数据来源:互联网公开数据 标签:词语标注,自然语言处理,数据集,文本分析,机器学习,语言学,词性标注,学术研究 数据概述:该数据集包含来自互联网公开资源的词语标注数据,记录了词语的详细信息及其在文本中的作用。主要特征如下:...
    packageimg
  • 推特航空公司情感分析数据集TwitterAirlineSentimentDataset-saeedaslimanesh

    2025年4月23日   

    推特航空公司情感分析数据集TwitterAirlineSentimentDataset-saeedaslimanesh 数据来源:互联网公开数据 标签:情感分析,推特数据,航空公司,自然语言处理,文本分析,机器学习,舆情分析,社交媒体 数据概述: 该数据集包含来自推特(Twitter)的推文数据,主要记录了用户对航空公司的情感反馈。主要特征如下:...
    packageimg
  • PDF文件转CSV转换数据集-chadapamettapun

    2025年4月23日   

    PDF文件转CSV转换数据集-chadapamettapun 数据来源:互联网公开数据 标签:数据转换,PDF转CSV,数据处理,文本分析,文件格式转换,机器学习,数据挖掘,Python 数据概述:该数据集包含PDF文件转CSV转换的数据,记录了PDF文件转换为CSV文件的过程和结果。主要特征如下:...
    packageimg
  • 电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-hudairr

    2025年4月23日   

    电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-hudairr 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分析,机器学习,自然语言处理,网络安全,信息过滤 数据概述: 该数据集包含来自多个来源的电子邮件数据,记录了大量标记为垃圾邮件和非垃圾邮件的电子邮件内容。主要特征如下:...
    packageimg
  • 商业与非商业许可证分类数据集-2023-moxxis

    2025年4月23日   

    商业与非商业许可证分类数据集-2023-moxxis 数据来源:互联网公开数据 标签:许可证分类,商业,非商业,句子分割,平衡数据集,机器学习,文本分析 数据概述:...
    packageimg
  • 欧洲人权法院案件分析数据集ECHRDataset-subodh3

    2025年4月23日   

    欧洲人权法院案件分析数据集ECHRDataset-subodh3 数据来源:互联网公开数据 标签:人权,法律,数据集,法院,案例分析,文本分析,自然语言处理,司法 数据概述: 该数据集包含了欧洲人权法院(ECHR)的案件数据,记录了法院审理的各类人权案件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了欧洲人权法院成立至今的案件。...
    packageimg
  • 电子邮件垃圾邮件分类数据集-2021-nubrin

    2025年4月23日   

    电子邮件垃圾邮件分类数据集-2021-nubrin 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,分类,数据集,文本分析,机器学习,特征提取 数据概述:...
    packageimg
  • 俄罗斯零售市场内容数据集-2023年-pavelkunitsyn

    2025年4月23日   

    俄罗斯零售市场内容数据集-2023年-pavelkunitsyn 数据来源:互联网公开数据 标签:零售业,俄罗斯,市场分析,自然语言处理,文本分析,竞争分析,地理分析 数据概述:...
    packageimg
  • 印尼命名实体识别数据集NER-suhas2875

    2025年4月23日   

    印尼命名实体识别数据集NER-suhas2875 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,印尼语,文本分析,机器学习,NLP,印尼 数据概述: 该数据集包含印尼语文本,标注了命名实体信息,用于训练和评估命名实体识别模型。主要特征如下: 时间跨度: 数据记录的时间范围未明确,主要基于已发布的文本数据。 地理范围:...
    packageimg
  • 自然语言处理调查问卷数据集NLPSurveyDataset-musaalamdar

    2025年4月23日   

    自然语言处理调查问卷数据集NLPSurveyDataset-musaalamdar 数据来源:互联网公开数据 标签:自然语言处理,调查问卷,数据集,文本分析,情感分析,用户研究,机器学习,数据挖掘 数据概述: 该数据集包含来自自然语言处理领域的调查问卷数据,记录了参与者对NLP相关技术,应用,以及未来发展趋势的看法和反馈。主要特征如下:...
    packageimg
  • TMDB电影评论数据集TMDB10000MoviesReviewsDataset-biradarprathamesh

    2025年4月23日   

    TMDB电影评论数据集TMDB10000MoviesReviewsDataset-biradarprathamesh 数据来源:互联网公开数据 标签:电影,评论,数据集,情感分析,自然语言处理,文本分析,机器学习,电影推荐 数据概述: 该数据集包含来自TMDB(The Movie...
    packageimg
  • 俄罗斯网络论坛用户评论毒性分析数据集-aybatov

    2025年4月23日   

    俄罗斯网络论坛用户评论毒性分析数据集-aybatov 数据来源:互联网公开数据 标签:俄罗斯,评论,毒性,机器学习,自然语言处理,文本分析,负面情绪,社交媒体,Pikabu,2ch 数据概述:...
    packageimg
  • 沃伦巴菲特致股东信2020至2023年分词数据集-mainayushman

    2025年4月23日   

    沃伦巴菲特致股东信2020至2023年分词数据集-mainayushman 数据来源:互联网公开数据 标签:沃伦巴菲特,股东信,数据集,自然语言处理,文本分析,投资策略,商业智能,经济分析 数据概述:该数据集包含了2020年至2023年间沃伦巴菲特写给伯克希尔哈撒韦公司股东的年度信件,并对这些信件进行了分词处理。主要特征如下:...
    packageimg
  • 自然语言处理示例数据集NLPSampleData-fishercht

    2025年4月23日   

    自然语言处理示例数据集NLPSampleData-fishercht 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,文本挖掘,语言模型,情感分析,语料库 数据概述: 该数据集包含多种用于自然语言处理任务的示例数据,旨在帮助研究人员和开发者进行算法测试和模型训练。主要特征如下:...
    packageimg
  • 科学论文摘要摘要数据集SciTLDR-A-adityawithdoublea

    2025年4月23日   

    科学论文摘要摘要数据集SciTLDR-A-adityawithdoublea 数据来源:互联网公开数据 标签:论文摘要, 文本摘要, 自然语言处理, 科学论文, 摘要生成, 机器翻译, 文本分析 数据概述: SciTLDR-...
    packageimg
  • 实时推特性别识别数据集RT-GenderDataset-swapnikvarala

    2025年4月23日   

    实时推特性别识别数据集RT-GenderDataset-swapnikvarala 数据来源:互联网公开数据 标签:社交媒体,性别识别,推特,自然语言处理,机器学习,文本分析,用户画像,情感分析 数据概述: 该数据集包含来自推特平台的推文数据,用于性别识别研究。主要特征如下: 时间跨度:数据记录的时间范围不详,具体时间跨度取决于数据集的构建时间。...
    packageimg
  • CoQA对话式问答数据集-多领域文本-2011至2018年-thedevastator

    2025年4月23日   

    CoQA对话式问答数据集-多领域文本-2011至2018年-thedevastator 数据来源:互联网公开数据 标签:对话式问答,自然语言理解,机器学习,文本分析,深度学习,会话系统,CoQA,Huggingface 数据概述:...
    packageimg
  • 波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei

    2025年4月23日   

    波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,文本分析,机器学习,波斯语,文本分类,多语言处理 数据概述: 该数据集包含来自波斯语互联网和公开文本资源的数据,记录了波斯语的语言文本和结构特征。主要特征如下:...
    packageimg