找到5,740个数据集

标签: 文本分析

过滤结果
  • Udemy付费课程信息数据集UdemyPaidCoursesDataset-abhayjr

    2025年4月25日   

    Udemy付费课程信息数据集UdemyPaidCoursesDataset-abhayjr 数据来源:互联网公开数据 标签:在线教育,数据集,课程信息,机器学习,自然语言处理,文本分析,数据挖掘,教育科技 数据概述: 该数据集包含了Udemy平台上付费课程的详细信息,旨在为研究人员和数据分析师提供关于在线教育领域的全面数据。主要特征如下:...
    packageimg
  • Squad2020问答数据集SQuAD2020QuestionAnsweringDataset-parthplc

    2025年4月25日   

    Squad2020问答数据集SQuAD2020QuestionAnsweringDataset-parthplc 数据来源: 互联网公开数据 标签: 问答系统,自然语言处理,数据集,机器学习,文本分析,语义理解,深度学习,人工智能 数据概述: 该数据集源自斯坦福大学的 SQuAD 2020 项目,专注于问答系统的训练和评估。主要特征如下:...
    packageimg
  • 数字民族志数据集DigitalEtnoDataset-fredenni

    2025年4月25日   

    数字民族志数据集DigitalEtnoDataset-fredenni 数据来源:互联网公开数据 标签:民族志,数字人文,数据集,文化研究,社交媒体,文本分析,情感分析,人类学 数据概述: 该数据集包含来自数字民族志研究的数据,记录了不同文化背景下人们在社交媒体上的互动和表达。主要特征如下: 时间跨度:...
    packageimg
  • 抑郁症社交媒体数据集DepressionSocialMediaDataset-sogolsheydaei

    2025年4月25日   

    抑郁症社交媒体数据集DepressionSocialMediaDataset-sogolsheydaei 数据来源:互联网公开数据 标签:抑郁症,社交媒体,数据分析,心理健康,机器学习,情绪识别,文本分析,社会科学研究 数据概述: 该数据集包含来自社交媒体平台的用户发帖内容,用于研究抑郁症的检测与分析。主要特征如下:...
    packageimg
  • 简历信息预测数据集ResumeInformationPredictionDataset-maujmishra

    2025年4月25日   

    简历信息预测数据集ResumeInformationPredictionDataset-maujmishra 数据来源:互联网公开数据 标签:简历,预测,数据集,自然语言处理,机器学习,招聘,求职,文本分析 数据概述: 该数据集包含简历信息数据,用于简历分析与预测任务。主要特征如下: 时间跨度:...
    packageimg
  • Jigsaw提交数据集JigsawSubmitsDataset-chiragpritmani

    2025年4月25日   

    Jigsaw提交数据集JigsawSubmitsDataset-chiragpritmani 数据来源:互联网公开数据 标签:机器学习,数据集,竞赛数据,文本分析,自然语言处理,情感分析,数据挖掘,深度学习 数据概述: 该数据集包含来自Jigsaw竞赛的提交数据,记录了竞赛参与者提交的模型结果和文本数据。主要特征如下:...
    packageimg
  • Reddit投资讨论数据分析数据集RedditInvestingDiscussionsDataset-vimalpillai

    2025年4月25日   

    Reddit投资讨论数据分析数据集RedditInvestingDiscussionsDataset-vimalpillai 数据来源:互联网公开数据 标签:投资,Reddit,社交媒体,文本分析,情感分析,金融,数据集,机器学习 数据概述:...
    packageimg
  • 社交媒体仇恨言论检测数据集HateSpeechDetectionDataset-subhajeetdas

    2025年4月25日   

    社交媒体仇恨言论检测数据集HateSpeechDetectionDataset-subhajeetdas 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述: 该数据集包含了来自社交媒体平台的文本数据,并标注了是否包含仇恨言论。主要特征如下:...
    packageimg
  • 性别与姓名关联数据集GenderandNameAssociationDataset-max1mum

    2025年4月25日   

    性别与姓名关联数据集GenderandNameAssociationDataset-max1mum 数据来源:互联网公开数据 标签:性别分析,姓名研究,数据集,人口统计,机器学习,社会研究,文本分析,数据分析 数据概述: 该数据集包含性别与姓名的关联数据,记录了不同姓名对应的性别信息。主要特征如下:...
    packageimg
  • 国家数据科学挑战赛NDSC第一届数据集-christiandaomara

    2025年4月25日   

    国家数据科学挑战赛NDSC第一届数据集-christiandaomara 数据来源:互联网公开数据 标签:数据科学,竞赛数据集,机器学习,文本分析,社交媒体,自然语言处理,情感分析,用户行为 数据概述: 该数据集是国家数据科学挑战赛(NDSC)第一届比赛所使用的数据集,主要包含社交媒体数据,用于多方面的分析和建模任务。主要特征如下:...
    packageimg
  • 新闻文章内容相似度分析矩阵数据集-manishkumar866115

    2025年4月25日   

    新闻文章内容相似度分析矩阵数据集-manishkumar866115 数据来源:互联网公开数据 标签:新闻,文本分析,相似度,自然语言处理,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含新闻文章内容相似度分析矩阵数据,记录了不同新闻文章之间的相似度得分。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于新闻文章的发布时间。...
    packageimg
  • 密码破译数据集CipherDataset-tarunjaikumar

    2025年4月25日   

    密码破译数据集CipherDataset-tarunjaikumar 数据来源:互联网公开数据 标签:密码学,数据集,文本分析,机器学习,自然语言处理,信息安全,密码破译,编码 数据概述: 该数据集包含用于密码破译的各种加密文本和相应的明文,用于研究和训练密码破译算法。主要特征如下: 时间跨度:数据涵盖了不同时期和类型的加密文本。...
    packageimg
  • 音乐旋律与歌词数据集MelodiesandLyricsDataset-maorsagi

    2025年4月25日   

    音乐旋律与歌词数据集MelodiesandLyricsDataset-maorsagi 数据来源:互联网公开数据 标签:音乐,歌词,数据集,自然语言处理,音频分析,文本分析,机器学习,音乐信息检索 数据概述: 该数据集包含音乐旋律和歌词数据,旨在用于音乐与歌词相关的研究和应用。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于数据集的构成。...
    packageimg
  • 巴西联邦参议院新闻数据集NewsFederalSenateBrazilDataset-valadares

    2025年4月25日   

    巴西联邦参议院新闻数据集NewsFederalSenateBrazilDataset-valadares 数据来源:互联网公开数据 标签:巴西,联邦参议院,新闻,政治,数据集,文本分析,舆情分析,社会科学,公共政策 数据概述: 该数据集包含来自巴西联邦参议院官方网站的新闻文章数据,记录了参议院发布的各类新闻信息。主要特征如下:...
    packageimg
  • 音乐资源数据集艺术家歌曲与文本信息汇总

    2025年4月25日   

    标题:音乐资源数据集艺术家、歌曲与文本信息汇总 数据内容: 该数据集包含音乐相关信息,具体包括以下字段: 1. 艺术家(artist):记录了643种不同的艺术家信息,涵盖了不同风格和流派的音乐人。 2. 歌曲(song):记录了44,824种不同的歌曲信息,展示了丰富的音乐作品。 3....
    packageimg
  • kun-uz新闻数据集

    2025年4月25日   

    kun-uz新闻数据集 数据来源:互联网公开数据 标签:新闻,乌兹别克斯坦,社会,经济,体育,科技,时事,分类,文本分析 数据概述:...
    packageimg
  • 命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03

    2025年4月25日   

    命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:...
    packageimg
  • 人群偏见检测与消除数据集CrowsPairsDNRTrain-TestDataset-danushkhanna

    2025年4月25日   

    人群偏见检测与消除数据集CrowsPairsDNRTrain-TestDataset-danushkhanna 数据来源:互联网公开数据 标签:社会偏见,数据集,文本分析,自然语言处理,机器学习,社会研究,伦理研究,偏见检测 数据概述: 该数据集来自Crows...
    packageimg
  • 明镜杂志中国报道数据集

    2025年4月25日   

    明镜杂志中国报道数据集 数据来源:互联网公开数据 标签:中国报道,德国媒体,文本分析,时间序列,新闻内容,国际关系,媒体研究 数据概述:...
    packageimg
  • 新闻深度处理数据集NewsDeepProcessedDataset-mario123475

    2025年4月25日   

    新闻深度处理数据集NewsDeepProcessedDataset-mario123475 数据来源:互联网公开数据 标签:新闻处理,深度学习,自然语言处理,文本分析,机器学习,数据集,信息提取,学术资源 数据概述: 该数据集包含来自互联网公开资源的新闻文章,经过深度处理,适用于自然语言处理任务,如文本分类,情感分析等。主要特征如下:...
    packageimg