找到11,799个数据集

标签: 自然语言处理

过滤结果
  • 英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal

    2025年4月26日   

    英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal 数据来源:互联网公开数据 标签:机器翻译,英阿翻译,数据集,自然语言处理,文本分析,语言学,深度学习,NLP 数据概述: 该数据集包含英阿双语的翻译文本数据,记录了英语到阿拉伯语的翻译内容。主要特征如下: 时间跨度:...
    packageimg
  • 深度伪造与虚假信息数据集DeepfakeandMisinformationDataset-musabshaikh9029

    2025年4月26日   

    深度伪造与虚假信息数据集DeepfakeandMisinformationDataset-musabshaikh9029 数据来源:互联网公开数据 标签:深度伪造,虚假信息,数据集,图像识别,自然语言处理,机器学习,内容分析,社交媒体 数据概述:...
    packageimg
  • 英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26

    2025年4月26日   

    英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26 数据来源:互联网公开数据 标签:语料库,词频分析,逆文档频率,自然语言处理,数据集,文本挖掘,机器学习,信息检索 数据概述:...
    packageimg
  • 自然语言处理仇恨言论检测数据集NLPHateSpeechDetectionDataset-dheerajpranav

    2025年4月26日   

    自然语言处理仇恨言论检测数据集NLPHateSpeechDetectionDataset-dheerajpranav 数据来源:互联网公开数据 标签:自然语言处理,仇恨言论检测,文本分类,机器学习,社交媒体,情感分析,文本分析,NLP 数据概述: 该数据集包含来自社交媒体平台的文本数据,用于仇恨言论检测任务。主要特征如下:...
    packageimg
  • 机器翻译模型数据集TranslationModelDataset-osamaabobakr

    2025年4月26日   

    机器翻译模型数据集TranslationModelDataset-osamaabobakr 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言模型,深度学习,人工智能,文本分析,多语言翻译 数据概述: 该数据集包含来自多个来源的多语言文本数据,用于训练和评估机器翻译模型。主要特征如下:...
    packageimg
  • 问答系统评估数据集Qwen-AnswersDataset-martintura

    2025年4月26日   

    问答系统评估数据集Qwen-AnswersDataset-martintura 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,人工智能,知识图谱,信息检索,文本生成 数据概述: 该数据集包含来自问答系统Qwen的问答对数据,记录了用户提出的问题和系统生成的答案。主要特征如下:...
    packageimg
  • 音乐歌词数据集MusicLyricsDataset-jpscardoso

    2025年4月26日   

    音乐歌词数据集MusicLyricsDataset-jpscardoso 数据来源:互联网公开数据 标签:音乐,歌词,数据集,文本分析,自然语言处理,情感分析,机器学习,文化研究 数据概述: 该数据集包含来自多个音乐平台和歌词库的音乐歌词数据,记录了不同风格,语言和时期的歌曲歌词。主要特征如下: 时间跨度:数据记录的时间范围从20世纪至今。...
    packageimg
  • 五轮权重训练数据集WeightsTrainedfor5EpochsDataset-karinana

    2025年4月26日   

    五轮权重训练数据集WeightsTrainedfor5EpochsDataset-karinana 数据来源:互联网公开数据 标签:机器学习,数据集,权重,训练,深度学习,模型评估,计算机视觉,自然语言处理 数据概述: 该数据集包含了经过五轮训练的机器学习模型权重数据,记录了模型在训练过程中的优化结果。主要特征如下:...
    packageimg
  • 性别歧视与仇恨言论中文数据集SexismandHateSpeechinChineseDataset-charliegong

    2025年4月26日   

    性别歧视与仇恨言论中文数据集SexismandHateSpeechinChineseDataset-charliegong 数据来源:互联网公开数据 标签:仇恨言论,性别歧视,数据集,自然语言处理,文本分类,情感分析,社会研究,机器学习 数据概述: 该数据集包含来自互联网公开平台上的中文文本数据,记录了包含性别歧视和仇恨言论的言论内容。主要特征如下:...
    packageimg
  • AI开放学术挑战赛第二届数据集AIOpenAcademicChallenge2Dataset-justusilemobayo

    2025年4月26日   

    AI开放学术挑战赛第二届数据集AIOpenAcademicChallenge2Dataset-justusilemobayo 数据来源:互联网公开数据 标签:学术研究,数据集,自然语言处理,文本分析,机器学习,情感分析,知识图谱,人工智能 数据概述: 该数据集是第二届AI开放学术挑战赛(AI Open Academic Challenge...
    packageimg
  • 电商平台商品描述数据集ProductDescriptionsDataset-anggidwifiani

    2025年4月26日   

    电商平台商品描述数据集ProductDescriptionsDataset-anggidwifiani 数据来源:互联网公开数据 标签:电商,商品描述,数据集,自然语言处理,文本分析,机器学习,产品推荐,文本挖掘 数据概述: 该数据集包含来自电商平台的商品描述数据,记录了各种商品的详细信息,旨在用于文本分析,商品推荐等任务。主要特征如下:...
    packageimg
  • 文本情感分析数据集EmotionsinaTextDataset-emanchauhdary

    2025年4月26日   

    文本情感分析数据集EmotionsinaTextDataset-emanchauhdary 数据来源:互联网公开数据 标签:情感分析,文本数据,自然语言处理,机器学习,情绪识别,文本分类,情感词典,人工智能 数据概述: 该数据集包含了从文本中提取的情感信息,用于情感分析和情绪识别任务。主要特征如下:...
    packageimg
  • 印度社区一年数据集

    2025年4月26日   

    印度社区一年数据集 数据来源:互联网公开数据 标签:社交媒体,数据分析,文本挖掘,用户行为,内容分析,社区活跃度,机器学习,自然语言处理 数据概述: 本数据集记录了2020年9月30日至2021年9月30日期间,印度最大的 Reddit 子社区 /r/India...
    packageimg
  • 印度航空公司客户评价数据集AirIndiaReviewsDataset-smasifulislamsaky

    2025年4月26日   

    印度航空公司客户评价数据集AirIndiaReviewsDataset-smasifulislamsaky 数据来源:互联网公开数据 标签:航空业,客户评价,数据集,自然语言处理,情感分析,商业智能,服务质量,客户反馈 数据概述: 该数据集包含来自印度航空公司(Air India)的客户评价数据,记录了乘客对航空服务的评价和反馈。主要特征如下:...
    packageimg
  • 教育领域推文数据集TweetEduDataset-kyuhwanjung2

    2025年4月26日   

    教育领域推文数据集TweetEduDataset-kyuhwanjung2 数据来源:互联网公开数据 标签:推文,教育,社交媒体,数据分析,机器学习,自然语言处理,教育研究,学术资源 数据概述: 该数据集包含来自社交媒体平台的与教育相关推文内容,记录了用户在教育领域的讨论和分享。主要特征如下: 时间跨度:数据记录的时间范围从2019年到2022年。...
    packageimg
  • 集成嵌入数据EnsembleEmbeddingData数据集-aissaultimate

    2025年4月26日   

    集成嵌入数据EnsembleEmbeddingData数据集-aissaultimate 数据来源:互联网公开数据 标签:集成学习,嵌入,数据集,自然语言处理,文本分析,机器学习,向量表示,模型融合 数据概述: 该数据集包含了使用集成学习方法生成的嵌入向量数据,主要用于文本分析和自然语言处理任务。主要特征如下:...
    packageimg
  • 推特解析全数据集TwitterParsedFullDataDataset-staru09

    2025年4月26日   

    推特解析全数据集TwitterParsedFullDataDataset-staru09 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,机器学习,情感分析,数据挖掘,自然语言处理,舆情监测 数据概述: 该数据集包含来自推特(Twitter)的解析全量数据,记录了推文的内容,用户信息,时间戳,互动数据等。主要特征如下:...
    packageimg
  • 学生课堂行为评论数据集-avnerkantor

    2025年4月26日   

    学生课堂行为评论数据集-avnerkantor 数据来源:互联网公开数据 标签:学生行为,课堂互动,评论分析,情感分析,自然语言处理,教育研究,数据集,学习行为 数据概述: 该数据集包含学生在课堂上的行为评论数据,记录了学生对课堂互动,学习体验等的反馈。主要特征如下: 时间跨度:数据记录的时间范围为特定学期或课程。...
    packageimg
  • 印度新闻文章数据集2021年9月21日至2021年9月24日-nfsahmad

    2025年4月26日   

    印度新闻文章数据集2021年9月21日至2021年9月24日-nfsahmad 数据来源:互联网公开数据 标签:新闻,印度,数据集,文本分析,自然语言处理,时事,媒体,舆情分析 数据概述: 该数据集包含来自印度新闻媒体的文章数据,记录了2021年9月21日至2021年9月24日期间的新闻报道。主要特征如下:...
    packageimg
  • 新闻微调量化ChatGLM2数据集NewsFine-TuneQuantineChatGLM2Dataset-lollipopshen

    2025年4月26日   

    新闻微调量化ChatGLM2数据集NewsFine-TuneQuantineChatGLM2Dataset-lollipopshen 数据来源:互联网公开数据 标签:新闻数据,微调数据集,量化模型,自然语言处理,机器学习,文本分析,AI助手,语言模型 数据概述:...
    packageimg