找到11,966个数据集

标签: 自然语言处理

过滤结果
  • 涅槃乐队歌词数据集

    2025年4月14日   

    涅槃乐队歌词数据集 数据来源:互联网公开数据 标签:涅槃乐队,歌词,音乐分析,自然语言处理,歌词文本,歌曲分析,音乐研究 数据概述: 本数据集包含从涅槃乐队143首歌曲中提取的歌词文本。数据集结构包括两列:歌曲标题和歌词内容。歌词内容按段落存储在列表中,方便进一步处理和分析。 数据用途概述:...
    packageimg
  • SCP幽默文章数据集

    2025年4月14日   

    SCP幽默文章数据集 数据来源:互联网公开数据 标签:SCP, 幽默, 娱乐, 人工智能, 文本分类, 文本生成, 数据标注, 自然语言处理 数据概述: 本数据集收录了SCP Wiki中的“幽默文章”(Joke...
    packageimg
  • 高校学生招聘数据文本化数据集

    2025年4月14日   

    高校学生招聘数据文本化数据集 数据来源:互联网公开数据 标签:校园招聘,学生,就业,文本数据,机器学习,自然语言处理,文本分类,教育,数据挖掘 数据概述: 本数据集包含了XYZ高校学生的招聘数据,这些数据经过处理后转化为文本格式,用于训练大型语言模型(LLM)。原始数据来源于CSV文件,通过数据到文本(data-to-...
    packageimg
  • 问答一致性研究与文本理解数据集

    2025年4月14日   

    问答一致性研究与文本理解数据集 数据来源:互联网公开数据 标签:问答任务,一致性评估,自然语言处理,机器学习,问答系统,文本理解,信息检索 数据概述: 本数据集专注于问答一致性研究,包含训练集和验证集两个部分。每个数据样本由三个关键字段组成: 1. 问题(question):用户提出的具体问题。 2. 答案(answer):对应问题的标准答案。 3....
    packageimg
  • 埃维语-英语双语对照数据集

    2025年4月14日   

    埃维语-英语双语对照数据集 数据来源:互联网公开数据 标签:埃维语,英语,双语对照,自然语言处理,机器翻译,跨语言研究,文本挖掘 数据概述:...
    packageimg
  • 斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语-

    2025年4月14日   

    斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语- 数据来源:互联网公开数据 标签:问答,SQuAD,泰米尔语,自然语言处理,机器翻译,文本分析,数据集,翻译 数据概述: 本数据集是针对“chaii -...
    packageimg
  • 电子游戏评论情感分析数据集

    2025年4月14日   

    电子游戏评论情感分析数据集 数据来源:互联网公开数据 标签:电子游戏,评论,情感分析,自然语言处理,NLP,文本分类,用户反馈,游戏行业 数据概述:...
    packageimg
  • 新闻头条股票情绪分析金融数据集

    2025年4月14日   

    新闻头条股票情绪分析金融数据集 数据来源:互联网公开数据 标签:新闻头条,股票情绪分析,金融数据,投资决策,机器学习,自然语言处理 数据概述:...
    packageimg
  • 印地语-英语音译数据集

    2025年4月14日   

    印地语-英语音译数据集 数据来源:互联网公开数据 标签:印地语,英语,音译,自然语言处理,文本分类,情感分析,机器翻译,跨语言分析 数据概述: 本数据集包含印地语与英语语言对的音译文本数据,旨在促进自然语言处理任务,如文本分类、情感分析和机器翻译。数据集涵盖了不同领域和主题的各种文本样本,从短语到长句不等。数据集中的每个条目由一对印地语-...
    packageimg
  • 德语冠词数据集

    2025年4月14日   

    德语冠词数据集 数据来源:互联网公开数据 标签:德语,冠词,机器学习,自然语言处理,分类问题,神经网络,词性标注 数据概述: 本数据集基于一个公开的德语-英语词典,包含大量德语单词及其对应的冠词信息。数据集适合用于训练神经网络解决分类问题,特别是德语冠词预测任务。数据涵盖了丰富的德语单词及其冠词信息,为自然语言处理和机器学习提供了宝贵的数据资源。...
    packageimg
  • 议论文分析与文本分类论点要素标注数据集

    2025年4月14日   

    议论文分析与文本分类论点要素标注数据集 数据来源:互联网公开数据 标签:议论文,文本分类,论点分析,论点要素,有效性评估,自然语言处理 数据概述:...
    packageimg
  • 姓名性别与种族数据集

    2025年4月14日   

    姓名性别与种族数据集 数据来源:互联网公开数据 标签:姓名,性别,种族,人口统计,数据生成,数据分析,自然语言处理 数据概述:...
    packageimg
  • 神经信息处理系统大会论文提交数据集NeurIPS2016-2019

    2025年4月14日   

    神经信息处理系统大会论文提交数据集NeurIPS2016-2019 数据来源:互联网公开数据 标签:NeurIPS,机器学习,计算神经科学,论文,学术会议,文本分析,自然语言处理,主题建模,聚类,分类 数据概述:...
    packageimg
  • 孟加拉语维基百科语料库数据集

    2025年4月14日   

    孟加拉语维基百科语料库数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,自然语言处理,NLP,文本分析,机器学习,语料库 数据概述:...
    packageimg
  • 多标签分类新闻类别数据集

    2025年4月14日   

    多标签分类新闻类别数据集 数据来源:互联网公开数据 标签:多标签分类,新闻类别,文本分析,机器学习,自然语言处理,信息提取,数据标注 数据概述:...
    packageimg
  • 视频游戏推文数据集

    2025年4月14日   

    视频游戏推文数据集 数据来源:互联网公开数据 标签:视频游戏,社交媒体,自然语言处理,情感分析,文本挖掘,推文分析 数据概述: 本数据集收录了2020年8月至12月期间,从Twitter上抓取的1135条包含“videogames”标签的推文。每条推文包含以下五个字段: - 时间戳:推文的日期和时间,格式为YYYY-MM-DD和HH:MM:SS。 -...
    packageimg
  • 情感分类不平衡数据集

    2025年4月14日   

    情感分类不平衡数据集 数据来源:互联网公开数据 标签:情感分析,不平衡分类,半监督学习,文本分类,自然语言处理,机器学习 数据概述: 本数据集为解决情感分析中的类别不平衡问题而构建,涵盖三种情感类别:Negative、Positive和Neutral。初始阶段收集了620条评论数据,各类别分布分别为Negative 150条、Positive...
    packageimg
  • 摩洛哥阿拉伯语Darija语言任务与平行翻译数据集

    2025年4月14日   

    摩洛哥阿拉伯语Darija语言任务与平行翻译数据集 数据来源:互联网公开数据 标签:摩洛哥阿拉伯语, Darija, 机器翻译, 语言模型, 平行语料库, 自然语言处理, 多语言学习 数据概述:...
    packageimg
  • 洛杉矶推特新闻数据集

    2025年4月14日   

    洛杉矶推特新闻数据集 数据来源:互联网公开数据 标签:洛杉矶,推特,新闻,分类,自然语言处理,NLP,文本分析 数据概述:...
    packageimg
  • PHINC-平行印地英混合语社交媒体语料库用于机器翻译

    2025年4月14日   

    PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...
    packageimg