找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 电影类型检测数据集

    2025年4月14日   

    电影类型检测数据集 数据来源:互联网公开数据 标签:电影,类型检测,机器学习,推荐系统,内容分析,受众研究,情感分析 数据概述: 本数据集来源于TMDB API,包含10,000条电影记录,每条记录包括电影名称、描述和类型等关键信息。数据集为电影类型分类、分析和推荐系统等应用提供了丰富的文本数据基础。 数据用途概述:...
    packageimg
  • 高校学生招聘数据文本化数据集

    2025年4月14日   

    高校学生招聘数据文本化数据集 数据来源:互联网公开数据 标签:校园招聘,学生,就业,文本数据,机器学习,自然语言处理,文本分类,教育,数据挖掘 数据概述: 本数据集包含了XYZ高校学生的招聘数据,这些数据经过处理后转化为文本格式,用于训练大型语言模型(LLM)。原始数据来源于CSV文件,通过数据到文本(data-to-...
    packageimg
  • 问答一致性研究与文本理解数据集

    2025年4月14日   

    问答一致性研究与文本理解数据集 数据来源:互联网公开数据 标签:问答任务,一致性评估,自然语言处理,机器学习,问答系统,文本理解,信息检索 数据概述: 本数据集专注于问答一致性研究,包含训练集和验证集两个部分。每个数据样本由三个关键字段组成: 1. 问题(question):用户提出的具体问题。 2. 答案(answer):对应问题的标准答案。 3....
    packageimg
  • 埃维语-英语双语对照数据集

    2025年4月14日   

    埃维语-英语双语对照数据集 数据来源:互联网公开数据 标签:埃维语,英语,双语对照,自然语言处理,机器翻译,跨语言研究,文本挖掘 数据概述:...
    packageimg
  • 斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语-

    2025年4月14日   

    斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语- 数据来源:互联网公开数据 标签:问答,SQuAD,泰米尔语,自然语言处理,机器翻译,文本分析,数据集,翻译 数据概述: 本数据集是针对“chaii -...
    packageimg
  • 电子游戏评论情感分析数据集

    2025年4月14日   

    电子游戏评论情感分析数据集 数据来源:互联网公开数据 标签:电子游戏,评论,情感分析,自然语言处理,NLP,文本分类,用户反馈,游戏行业 数据概述:...
    packageimg
  • 新闻头条股票情绪分析金融数据集

    2025年4月14日   

    新闻头条股票情绪分析金融数据集 数据来源:互联网公开数据 标签:新闻头条,股票情绪分析,金融数据,投资决策,机器学习,自然语言处理 数据概述:...
    packageimg
  • 特朗普推特侮辱言论情感分析数据集

    2025年4月14日   

    特朗普推特侮辱言论情感分析数据集 数据来源:互联网公开数据 标签:特朗普,推特,侮辱言论,情感分析,时间序列,社交媒体,舆情研究 数据概述: 本数据集基于特朗普从2014年至2021年在推特上发布的侮辱性言论记录,经过情感分析处理后生成。数据集包含原始推文内容、发布时间、情感得分(Sentiment)以及情感标签(Sentiment...
    packageimg
  • 亚马逊商品评论多语言情感分析数据集

    2025年4月14日   

    亚马逊商品评论多语言情感分析数据集 数据来源:互联网公开数据 标签:亚马逊,评论数据,情感分析,多语言,用户评价,文本挖掘,NLP,机器学习,商品推荐,用户体验 数据概述:...
    packageimg
  • 素食者社区问答数据集

    2025年4月14日   

    素食者社区问答数据集 数据来源:互联网公开数据 标签:素食者,社区问答,常见问题,分类分析,数据抓取,Python脚本 数据概述:...
    packageimg
  • 印地语-英语音译数据集

    2025年4月14日   

    印地语-英语音译数据集 数据来源:互联网公开数据 标签:印地语,英语,音译,自然语言处理,文本分类,情感分析,机器翻译,跨语言分析 数据概述: 本数据集包含印地语与英语语言对的音译文本数据,旨在促进自然语言处理任务,如文本分类、情感分析和机器翻译。数据集涵盖了不同领域和主题的各种文本样本,从短语到长句不等。数据集中的每个条目由一对印地语-...
    packageimg
  • 德语冠词数据集

    2025年4月14日   

    德语冠词数据集 数据来源:互联网公开数据 标签:德语,冠词,机器学习,自然语言处理,分类问题,神经网络,词性标注 数据概述: 本数据集基于一个公开的德语-英语词典,包含大量德语单词及其对应的冠词信息。数据集适合用于训练神经网络解决分类问题,特别是德语冠词预测任务。数据涵盖了丰富的德语单词及其冠词信息,为自然语言处理和机器学习提供了宝贵的数据资源。...
    packageimg
  • 议论文分析与文本分类论点要素标注数据集

    2025年4月14日   

    议论文分析与文本分类论点要素标注数据集 数据来源:互联网公开数据 标签:议论文,文本分类,论点分析,论点要素,有效性评估,自然语言处理 数据概述:...
    packageimg
  • 标普500成分公司文本数据集

    2025年4月14日   

    标普500成分公司文本数据集 数据来源:互联网公开数据 标签:标普500,维基百科,公司文本,企业分析,行业研究,文本挖掘,投资分析 数据概述:...
    packageimg
  • 姓名性别与种族数据集

    2025年4月14日   

    姓名性别与种族数据集 数据来源:互联网公开数据 标签:姓名,性别,种族,人口统计,数据生成,数据分析,自然语言处理 数据概述:...
    packageimg
  • 加密货币新闻与市场价数据集

    2025年4月14日   

    加密货币新闻与市场价数据集 数据来源:互联网公开数据 标签:加密货币,新闻头条,市场价,情感分析,NLP,时间序列,金融分析 数据概述: 本数据集包含了不同日期下多种加密货币的新闻头条及其对应市场价数据,时间范围主要集中在2021年至今。数据集通过网络爬虫技术收集Google News上的新闻头条,并结合robin-stocks...
    packageimg
  • 美联储FOMC会议声明与纪要文本数据集

    2025年4月14日   

    美联储FOMC会议声明与纪要文本数据集 数据来源:互联网公开数据 标签:美联储,FOMC,货币政策,经济分析,会议纪要,政策声明,文本数据 数据概述:...
    packageimg
  • 印度尼西亚多模态对话数据集-人格-同理心-知识2023

    2025年4月14日   

    印度尼西亚多模态对话数据集-人格-同理心-知识2023 数据来源:互联网公开数据 标签:多模态对话,人格,同理心,知识,对话系统,用户参与度,虚拟助手,交互式教程,自动评估,公平性 数据概述:...
    packageimg
  • 神经信息处理系统大会论文提交数据集NeurIPS2016-2019

    2025年4月14日   

    神经信息处理系统大会论文提交数据集NeurIPS2016-2019 数据来源:互联网公开数据 标签:NeurIPS,机器学习,计算神经科学,论文,学术会议,文本分析,自然语言处理,主题建模,聚类,分类 数据概述:...
    packageimg
  • 太空探索洞察Reddit讨论数据集-2011至2021年

    2025年4月14日   

    太空探索洞察Reddit讨论数据集-2011至2021年 数据来源:互联网公开数据 标签:Reddit,太空探索,公众讨论,数据集,趋势分析,情感分析,影响者识别 数据概述:...
    packageimg