找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 人机协作代码搜索与问答数据集-CodeSO-QR

    2025年4月15日   

    人机协作代码搜索与问答数据集-CodeSO-QR 数据来源:互联网公开数据 标签:人机协作,代码搜索,问答系统,代码生成,软件工程,代码质量,CodeSearchNet,Stack Overflow 数据概述: CodeSO-...
    packageimg
  • 德语情感词典数据集2021

    2025年4月15日   

    德语情感词典数据集2021 数据来源:互联网公开数据 标签:情感分析,意见挖掘,德语,情感词典,极性评分,词性标注,词形变化 数据概述: 本数据集收录了用于情感分析和意见挖掘的德语情感词典,即SentiWS。数据集包含标记了情感极性的词及其词性标注,极性值范围为[-1,...
    packageimg
  • 抑郁症相关推文数据集

    2025年4月15日   

    抑郁症相关推文数据集 数据来源:互联网公开数据 标签:社交媒体,心理健康,情感分析,抑郁症,自杀,希望,情绪表达,时间序列,自然语言处理 数据概述:...
    packageimg
  • 波兰旅行报告数据集1963-2021

    2025年4月15日   

    波兰旅行报告数据集1963-2021 数据来源:互联网公开数据 标签:旅行报告,波兰,自然语言处理,NLP,用户信息,旅行内容 数据概述:...
    packageimg
  • 权力的游戏电视剧对话数据集

    2025年4月15日   

    权力的游戏电视剧对话数据集 数据来源:互联网公开数据 标签:权力的游戏,电视剧,对话记录,角色分析,情节发展,文本挖掘,文化研究 数据概述: 本数据集收录了《权力的游戏》电视剧的完整剧本,包含每一集的对话内容及其对应的说话者信息,以及对话所在的集数和季数。该数据集为研究《权力的游戏》的剧情发展、角色互动提供了丰富的文本资料。 数据用途概述:...
    packageimg
  • 恶搞之家剧集对话与多元词典评价数据集-第一季至第十九季

    2025年4月15日   

    恶搞之家剧集对话与多元词典评价数据集-第一季至第十九季 数据来源:互联网公开数据 标签:恶搞之家,Family Guy,动画,剧集,对话,词典,IMDb,GPT,幽默,喜剧,影视分析 数据概述: 本数据集收录了美国动画电视剧《恶搞之家》(Family...
    packageimg
  • 自然语言处理数据增强用反向翻译数据集

    2025年4月15日   

    自然语言处理数据增强用反向翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,反向翻译,文本分类,多语言,数据集,机器学习,文本生成 数据概述: 本数据集包含了来自Contradictory, My Dear...
    packageimg
  • 优步推特数据集

    2025年4月15日   

    优步推特数据集 数据来源:互联网公开数据 标签:优步,推特,社交媒体,情感分析,自然语言处理,用户行为,行业趋势 数据概述: 本数据集收录了截至2022年7月11日所有提及uber或Uber的推特内容,共包含10,000条最近的推文。每条推文记录了用户ID、使用的标签以及其它重要特征,为研究优步在社交媒体上的舆论动态提供了丰富的数据资源。...
    packageimg
  • 分类数据集

    2025年4月15日   

    分类数据集 数据来源:互联网公开数据 标签:分类,数据分析,机器学习,数据科学,特征工程,应用场景,模型训练 数据概述:...
    packageimg
  • COVID-19信息流行病数据集

    2025年4月15日   

    COVID-19信息流行病数据集 数据来源:互联网公开数据 标签:COVID-19,信息流行病,社交媒体分析,真实信息,虚假信息,数据标注,健康信息 数据概述:...
    packageimg
  • 哈威斯员工评价数据集

    2025年4月15日   

    哈威斯员工评价数据集 数据来源:互联网公开数据 标签:哈威斯,员工评价,工作环境,职业发展,公司文化,工作生活平衡,人力资源,数据科学,自然语言处理,文化分析 数据概述: 哈威斯员工评价数据集汇集了来自Ambition...
    packageimg
  • 虚假新闻内容检测数据集

    2025年4月15日   

    虚假新闻内容检测数据集 数据来源:互联网公开数据 标签:虚假新闻,自然语言处理,NLP,内容检测,文本分类,社交媒体,新闻平台,机器学习 数据概述...
    packageimg
  • 意大利推特关于罗诉韦德案讨论数据集2022

    2025年4月15日   

    意大利推特关于罗诉韦德案讨论数据集2022 数据来源:互联网公开数据 标签:推特,意大利,罗诉韦德案,堕胎,社会讨论,舆论分析,主题分析 数据概述:...
    packageimg
  • LLM科学考试GPT-3-5模型生成答案数据集

    2025年4月15日   

    LLM科学考试GPT-3-5模型生成答案数据集 数据来源:互联网公开数据 标签:LLM,科学考试,GPT-3.5,自然语言处理,考试数据,人工智能,模型输出,文本生成 数据概述: 本数据集包含了GPT-3.5...
    packageimg
  • 美国副总统和总统辩论评论数据集

    2025年4月15日   

    美国副总统和总统辩论评论数据集 数据来源:互联网公开数据 标签:美国辩论,副总统,总统,YouTube评论,情感分析,自然语言处理,数据分析,公众意见 数据概述: 该数据集包含从YouTube上抓取的副总统和总统辩论评论,以及使用TextBlob库计算的情感得分。数据涵盖评论内容和对应的情感倾向,为研究公众对辩论的看法提供了基础。 数据用途概述:...
    packageimg
  • 孟加拉语仇恨言论检测数据集

    2025年4月15日   

    孟加拉语仇恨言论检测数据集 数据来源:互联网公开数据 标签:仇恨言论检测,孟加拉语,社交媒体分析,文本分类,自然语言处理,机器学习,语言资源 数据概述: 本数据集(BD-...
    packageimg
  • 多标签文本分类数据集

    2025年4月15日   

    多标签文本分类数据集 数据来源:互联网公开数据 标签:多标签分类,文本分类,信息学,学术论文,机器学习,标签预测,自然语言处理 数据概述...
    packageimg
  • 故事创作与评价数据集

    2025年4月15日   

    故事创作与评价数据集 数据来源:互联网公开数据 标签:故事创作,心理学,创造力评估,文本分析,用户画像,个性化推荐,情感分析 数据概述 本数据集来源于《StoriesInTheWild》论文,包含两部分数据,分别存储在 stories.csv 和 ratings.csv 两个 CSV...
    packageimg
  • 编码调试故事讲述科学对话数据集

    2025年4月15日   

    编码调试故事讲述科学对话数据集 数据来源:互联网公开数据 标签:对话数据集, 编程, 调试, 故事讲述, 科学, 自然语言处理, 聊天机器人, 智能助手 数据概述:...
    packageimg
  • 砂拉越餐饮评论情感分析数据集2021-2024

    2025年4月15日   

    砂拉越餐饮评论情感分析数据集2021-2024 数据来源:互联网公开数据 标签:砂拉越,餐饮评论,情感分析,旅游行业,机器学习,数据可视化,商业分析 数据概述: 本数据集包含 TripAdvisor...
    packageimg