找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 航空常见问题数据集

    2025年4月14日   

    航空常见问题数据集 数据来源:互联网公开数据 标签:航空,常见问题,乘客服务,行李,安全,航空旅行,客户服务 数据概述: 本数据集收录了与民用航空相关各种常见问题及其回答,涵盖行李处理、安全检查、乘客服务等多个领域。数据集为航空旅客、机场工作人员和相关部门提供了详细的FAQ信息,便于快速查找和解答各类航空相关的疑问。 数据用途概述:...
    packageimg
  • 美国国情咨文政治演讲文本数据集1790-2019

    2025年4月14日   

    美国国情咨文政治演讲文本数据集1790-2019 数据来源:互联网公开数据 标签:国情咨文,总统演讲,政治分析,历史文本,语言演变,政策研究,文本挖掘 数据概述:...
    packageimg
  • 孟加拉语维基百科语料库数据集

    2025年4月14日   

    孟加拉语维基百科语料库数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,自然语言处理,NLP,文本分析,机器学习,语料库 数据概述:...
    packageimg
  • 多标签分类新闻类别数据集

    2025年4月14日   

    多标签分类新闻类别数据集 数据来源:互联网公开数据 标签:多标签分类,新闻类别,文本分析,机器学习,自然语言处理,信息提取,数据标注 数据概述:...
    packageimg
  • 印尼术语词汇表数据集

    2025年4月14日   

    印尼术语词汇表数据集 数据来源:互联网公开数据 标签:印尼语,词汇表,术语翻译,语言学习,知识领域,多语言数据,教育工具 数据概述: 本数据集包含从互联网公开来源抓取的182,410条外语词汇及其印尼语等价词和相关知识领域的信息。数据集以CSV格式存储,包含以下三个字段: 1. 外语词汇(foreign):外语术语。 2....
    packageimg
  • 视频游戏推文数据集

    2025年4月14日   

    视频游戏推文数据集 数据来源:互联网公开数据 标签:视频游戏,社交媒体,自然语言处理,情感分析,文本挖掘,推文分析 数据概述: 本数据集收录了2020年8月至12月期间,从Twitter上抓取的1135条包含“videogames”标签的推文。每条推文包含以下五个字段: - 时间戳:推文的日期和时间,格式为YYYY-MM-DD和HH:MM:SS。 -...
    packageimg
  • Kaggle竞赛讨论区用户互动与讨论热度分析数据集

    2025年4月14日   

    Kaggle竞赛讨论区用户互动与讨论热度分析数据集 数据来源:互联网公开数据 标签:Kaggle,讨论区,用户行为,互动,数据分析,社区,机器学习,社交网络,文本挖掘 数据概述:...
    packageimg
  • 情感分类不平衡数据集

    2025年4月14日   

    情感分类不平衡数据集 数据来源:互联网公开数据 标签:情感分析,不平衡分类,半监督学习,文本分类,自然语言处理,机器学习 数据概述: 本数据集为解决情感分析中的类别不平衡问题而构建,涵盖三种情感类别:Negative、Positive和Neutral。初始阶段收集了620条评论数据,各类别分布分别为Negative 150条、Positive...
    packageimg
  • 摩洛哥阿拉伯语Darija语言任务与平行翻译数据集

    2025年4月14日   

    摩洛哥阿拉伯语Darija语言任务与平行翻译数据集 数据来源:互联网公开数据 标签:摩洛哥阿拉伯语, Darija, 机器翻译, 语言模型, 平行语料库, 自然语言处理, 多语言学习 数据概述:...
    packageimg
  • Wordle游戏有效猜测词与答案词汇数据集

    2025年4月14日   

    Wordle游戏有效猜测词与答案词汇数据集 数据来源:互联网公开数据 标签:Wordle, 单词游戏, 猜测, 词汇, 数据集, 游戏, 答案, 英语 数据概述:...
    packageimg
  • 洛杉矶推特新闻数据集

    2025年4月14日   

    洛杉矶推特新闻数据集 数据来源:互联网公开数据 标签:洛杉矶,推特,新闻,分类,自然语言处理,NLP,文本分析 数据概述:...
    packageimg
  • 印度尼西亚垃圾邮件检测电子邮件数据集1963-2021

    2025年4月14日   

    印度尼西亚垃圾邮件检测电子邮件数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,分类,文本分析,网络安全,数据清洗,特征提取 数据概述:...
    packageimg
  • 宾夕法尼亚交通局SEPTA推文与OTP历史数据集

    2025年4月14日   

    宾夕法尼亚交通局SEPTA推文与OTP历史数据集 数据来源:互联网公开数据 标签:SEPTA,推特,公共交通,准时性分析,数据挖掘,社交媒体分析,时间序列 数据概述: 本数据集整理自SEPTA(费城东南宾夕法尼亚交通局)的社交媒体推文数据,旨在支持参与Kaggle竞赛的用户结合OTP(On-Time...
    packageimg
  • PHINC-平行印地英混合语社交媒体语料库用于机器翻译

    2025年4月14日   

    PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...
    packageimg
  • GPU和CPU价格上涨原因数据集

    2025年4月14日   

    GPU和CPU价格上涨原因数据集 数据来源:互联网公开数据 标签:GPU价格, CPU价格, 文章分析, 情感分析, 文本处理, 数据清理, 市场趋势 数据概述:...
    packageimg
  • YouTube视频评论情感分析数据集-韩国美食频道视频评论-2024

    2025年4月14日   

    YouTube视频评论情感分析数据集-韩国美食频道视频评论-2024 数据来源:互联网公开数据 标签:YouTube,视频评论,情感分析,自然语言处理,多语言,韩国,美食,社交媒体,用户互动 数据概述:...
    packageimg
  • TensorFlow项目在Gemini长上下文竞赛中的分析数据集

    2025年4月14日   

    TensorFlow项目在Gemini长上下文竞赛中的分析数据集 数据来源:互联网公开数据 标签:TensorFlow, Gemini, 长上下文, 项目分析, 开源项目, GitHub, 机器学习, 技术演进, 社区互动, 数据可视化 数据概述:...
    packageimg
  • 情景喜剧宋飞正传剧本对话数据集

    2025年4月14日   

    情景喜剧宋飞正传剧本对话数据集 数据来源:互联网公开数据 标签:宋飞正传,情景喜剧,剧本,对话,角色,文本分析,喜剧,电视剧 数据概述: 本数据集包含了美国经典情景喜剧《宋飞正传》(Seinfeld)的剧本对话内容,涵盖了该剧所有季的剧集。数据集的核心内容是剧中的角色对话,以及相关的剧集和季节信息。数据以结构化的形式呈现,方便用户进行分析和探索。...
    packageimg
  • NLP机器人用户提问意图分类数据集

    2025年4月14日   

    NLP机器人用户提问意图分类数据集 数据来源:互联网公开数据 标签:自然语言处理,NLP,用户提问,意图识别,文本分类,机器学习,人工智能,prompt,用户交互 数据概述: 本数据集旨在对NLP机器人接收到的用户提问进行分类。数据集的核心是用户输入的文本内容(即用户提问),并为每个提问标注了相应的类别标签,以反映用户提问的意图。...
    packageimg
  • 越南新闻视角数据集2023

    2025年4月14日   

    越南新闻视角数据集2023 数据来源:互联网公开数据 标签:越南新闻,视角分析,文本摘要,数据爬虫,新闻研究 数据概述:...
    packageimg