-
航空常见问题数据集
航空常见问题数据集 数据来源:互联网公开数据 标签:航空,常见问题,乘客服务,行李,安全,航空旅行,客户服务 数据概述: 本数据集收录了与民用航空相关各种常见问题及其回答,涵盖行李处理、安全检查、乘客服务等多个领域。数据集为航空旅客、机场工作人员和相关部门提供了详细的FAQ信息,便于快速查找和解答各类航空相关的疑问。 数据用途概述:...
-
美国国情咨文政治演讲文本数据集1790-2019
美国国情咨文政治演讲文本数据集1790-2019 数据来源:互联网公开数据 标签:国情咨文,总统演讲,政治分析,历史文本,语言演变,政策研究,文本挖掘 数据概述:...
-
孟加拉语维基百科语料库数据集
孟加拉语维基百科语料库数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,自然语言处理,NLP,文本分析,机器学习,语料库 数据概述:...
-
-
印尼术语词汇表数据集
印尼术语词汇表数据集 数据来源:互联网公开数据 标签:印尼语,词汇表,术语翻译,语言学习,知识领域,多语言数据,教育工具 数据概述: 本数据集包含从互联网公开来源抓取的182,410条外语词汇及其印尼语等价词和相关知识领域的信息。数据集以CSV格式存储,包含以下三个字段: 1. 外语词汇(foreign):外语术语。 2....
-
视频游戏推文数据集
视频游戏推文数据集 数据来源:互联网公开数据 标签:视频游戏,社交媒体,自然语言处理,情感分析,文本挖掘,推文分析 数据概述: 本数据集收录了2020年8月至12月期间,从Twitter上抓取的1135条包含“videogames”标签的推文。每条推文包含以下五个字段: - 时间戳:推文的日期和时间,格式为YYYY-MM-DD和HH:MM:SS。 -...
-
Kaggle竞赛讨论区用户互动与讨论热度分析数据集
Kaggle竞赛讨论区用户互动与讨论热度分析数据集 数据来源:互联网公开数据 标签:Kaggle,讨论区,用户行为,互动,数据分析,社区,机器学习,社交网络,文本挖掘 数据概述:...
-
情感分类不平衡数据集
情感分类不平衡数据集 数据来源:互联网公开数据 标签:情感分析,不平衡分类,半监督学习,文本分类,自然语言处理,机器学习 数据概述: 本数据集为解决情感分析中的类别不平衡问题而构建,涵盖三种情感类别:Negative、Positive和Neutral。初始阶段收集了620条评论数据,各类别分布分别为Negative 150条、Positive...
-
摩洛哥阿拉伯语Darija语言任务与平行翻译数据集
摩洛哥阿拉伯语Darija语言任务与平行翻译数据集 数据来源:互联网公开数据 标签:摩洛哥阿拉伯语, Darija, 机器翻译, 语言模型, 平行语料库, 自然语言处理, 多语言学习 数据概述:...
-
Wordle游戏有效猜测词与答案词汇数据集
Wordle游戏有效猜测词与答案词汇数据集 数据来源:互联网公开数据 标签:Wordle, 单词游戏, 猜测, 词汇, 数据集, 游戏, 答案, 英语 数据概述:...
-
-
印度尼西亚垃圾邮件检测电子邮件数据集1963-2021
印度尼西亚垃圾邮件检测电子邮件数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,分类,文本分析,网络安全,数据清洗,特征提取 数据概述:...
-
宾夕法尼亚交通局SEPTA推文与OTP历史数据集
宾夕法尼亚交通局SEPTA推文与OTP历史数据集 数据来源:互联网公开数据 标签:SEPTA,推特,公共交通,准时性分析,数据挖掘,社交媒体分析,时间序列 数据概述: 本数据集整理自SEPTA(费城东南宾夕法尼亚交通局)的社交媒体推文数据,旨在支持参与Kaggle竞赛的用户结合OTP(On-Time...
-
PHINC-平行印地英混合语社交媒体语料库用于机器翻译
PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...
-
GPU和CPU价格上涨原因数据集
GPU和CPU价格上涨原因数据集 数据来源:互联网公开数据 标签:GPU价格, CPU价格, 文章分析, 情感分析, 文本处理, 数据清理, 市场趋势 数据概述:...
-
YouTube视频评论情感分析数据集-韩国美食频道视频评论-2024
YouTube视频评论情感分析数据集-韩国美食频道视频评论-2024 数据来源:互联网公开数据 标签:YouTube,视频评论,情感分析,自然语言处理,多语言,韩国,美食,社交媒体,用户互动 数据概述:...
-
TensorFlow项目在Gemini长上下文竞赛中的分析数据集
TensorFlow项目在Gemini长上下文竞赛中的分析数据集 数据来源:互联网公开数据 标签:TensorFlow, Gemini, 长上下文, 项目分析, 开源项目, GitHub, 机器学习, 技术演进, 社区互动, 数据可视化 数据概述:...
-
情景喜剧宋飞正传剧本对话数据集
情景喜剧宋飞正传剧本对话数据集 数据来源:互联网公开数据 标签:宋飞正传,情景喜剧,剧本,对话,角色,文本分析,喜剧,电视剧 数据概述: 本数据集包含了美国经典情景喜剧《宋飞正传》(Seinfeld)的剧本对话内容,涵盖了该剧所有季的剧集。数据集的核心内容是剧中的角色对话,以及相关的剧集和季节信息。数据以结构化的形式呈现,方便用户进行分析和探索。...
-
NLP机器人用户提问意图分类数据集
NLP机器人用户提问意图分类数据集 数据来源:互联网公开数据 标签:自然语言处理,NLP,用户提问,意图识别,文本分类,机器学习,人工智能,prompt,用户交互 数据概述: 本数据集旨在对NLP机器人接收到的用户提问进行分类。数据集的核心是用户输入的文本内容(即用户提问),并为每个提问标注了相应的类别标签,以反映用户提问的意图。...
-



