-
安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002
安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,安然公司,文本分析,自然语言处理,信息检索,邮件安全,金融,商业丑闻 数据概述:... -
马拉提语新闻标题数据集1963-2021
马拉提语新闻标题数据集1963-2021 数据来源:互联网公开数据 标签:马拉提语,新闻标题,文本分析,自然语言处理,分类模型,机器学习,数据清洗 数据概述: 本数据集包含从马拉提语新闻网站收集的约12000条新闻文章标题。数据集已经经过清洗处理,并分为训练集和测试集,适用于基准测试各类马拉提语文本分类模型。 数据用途概述:... -
联合国一般性辩论文本集
联合国一般性辩论文本集 数据来源:互联网公开数据 标签:联合国,一般性辩论,政治话语,文本分析,国际关系,NLP,全球治理,多边外交,历史记录,政治文本,政策分析 数据概述:... -
ChatGPT医疗应用研究文献数据集
ChatGPT医疗应用研究文献数据集 数据来源:互联网公开数据 标签:PubMed, 医疗, ChatGPT, 研究论文, 文本分析, 长上下文建模, 大语言模型, Gemini 数据概述: 本数据集由 Google - Gemini Long Context 竞赛产生,包含通过 PubMed 搜索获取的关于 ChatGPT... -
-
命名实体识别文本信息标注数据集
命名实体识别文本信息标注数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据标注,信息抽取,文本挖掘 数据概述:... -
-
-
西班牙语评论文本向量化分析数据集
西班牙语评论文本向量化分析数据集 数据来源:互联网公开数据 标签:西班牙语,文本分析,自然语言处理,情感分析,机器学习,词袋模型,TF-IDF,停用词,分类 数据概述: 本数据集包含722条西班牙语评论文本,用于二元分类问题。数据集经过文本向量化处理,基于词袋模型(BoW)和TF-... -
-
印度尼西亚短信垃圾信息数据集
印度尼西亚短信垃圾信息数据集 数据来源:互联网公开数据 标签:短信,垃圾信息,分类,文本分析,机器学习,印尼语 数据概述: 本数据集来源于https://yudiwbs.wordpress.com/2018/08/05/dataset-klasifikasi-bahasa-indonesia-sms-spam-klasifikasi-teks-... -
华尔街赌场Reddit帖子数据集
华尔街赌场Reddit帖子数据集 数据来源:互联网公开数据 标签:华尔街赌场,Reddit,社交媒体,股票,投资,金融,社区,帖子,文本分析,情绪分析 数据概述:... -
福尔德家族故事集情感分析数据集
福尔德家族故事集情感分析数据集 数据来源:互联网公开数据 标签:情感分析,文本分析,自然语言处理,福尔德家族,故事集,词频分析,情感词典,主题建模,实体识别 数据概述:... -
多模态情感数据集
多模态情感数据集 数据来源:互联网公开数据 标签:多模态,情感分析,图像识别,自然语言处理,计算机视觉,图像分类,文本分析 数据概述: 本数据集包含100个不同类别动物和物体的图像及其对应的文本描述和情感标签,适用于多模态情感分析研究。图像类别包括鲨鱼、鸟类、蜥蜴、蜘蛛等。该数据集为计算机视觉和自然语言处理任务提供了丰富的数据资源。 数据用途概述:... -
在线新闻聚类分析数据集2021
在线新闻聚类分析数据集2021 数据来源:互联网公开数据 标签:在线新闻,聚类分析,K均值聚类,层次聚类,新闻分类,数据挖掘,文本分析 数据概述: 本数据集包含2021年在线新闻的文章数据,涵盖新闻的主题、内容摘要、发布日期、作者、类别等多种信息。数据集旨在为新闻分类和聚类分析提供丰富的源数据,支持不同类型的文本处理研究。 数据用途概述:... -
印度尼西亚垃圾短信文本分析数据集1963-2021
印度尼西亚垃圾短信文本分析数据集1963-2021 数据来源:互联网公开数据 标签:垃圾短信,文本分析,商业用途,欺诈检测,客户支持,趋势分析,教育,网络安全,短信分类,机器学习,自然语言处理 数据概述:... -
微博头像数据集
微博头像数据集 数据来源:互联网公开数据 标签:微博,社交媒体,头像,文本分析,TF-IDF,Bert,话题识别 数据概述: 本数据集包含从微博爬取的CSV文件和使用TF-... -
-
推特情绪强度分析数据集1963-2021
推特情绪强度分析数据集1963-2021 数据来源:互联网公开数据 标签:情绪分析,推特,情感强度,情绪分类,自然语言处理,文本分析,社交媒体分析 数据概述:... -
印度法律与法案数据集1074-至今
印度法律与法案数据集1074-至今 数据来源:互联网公开数据 标签:印度法律,法案,历史,法律研究,文本分析,语言模型,政策分析 数据概述:...