-
增强型电子邮件分类数据集-2023-valentynbovchaliuk
增强型电子邮件分类数据集-2023-valentynbovchaliuk 数据来源:互联网公开数据 标签:电子邮件分类,数据增强,NLP,文本处理,机器学习,数据集,反垃圾邮件,自然语言处理,数据扩充 数据概述:... -
社交媒体缩略语与俚语数据集-rizdelhi
社交媒体缩略语与俚语数据集-rizdelhi 数据来源:互联网公开数据 标签:社交媒体,缩略语,俚语,NLP,文本处理,数据分析,自然语言处理 数据概述:... -
抑郁症相关Reddit数据集TF-IDF词向量分析-2023-alexyarbor
抑郁症相关Reddit数据集TF-IDF词向量分析-2023-alexyarbor 数据来源:互联网公开数据 标签:抑郁症,Reddit,TF-IDF,情感分析,VADER,文本处理 数据概述: 本数据集基于Kaggle平台上的“Depression Reddit... -
智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi
智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi 数据来源:互联网公开数据 标签:聊天机器人,自然语言处理,问答系统,知识库,信息检索,文本处理,用户交互,Wikipedia,数据分析 数据概述:... -
大型语言模型生成文本检测训练数据集中的重复文本-2023-agnedil
大型语言模型生成文本检测训练数据集中的重复文本-2023-agnedil 数据来源:互联网公开数据 标签:LLM,大模型,文本检测,AI生成,重复文本,数据集,文本处理,训练数据,机器学习 数据概述: 本数据集包含用于“LLM - Detect AI Generated... -
印度新闻摘要清理数据集1963-2021
印度新闻摘要清理数据集1963-2021 数据来源:互联网公开数据 标签:新闻摘要,印度,数据清理,文本处理,自然语言处理,机器学习 数据概述: 本数据集是Kondalarao... -
电影评论及其法语翻译数据集
电影评论及其法语翻译数据集 数据来源:互联网公开数据 标签:电影评论,IMDb,法语翻译,文本处理,情感分析,机器翻译,跨语言分析 数据概述: 本数据集基于Aditya、P.等人的IMDb电影评论数据集构建,包含多部电影的评论数据,每条评论对应一部特定电影。数据集经过清洗和规则化处理,以确保数据质量,并使用Google Translate... -
恩尼翁2006年电子邮件垃圾邮件与正常邮件分类数据集
恩尼翁2006年电子邮件垃圾邮件与正常邮件分类数据集 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件分类,正常邮件,文本处理,数据预处理,机器学习,文本分析 数据概述:... -
文本分析与数据挖掘课程数据集
文本分析与数据挖掘课程数据集 数据来源:互联网公开数据 标签:文本分析,数据挖掘,课程资源,教学研究,文本处理,机器学习,自然语言处理 数据概述:... -
-
-
伦巴第语命名实体识别与语言训练数据集
伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。... -
-
印度邮件垃圾邮件分类数据集2003-2005
印度邮件垃圾邮件分类数据集2003-2005 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件,Ham,Spam,SpamAssassin,文本处理,电子邮件分析 数据概述:... -
自杀干预情感分析数据集
自杀干预情感分析数据集 数据来源:互联网公开数据 标签:自杀干预,情感分析,心理健康,文本处理,TF-IDF,自然语言处理,情绪分类 数据概述: 本数据集基于“suicide-watch”数据集进行处理和增强,包含经过清洗的文本数据、TF-... -
-
数据3000文本恢复挑战提示数据集
数据3000文本恢复挑战提示数据集 数据来源:互联网公开数据 标签:文本恢复,提示生成,创造力,文本处理,专业设置,维基百科,相似度评分 数据概述:... -
-
-
撰写过程与质量关联性重建文本数据集
撰写过程与质量关联性重建文本数据集 数据来源:互联网公开数据 标签:撰写过程,文本质量,数据重建,机器学习,比赛数据,文本处理 数据概述: 本数据集包含用于“Linking Writing Processes to Writing Quality”...