-
美国K12教育捐款项目数据集DonorsChooseDataset-samyukthamobile
美国K12教育捐款项目数据集DonorsChooseDataset-samyukthamobile 数据来源:互联网公开数据 标签:教育,捐款,项目,数据集,机器学习,自然语言处理,文本分析,社会科学,公益 数据概述: 该数据集包含来自DonorsChoose.org的教育捐款项目数据,记录了美国K12教育(幼儿园至高中)的捐款项目信息。主要特征如下:... -
多语言有毒评论训练数据集MultilingualToxicCommentsTrainingDataset-leecming
多语言有毒评论训练数据集MultilingualToxicCommentsTrainingDataset-leecming 数据来源:互联网公开数据 标签:自然语言处理,有毒评论,数据集,文本分类,机器学习,多语言,数据挖掘,网络安全 数据概述: 该数据集包含来自多个语言环境的有毒评论数据,记录了不同语言背景下的网络评论内容及其毒性分类。主要特征如下:... -
GSoC增强型临床试验数据集GSoCClinicalTrialAugmentedDataset-sangemjayaprakash
GSoC增强型临床试验数据集GSoCClinicalTrialAugmentedDataset-sangemjayaprakash 数据来源:互联网公开数据 标签:临床试验,数据集,医学,机器学习,自然语言处理,文本分析,医疗健康,数据增强... -
医学信息多源整合数据库3自然语言处理数据集MIMIC-IIINLPDataset-cjinny
医学信息多源整合数据库3自然语言处理数据集MIMIC-IIINLPDataset-cjinny 数据来源:互联网公开数据 标签:医学信息,自然语言处理,数据集,电子病历,文本分析,机器学习,临床研究,健康数据 数据概述:该数据集属于医学信息多源整合数据库3(MIMIC-... -
数据2024年法律文档检索竞赛SOICTHackathon2024法律文档检索数据集SOICTHackathon2024LegalDocumentRetr...
2024年法律文档检索竞赛SOICTHackathon2024法律文档检索数据集SOICTHackathon2024LegalDocumentRetrievalDataset-hhhoang 数据来源:互联网公开数据 标签:法律文档,数据集,信息检索,文本挖掘,机器学习,自然语言处理,人工智能,竞赛数据 数据概述:... -
网络安全伦理黑客认证考试题目数据集CybersecurityEthicalHackingCertificationExamQuestions-huynoth
网络安全伦理黑客认证考试题目数据集CybersecurityEthicalHackingCertificationExamQuestions-huynoth 数据来源:互联网公开数据 标签:网络安全, 伦理黑客, 认证考试, 考试题库, 信息安全, 机器学习, 自然语言处理, 知识图谱 数据概述:... -
虚假新闻检测文本数据集FakeNewsDetectionTextDataset-wangchangqin
虚假新闻检测文本数据集FakeNewsDetectionTextDataset-wangchangqin 数据来源:互联网公开数据 标签:虚假新闻, 文本分类, 自然语言处理, 机器学习, 新闻分析, 情感分析, 数据标注, 文本语料 数据概述: 该数据集包含来自新闻网站和社交媒体的文本数据,旨在用于虚假新闻检测任务。主要特征如下:... -
人工智能简历筛选数据集AIResumeScreeningDataset-sohrabbahari
人工智能简历筛选数据集AIResumeScreeningDataset-sohrabbahari 数据来源:互联网公开数据 标签:人工智能,简历筛选,数据集,机器学习,自然语言处理,招聘,职业发展,数据分析 数据概述: 该数据集包含来自多个招聘平台的简历数据,记录了求职者的简历信息及其匹配的职位要求。主要特征如下:... -
越南语问答数据集VietnameseQuestionAnsweringDataset-minhlcnguyn
越南语问答数据集VietnameseQuestionAnsweringDataset-minhlcnguyn 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本匹配, 信息检索, 越南语, 语义理解, 数据集构建, 知识库 数据概述: 该数据集包含来自越南语语料库的问答对,旨在用于训练和评估越南语问答系统。主要特征如下:... -
学术论文引用关系数据集AcademicPaperCitationRelationshipDataset-rahulkishoregorai
学术论文引用关系数据集AcademicPaperCitationRelationshipDataset-rahulkishoregorai 数据来源:互联网公开数据 标签:学术论文, 引用分析, 引文网络, 论文推荐, 学术研究, 数据挖掘, 知识图谱, 自然语言处理 数据概述:... -
问答推理数据集-上下文与问题匹配分析Context-QuestionMatchingAnalysis-emam2002
问答推理数据集-上下文与问题匹配分析Context-QuestionMatchingAnalysis-emam2002 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本匹配, 语义理解, 事实判断, 文本推理, 数据标注, 机器阅读理解 数据概述:... -
多语言图像处理数据集MLIPDataset-dobosp
多语言图像处理数据集MLIPDataset-dobosp 数据来源:互联网公开数据 标签:图像处理,多语言,数据集,文本识别,计算机视觉,自然语言处理,跨模态,人工智能 数据概述: 该数据集包含多语言图像处理数据,旨在促进跨语言图像分析和理解。主要特征如下: 时间跨度:数据记录时间跨度不限,持续更新。... -
社交媒体谣言检测数据集PHEMETreeTransformer-gengchensun
社交媒体谣言检测数据集PHEMETreeTransformer-gengchensun 数据来源:互联网公开数据 标签:谣言检测,社交媒体,自然语言处理,文本分析,机器学习,树结构,PHEME,Transformer 数据概述: 该数据集源于PHEME项目,旨在研究社交媒体平台上的谣言传播与检测。主要特征如下:... -
Transformer模型研究与应用数据集TransformersDataset-a24998667
Transformer模型研究与应用数据集TransformersDataset-a24998667 数据来源:互联网公开数据 标签:自然语言处理,深度学习,Transformer,数据集,机器翻译,文本生成,NLP,模型训练 数据概述: 该数据集包含了用于训练和评估Transformer模型的数据,主要涵盖了各种自然语言处理任务。主要特征如下:... -
笑话内容分类数据集OffenseClassificationJokesDataset-avneets2103
笑话内容分类数据集OffenseClassificationJokesDataset-avneets2103 数据来源:互联网公开数据 标签:文本分类,数据集,幽默分析,机器学习,自然语言处理,情感分析,内容审核,数据挖掘 数据概述: 该数据集包含来自公开来源的笑话数据,记录了笑话的文本内容和分类标签。主要特征如下:... -
Jigsaw多语言恶意评论数据集JigsawMultilingualToxicCommentDataset-yeayates21
Jigsaw多语言恶意评论数据集JigsawMultilingualToxicCommentDataset-yeayates21 数据来源:互联网公开数据 标签:自然语言处理,文本分析,多语言,恶意评论,数据集,情感分析,机器学习,文本分类 数据概述: 该数据集由 Jigsaw... -
用户评价文本情感分析数据集UserReviewSentimentAnalysis-dodge8xieyanxiao
用户评价文本情感分析数据集UserReviewSentimentAnalysis-dodge8xieyanxiao 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 用户评价, 自然语言处理, 评论分析, 数据标注, 情感分类, 机器学习 数据概述:... -
社交媒体用户情感分析训练数据集SocialMediaUserSentimentAnalysisTrainingDataset-raghavansandhya
社交媒体用户情感分析训练数据集SocialMediaUserSentimentAnalysisTrainingDataset-raghavansandhya 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分类, 自然语言处理, 机器学习, 情感极性, 数据标注, 文本挖掘 数据概述:... -
越南语新闻文本情感分析数据集VietnameseNewsTextSentimentAnalysis-inhmnhhng
越南语新闻文本情感分析数据集VietnameseNewsTextSentimentAnalysis-inhmnhhng 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 越南语, 新闻文本, 情感标注, 机器学习, 数据集 数据概述: 该数据集包含来自越南新闻媒体的文本数据,记录了用于情感分析的结构化新闻文章片段。主要特征如下:... -
内容清洗数据集Content-CleanedDataDataset-trngththanhh
内容清洗数据集Content-CleanedDataDataset-trngththanhh 数据来源:互联网公开数据 标签:数据清洗,数据集,文本处理,自然语言处理,数据预处理,数据质量,机器学习,数据挖掘 数据概述: 该数据集包含经过清洗和标准化的文本数据,记录了从互联网公开来源收集的内容,并进行了去噪、去重和格式统一等处理。主要特征如下:...