找到11,989个数据集

标签: 自然语言处理

过滤结果
  • 国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn

    2025年4月24日   

    国际法律信息检索竞赛COLIEE2024图卷积网络数据集COLIEE2024GCNDataset-nguynkhnhhuyn 数据来源:互联网公开数据 标签:法律文本,信息检索,图卷积网络,数据集,自然语言处理,机器学习,法律科技,文本分析 数据概述: 该数据集来源于国际法律信息检索竞赛(COLIEE...
    packageimg
  • 深度学习模型训练数据SubmissionTrainEpoch10-ryosukeozaki

    2025年4月24日   

    深度学习模型训练数据SubmissionTrainEpoch10-ryosukeozaki 数据来源:互联网公开数据 标签:深度学习,模型训练,数据集,文本分类,自然语言处理,机器学习,数据分析,神经网络 数据概述: 该数据集包含用于深度学习模型训练的文本数据,记录了模型在训练过程中的数据表现。主要特征如下:...
    packageimg
  • 印度2019大选期间政党推文情感分析数据集-rishabhvyas

    2025年4月24日   

    印度2019大选期间政党推文情感分析数据集-rishabhvyas 数据来源:互联网公开数据 标签:印度选举,推文,情感分析,BJP,国大党,数据预处理,机器学习,文本分类,自然语言处理 数据概述: 本数据集包含2019年印度大选期间与印度两大主要政党BJP(印度人民党)和国大党相关的推文。这些推文通过Twitter...
    packageimg
  • 推特社交平台网络欺凌数据集TwitterCyberbullyingDataset-saitejave

    2025年4月24日   

    推特社交平台网络欺凌数据集TwitterCyberbullyingDataset-saitejave 数据来源:互联网公开数据 标签:社交媒体,网络欺凌,数据集,文本分析,情感分析,自然语言处理,机器学习,社会学 数据概述:...
    packageimg
  • 招聘信息分析数据集JobsListDataset-abdallahali

    2025年4月24日   

    招聘信息分析数据集JobsListDataset-abdallahali 数据来源:互联网公开数据 标签:招聘信息,职位分析,数据集,自然语言处理,文本挖掘,机器学习,就业市场,人力资源 数据概述: 该数据集包含来自互联网的招聘信息,记录了不同行业,不同职位的招聘详情。主要特征如下:...
    packageimg
  • 自然语言处理项目推文数据集NLPProjectTweetsDataset-fathomless

    2025年4月24日   

    自然语言处理项目推文数据集NLPProjectTweetsDataset-fathomless 数据来源:互联网公开数据 标签:自然语言处理,推文分析,数据集,文本挖掘,情感分析,机器学习,社交媒体,舆情研究 数据概述:该数据集包含来自自然语言处理项目的推文数据,记录了社交媒体平台上用户发布的推文内容及相关信息。主要特征如下:...
    packageimg
  • 顶级电影评论数据集TopMovieReviewDataset-pathik2024

    2025年4月24日   

    顶级电影评论数据集TopMovieReviewDataset-pathik2024 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,情感分析,机器学习,文本挖掘,影视研究,用户体验 数据概述: 该数据集包含来自多个电影评论网站和平台的顶级电影评论数据,记录了用户对电影的评价和反馈。主要特征如下:...
    packageimg
  • 孟加拉电子产品分词数据集BanglaElectronicsLemmatizedFinalDataset-nirajmahi

    2025年4月24日   

    孟加拉电子产品分词数据集BanglaElectronicsLemmatizedFinalDataset-nirajmahi 数据来源:互联网公开数据 标签:电子产品,数据集,分词,自然语言处理,机器学习,文本分析,语言学,数据挖掘 数据概述: 该数据集包含来自孟加拉国电子产品领域的分词数据,记录了电子产品相关的文本信息。主要特征如下:...
    packageimg
  • PDF文档摘要提取数据集DrivePDFDataset-atif10

    2025年4月24日   

    PDF文档摘要提取数据集DrivePDFDataset-atif10 数据来源:互联网公开数据 标签:PDF文档,文本摘要,数据集,自然语言处理,机器学习,信息检索,文档分析,NLP 数据概述: 该数据集包含来自Google Drive的PDF文档及其对应的摘要文本。主要特征如下: 时间跨度: 数据记录的时间跨度不明确,取决于文档的创建和上传时间。...
    packageimg
  • 英法翻译数据集English-FrenchTranslationDataset-endofnight17j03

    2025年4月24日   

    英法翻译数据集English-FrenchTranslationDataset-endofnight17j03 数据来源:互联网公开数据 标签:机器翻译,翻译,自然语言处理,数据集,语言模型,文本数据,双语语料库,NLP 数据概述: 该数据集包含英法双语翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:...
    packageimg
  • 情感识别与文本分析数据集CREMATextCSVDataset-nytgaming

    2025年4月24日   

    情感识别与文本分析数据集CREMATextCSVDataset-nytgaming 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本挖掘,机器学习,情感计算,语言技术,人工智能 数据概述: 该数据集包含来自CREMA-D项目的文本数据,记录了语音情感识别任务中的文本内容及其对应的情感标签。主要特征如下:...
    packageimg
  • 美国人口普查BERT词嵌入数据集BERTEmbeddingUSPPPDataset-e94076039

    2025年4月24日   

    美国人口普查BERT词嵌入数据集BERTEmbeddingUSPPPDataset-e94076039 数据来源:互联网公开数据 标签:BERT词嵌入,人口普查,数据集,自然语言处理,机器学习,社会科学研究,人口统计,美国 数据概述:该数据集包含了基于BERT模型生成的人口普查相关词汇的词嵌入,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • 未对齐的标记化数据集CenteredTokenized-2Dataset-enarior

    2025年4月24日   

    未对齐的标记化数据集CenteredTokenized-2Dataset-enarior 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本处理,机器学习,语言模型,数据标注,文本分类,深度学习 数据概述: 该数据集包含来自未对齐标记化处理过程的文本数据,记录了经过特定标记化方法处理的文本样本。主要特征如下:...
    packageimg
  • 双语文本对齐数据集BitextDataCollection-imaadhasan

    2025年4月24日   

    双语文本对齐数据集BitextDataCollection-imaadhasan 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本对齐,双语数据,语言技术,数据挖掘,人工智能 数据概述: 该数据集包含来自多个来源的双语文本对齐数据,记录了不同语言之间的文本对应关系。主要特征如下:...
    packageimg
  • Quora重复问题数据集QuoraDuplicateQuestionsDataset-ekanshu

    2025年4月24日   

    Quora重复问题数据集QuoraDuplicateQuestionsDataset-ekanshu 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,深度学习,语义分析 数据概述: 该数据集包含来自Quora平台的问答数据,记录了平台上用户提出的问题及其标签。主要特征如下:...
    packageimg
  • 医学问答数据集MedicalQuestionAnsweringDataset-swaranshpatel

    2025年4月24日   

    医学问答数据集MedicalQuestionAnsweringDataset-swaranshpatel 数据来源:互联网公开数据 标签:医学,问答系统,数据集,人工智能,自然语言处理,健康咨询,机器学习,信息检索 数据概述: 该数据集包含来自医学领域的问答数据,记录了用户提出的医学相关问题及其对应的专家回答。主要特征如下:...
    packageimg
  • KaggleREADME文件文档数据集-rejent

    2025年4月24日   

    KaggleREADME文件文档数据集-rejent 数据来源:互联网公开数据 标签:文档,数据集,Kaggle,元数据,数据清洗,数据分析,机器学习,自然语言处理 数据概述: 该数据集包含Kaggle平台上README文档的元数据和文本内容,用于数据科学和机器学习研究。主要特征如下:...
    packageimg
  • 客户银行推文主题分析数据集LDA-W2V-D2VTopicsandTweetsCustomerBankingDataset-yixiang

    2025年4月24日   

    客户银行推文主题分析数据集LDA-W2V-D2VTopicsandTweetsCustomerBankingDataset-yixiang 数据来源:互联网公开数据 标签:客户银行,推文分析,主题建模,文本挖掘,情感分析,自然语言处理,机器学习,社交媒体 数据概述:...
    packageimg
  • 标题与期刊论文数据集TitleandJournalDataset-boa234

    2025年4月24日   

    标题与期刊论文数据集TitleandJournalDataset-boa234 数据来源:互联网公开数据 标签:期刊论文,标题分析,数据集,学术研究,文本挖掘,自然语言处理,信息检索,学术资源 数据概述: 该数据集包含来自多个学术期刊的论文标题数据,记录了各类期刊论文的标题信息。主要特征如下: 时间跨度: 数据记录的时间范围从2000年到2022年。...
    packageimg
  • 焦虑症状Reddit帖子数据集AnxietySymptomsRedditPostsDataset-countmein

    2025年4月24日   

    焦虑症状Reddit帖子数据集AnxietySymptomsRedditPostsDataset-countmein 数据来源:互联网公开数据 标签:焦虑症状,Reddit,社交媒体,心理健康,数据分析,情感分析,自然语言处理,心理健康研究...
    packageimg