-
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar 数据来源:互联网公开数据 标签:文本分析, 词频统计, 自然语言处理, 语料库, 数据清洗, 文本预处理, 基础词汇, 数据集 数据概述:... -
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-khanhdaom
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-khanhdaom 数据来源:互联网公开数据 标签:越南语, 文本纠错, 自然语言处理, 错误检测, 文本校对, 机器学习, 深度学习, 语料库 数据概述:... -
阿拉伯语文本去标点数据集ArabicTextDotlessDataset-ouassimbehlil
阿拉伯语文本去标点数据集ArabicTextDotlessDataset-ouassimbehlil 数据来源:互联网公开数据 标签:阿拉伯语, 文本处理, 文本清洗, 自然语言处理, 语言模型, 字符级分析, 数据预处理, 语料库 数据概述: 该数据集包含经过处理的阿拉伯语文本,记录了原始文本及其对应的去标点版本。主要特征如下:... -
文本情感分类新闻数据集TextSentimentClassificationNewsDataset-premsaikumar
文本情感分类新闻数据集TextSentimentClassificationNewsDataset-premsaikumar 数据来源:互联网公开数据 标签:情感分析, 文本分类, 新闻, 自然语言处理, 深度学习, 语料库, 情感标签, 预训练 数据概述: 该数据集包含来自新闻报道的文本数据,记录了新闻文章的描述信息及其对应的情感类别。主要特征如下:... -
新闻文本分类数据集NewsTextClassificationDataset-brij1823
新闻文本分类数据集NewsTextClassificationDataset-brij1823 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 标题分析, 自然语言处理, 新闻内容, 时间序列, 机器学习, 语料库 数据概述: 该数据集包含来自新闻媒体的文本数据,记录了新闻标题及其对应的类别。主要特征如下:... -
教育内容主题相关性文本数据集EducationalContentTopicRelevanceTextDataset-millerrfu
教育内容主题相关性文本数据集EducationalContentTopicRelevanceTextDataset-millerrfu 数据来源:互联网公开数据 标签:文本分类, 教育, 主题相关性, 自然语言处理, 机器学习, 知识图谱, 语料库, 内容理解 数据概述:... -
新闻摘要文本分析数据集NewsSummaryTextAnalysisDataset-usmannwaheed
新闻摘要文本分析数据集NewsSummaryTextAnalysisDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 摘要生成, 标题生成, 文本摘要, 机器学习, 语料库 数据概述: 该数据集包含来自新闻网站的摘要信息,记录了新闻标题和对应的文本正文。主要特征如下:... -
手机与驾驶安全文本分析数据集MobilePhoneandDrivingSafetyTextAnalysis-gmhost
手机与驾驶安全文本分析数据集MobilePhoneandDrivingSafetyTextAnalysis-gmhost 数据来源:互联网公开数据 标签:手机使用, 驾驶安全, 文本分析, 事故风险, 自然语言处理, 舆情分析, 风险评估, 语料库 数据概述:... -
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi 数据来源:互联网公开数据 标签:印度英语,语料库,自然语言处理,文本分析,语言学,机器学习,文本数据,语言资源 数据概述: 该数据集包含来自阿迪提语料库的印度英语文本数据,记录了印度英语的各种语言现象。主要特征如下:... -
细胞周期与肿瘤研究文本数据集CellCycleandTumorResearchTextData-madwolf
细胞周期与肿瘤研究文本数据集CellCycleandTumorResearchTextData-madwolf 数据来源:互联网公开数据 标签:细胞周期, 肿瘤研究, 文本分析, 生物医学, 蛋白质, 基因, 机器学习, 语料库 数据概述:... -
文本检索与自然语言处理Zalo数据集TextRetrievalandNLPZaloDataset2021-anhbuivuongtam
文本检索与自然语言处理Zalo数据集TextRetrievalandNLPZaloDataset2021-anhbuivuongtam 数据来源:互联网公开数据 标签:文本检索, 自然语言处理, 机器学习, 深度学习, 语料库, 文本分类, 机器翻译, 数据集 数据概述:... -
金融文本情感分析数据集FinancialTextSentimentAnalysis-ganeshn88
金融文本情感分析数据集FinancialTextSentimentAnalysis-ganeshn88 数据来源:互联网公开数据 标签:情感分析, 金融文本, 自然语言处理, 文本分类, 机器学习, 语料库, FinBERT, 情感标注 数据概述: 该数据集包含来自金融新闻和报告的文本数据,记录了用于情感分析的句子示例。主要特征如下:... -
人口贩卖议题文本分类数据集HumanTraffickingTopicTextClassificationDataset-phucpx
人口贩卖议题文本分类数据集HumanTraffickingTopicTextClassificationDataset-phucpx 数据来源:互联网公开数据 标签:人口贩卖, 文本分类, 议题分析, 道德伦理, 社会问题, 机器学习, 语料库, 数据标注 数据概述: 该数据集包含来自互联网的文本数据,记录了关于人口贩卖议题的讨论与分析。主要特征如下:... -
电影评论情感分析测试数据集MovieReviewsSentimentAnalysisTestData-sarthakgangwal
电影评论情感分析测试数据集MovieReviewsSentimentAnalysisTestData-sarthakgangwal 数据来源:互联网公开数据 标签:情感分析, 文本数据, 电影评论, 自然语言处理, 情感分类, 机器学习, 评论挖掘, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了观众对电影的评价。主要特征如下:... -
工业化学领域语料库IndustrialChemicalDomainCorpus-shahrukhkhan
工业化学领域语料库IndustrialChemicalDomainCorpus-shahrukhkhan 数据来源:互联网公开数据 标签:工业化学,语料库,文本分析,自然语言处理,学术研究,数据科学,化学工程,机器学习 数据概述:... -
新闻文本主题分类数据集NewsTextTopicClassification-liliyadav
新闻文本主题分类数据集NewsTextTopicClassification-liliyadav 数据来源:互联网公开数据 标签:文本分类, 新闻, 主题识别, 自然语言处理, 机器学习, 语料库, 文本分析, 情感分析 数据概述: 该数据集包含来自新闻报道的文本内容,记录了不同文章及其对应的主题分类。主要特征如下:... -
文本相似度分析数据集TextSimilarityAnalysisDataset-hoorayyliu
文本相似度分析数据集TextSimilarityAnalysisDataset-hoorayyliu 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 语义分析, 数据标注, 机器学习, 对比分析, 语料库 数据概述:... -
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-bajajra
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-bajajra 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 机器学习, 深度学习, 语料库, BERT 数据概述:... -
越南语问答意图识别数据集VietnameseQuestionAnsweringIntentRecognitionDataset-khanhdaom
越南语问答意图识别数据集VietnameseQuestionAnsweringIntentRecognitionDataset-khanhdaom 数据来源:互联网公开数据 标签:自然语言处理, 意图识别, 问答系统, 文本分类, 越南语, 机器学习, 对话系统, 语料库 数据概述:... -
医学文献文本分类数据集MedicalLiteratureTextClassification-lunanana1999
医学文献文本分类数据集MedicalLiteratureTextClassification-lunanana1999 数据来源:互联网公开数据 标签:医学文本, 文本分类, 疾病诊断, 医疗研究, 自然语言处理, 机器学习, 语料库, 临床医学 数据概述: 该数据集包含来自医学文献的文本数据,记录了用于疾病诊断和医学研究的文本片段。主要特征如下:...