-
安然公司邮件语料库EnronEmailCorpus数据集-minalray
安然公司邮件语料库EnronEmailCorpus数据集-minalray 数据来源:互联网公开数据 标签:邮件, 文本, 语料库, 自然语言处理, 金融, 能源, 文本挖掘, 商业 数据概述: 该数据集包含来自安然公司(Enron Corporation)内部员工的电子邮件数据,记录了公司运营期间的通信内容。主要特征如下:... -
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言模型, 印度语言, 语料库, 自然语言处理, 双语数据, 英语 数据概述: 该数据集包含来自互联网的印地语-... -
英国广播公司新闻文本分类数据集BBCNewsTextClassificationDataset-bedantikalahiri
英国广播公司新闻文本分类数据集BBCNewsTextClassificationDataset-bedantikalahiri 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 自然语言处理, 语料库, 文本挖掘, 机器学习, 情感分析, 媒体报道 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-zahidhasan00
电影评论情感分析数据集MovieReviewSentimentAnalysis-zahidhasan00 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了评论内容及其对应的情感极性标签。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-konstantinilkov
电影评论情感分析数据集MovieReviewSentimentAnalysis-konstantinilkov 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情感倾向性, 机器学习, 数据标注, 语料库 数据概述:... -
多语言文本分类训练数据集MultilingualTextClassificationTrainingDataset-jvkchaitanya410
多语言文本分类训练数据集MultilingualTextClassificationTrainingDataset-jvkchaitanya410 数据来源:互联网公开数据 标签:文本分类, 多语言, 机器翻译, 语言识别, 自然语言处理, 语料库, 文本挖掘, 数据标注 数据概述:... -
提示词指令微调数据集PromptInstructionFine-tuningDataset-eightina
提示词指令微调数据集PromptInstructionFine-tuningDataset-eightina 数据来源:互联网公开数据 标签:提示词, 指令微调, 自然语言处理, 大语言模型, 文本生成, 机器学习, 对话生成, 语料库 数据概述: 该数据集包含来自开源社区的提示词与对应指令示例,旨在用于大语言模型的指令微调。主要特征如下:... -
新闻文本复杂度分析与摘要生成数据集NewsTextComplexitySummarizationDataset-abdessamadmekkaoui
新闻文本复杂度分析与摘要生成数据集NewsTextComplexitySummarizationDataset-abdessamadmekkaoui 数据来源:互联网公开数据 标签:文本分析, 文本摘要, 可读性评估, 自然语言处理, 机器学习, 新闻文本, 复杂度分析, 语料库 数据概述:... -
情感分析文本情绪标注数据集SentimentAnalysisTextEmotionLabeling-batu9999
情感分析文本情绪标注数据集SentimentAnalysisTextEmotionLabeling-batu9999 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情绪识别, 自然语言处理, 情感标注, 深度学习, 语料库, 情绪标签 数据概述: 该数据集包含从各种来源收集的文本数据,记录了不同文本片段所表达的情绪。主要特征如下:... -
新闻文本分类数据集NewsTextClassification-sainijagjit
新闻文本分类数据集NewsTextClassification-sainijagjit 数据来源:互联网公开数据 标签:文本分类, 新闻, 机器学习, 自然语言处理, 语料库, 文本挖掘, BBC, 多分类 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文本数据,记录了不同类别的新闻文章内容。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-mejbahahammad
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-mejbahahammad 数据来源:互联网公开数据 标签:情感分析, 电影评论, 文本分类, 自然语言处理, 情感极性, 数据标注, 机器学习, 语料库 数据概述:... -
英文文本释义生成平行语料数据集EnglishTextParaphraseCorpus-trid4012
英文文本释义生成平行语料数据集EnglishTextParaphraseCorpus-trid4012 数据来源:互联网公开数据 标签:文本释义, 自然语言处理, 语料库, 文本生成, 语义理解, 机器翻译, 数据集, 深度学习 数据概述: 该数据集包含英文文本及其释义的平行语料,旨在支持文本释义生成、语义理解和机器翻译等任务。主要特征如下:... -
多语言恶意评论翻译数据集MultilingualToxicCommentTranslationDataset-sandiago21
多语言恶意评论翻译数据集MultilingualToxicCommentTranslationDataset-sandiago21 数据来源:互联网公开数据 标签:多语言, 文本翻译, 恶意评论, 自然语言处理, 机器翻译, 文本分析, 语料库, Jigsaw 数据概述:... -
命名实体识别数据集NamedEntityRecognitionDataset-knitemblazor
命名实体识别数据集NamedEntityRecognitionDataset-knitemblazor 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 深度学习, 语料库, 实体识别, 机器学习 数据概述: 该数据集包含来自公开语料库的文本数据,记录了经过人工标注的命名实体信息。主要特征如下:... -
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassification-joachimrives
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassification-joachimrives 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 灾难事件, 社交媒体, 机器学习, 情感分析, 语料库, 灾难预警 数据概述:... -
电影评论情感分析数据集MovieReviewsSentimentAnalysis-hamiddd
电影评论情感分析数据集MovieReviewsSentimentAnalysis-hamiddd 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 机器学习, 情感极性, 数据标注, 语料库 数据概述: 该数据集包含来自电影评论网站的评论文本,记录了对电影的评价内容及其对应的情感极性标签。主要特征如下:... -
阿拉伯语问答数据集ArabicQuestionAnsweringDataset-elemam
阿拉伯语问答数据集ArabicQuestionAnsweringDataset-elemam 数据来源:互联网公开数据 标签:自然语言处理, 阿拉伯语, 问答系统, 文本理解, 机器阅读, 语料库, 数据集, 文本摘要 数据概述: 该数据集包含来自阿拉伯语文本的问答对,旨在用于训练和评估阿拉伯语问答系统。主要特征如下:... -
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-henry41148
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-henry41148 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 机器学习, 实体识别, 语料库, 深度学习, 序列标注 数据概述:... -
德语新闻标题文本数据集GermanNewsHeadlinesTextData-aginator
德语新闻标题文本数据集GermanNewsHeadlinesTextData-aginator 数据来源:互联网公开数据 标签:新闻标题, 文本分析, 自然语言处理, 德语, 文本清洗, 时间序列, 语料库, 摘要生成 数据概述: 该数据集包含来自德国新闻媒体的德语新闻标题文本,记录了新闻标题及其对应的时间戳和经过清洗的文本。主要特征如下:... -
医学文献命名实体识别训练数据集MedicalLiteratureNamedEntityRecognitionTrainingDataset-jiashangliuliu
医学文献命名实体识别训练数据集MedicalLiteratureNamedEntityRecognitionTrainingDataset-jiashangliuliu 数据来源:互联网公开数据 标签:命名实体识别, 医学文本, 生物医学, 文本标注, 序列标注, 机器学习, 疾病识别, 语料库 数据概述:...