-
新闻标题文本分类数据集NewsHeadlineTextClassification-dhananjayr2289
新闻标题文本分类数据集NewsHeadlineTextClassification-dhananjayr2289 数据来源:互联网公开数据 标签:文本分类, 新闻标题, 自然语言处理, 情感分析, 类别识别, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自新闻媒体的标题文本数据,记录了新闻标题及其对应的类别信息。主要特征如下:...
-
文本分类语料数据集TextClassificationCorpus-jinsama
文本分类语料数据集TextClassificationCorpus-jinsama 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 语料库, 机器学习, 词向量, 文本特征, 深度学习, 数据集 数据概述: 该数据集包含用于文本分类任务的语料,记录了经过预处理的文本样本。主要特征如下: 时间跨度:数据未明确标注时间信息,可视为静态语料库。...
-
新闻主题分类数据集NewsTopicClassificationDataset-reehan31
新闻主题分类数据集NewsTopicClassificationDataset-reehan31 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 机器学习, 自然语言处理, 娱乐新闻, 数据集, BBC新闻, 语料库 数据概述: 该数据集包含来自英国广播公司(BBC)新闻的数据,记录了新闻文章的内容及其对应的类别标签。主要特征如下:...
-
电影评论情感分析数据集MovieReviewSentimentAnalysis-akebono
电影评论情感分析数据集MovieReviewSentimentAnalysis-akebono 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情绪识别, 机器学习, 语料库, 情感极性 数据概述: 该数据集包含来自互联网的电影评论数据,记录了电影评论文本及其对应的情感极性标签。主要特征如下:...
-
安然公司邮件语料库EnronEmailCorpus数据集-minalray
安然公司邮件语料库EnronEmailCorpus数据集-minalray 数据来源:互联网公开数据 标签:邮件, 文本, 语料库, 自然语言处理, 金融, 能源, 文本挖掘, 商业 数据概述: 该数据集包含来自安然公司(Enron Corporation)内部员工的电子邮件数据,记录了公司运营期间的通信内容。主要特征如下:...
-
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言模型, 印度语言, 语料库, 自然语言处理, 双语数据, 英语 数据概述: 该数据集包含来自互联网的印地语-...
-
英国广播公司新闻文本分类数据集BBCNewsTextClassificationDataset-bedantikalahiri
英国广播公司新闻文本分类数据集BBCNewsTextClassificationDataset-bedantikalahiri 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 自然语言处理, 语料库, 文本挖掘, 机器学习, 情感分析, 媒体报道 数据概述:...
-
电影评论情感分析数据集MovieReviewSentimentAnalysis-zahidhasan00
电影评论情感分析数据集MovieReviewSentimentAnalysis-zahidhasan00 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了评论内容及其对应的情感极性标签。主要特征如下:...
-
电影评论情感分析数据集MovieReviewSentimentAnalysis-konstantinilkov
电影评论情感分析数据集MovieReviewSentimentAnalysis-konstantinilkov 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 电影评论, 情感倾向性, 机器学习, 数据标注, 语料库 数据概述:...
-
多语言文本分类训练数据集MultilingualTextClassificationTrainingDataset-jvkchaitanya410
多语言文本分类训练数据集MultilingualTextClassificationTrainingDataset-jvkchaitanya410 数据来源:互联网公开数据 标签:文本分类, 多语言, 机器翻译, 语言识别, 自然语言处理, 语料库, 文本挖掘, 数据标注 数据概述:...
-
提示词指令微调数据集PromptInstructionFine-tuningDataset-eightina
提示词指令微调数据集PromptInstructionFine-tuningDataset-eightina 数据来源:互联网公开数据 标签:提示词, 指令微调, 自然语言处理, 大语言模型, 文本生成, 机器学习, 对话生成, 语料库 数据概述: 该数据集包含来自开源社区的提示词与对应指令示例,旨在用于大语言模型的指令微调。主要特征如下:...
-
新闻文本复杂度分析与摘要生成数据集NewsTextComplexitySummarizationDataset-abdessamadmekkaoui
新闻文本复杂度分析与摘要生成数据集NewsTextComplexitySummarizationDataset-abdessamadmekkaoui 数据来源:互联网公开数据 标签:文本分析, 文本摘要, 可读性评估, 自然语言处理, 机器学习, 新闻文本, 复杂度分析, 语料库 数据概述:...
-
新闻文本分类数据集NewsTextClassification-sainijagjit
新闻文本分类数据集NewsTextClassification-sainijagjit 数据来源:互联网公开数据 标签:文本分类, 新闻, 机器学习, 自然语言处理, 语料库, 文本挖掘, BBC, 多分类 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文本数据,记录了不同类别的新闻文章内容。主要特征如下:...
-
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-mejbahahammad
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-mejbahahammad 数据来源:互联网公开数据 标签:情感分析, 电影评论, 文本分类, 自然语言处理, 情感极性, 数据标注, 机器学习, 语料库 数据概述:...
-
英文文本释义生成平行语料数据集EnglishTextParaphraseCorpus-trid4012
英文文本释义生成平行语料数据集EnglishTextParaphraseCorpus-trid4012 数据来源:互联网公开数据 标签:文本释义, 自然语言处理, 语料库, 文本生成, 语义理解, 机器翻译, 数据集, 深度学习 数据概述: 该数据集包含英文文本及其释义的平行语料,旨在支持文本释义生成、语义理解和机器翻译等任务。主要特征如下:...
-
多语言恶意评论翻译数据集MultilingualToxicCommentTranslationDataset-sandiago21
多语言恶意评论翻译数据集MultilingualToxicCommentTranslationDataset-sandiago21 数据来源:互联网公开数据 标签:多语言, 文本翻译, 恶意评论, 自然语言处理, 机器翻译, 文本分析, 语料库, Jigsaw 数据概述:...
-
命名实体识别数据集NamedEntityRecognitionDataset-knitemblazor
命名实体识别数据集NamedEntityRecognitionDataset-knitemblazor 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 深度学习, 语料库, 实体识别, 机器学习 数据概述: 该数据集包含来自公开语料库的文本数据,记录了经过人工标注的命名实体信息。主要特征如下:...
-
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassification-joachimrives
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassification-joachimrives 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 灾难事件, 社交媒体, 机器学习, 情感分析, 语料库, 灾难预警 数据概述:...
-
电影评论情感分析数据集MovieReviewsSentimentAnalysis-hamiddd
电影评论情感分析数据集MovieReviewsSentimentAnalysis-hamiddd 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 机器学习, 情感极性, 数据标注, 语料库 数据概述: 该数据集包含来自电影评论网站的评论文本,记录了对电影的评价内容及其对应的情感极性标签。主要特征如下:...
-
阿拉伯语问答数据集ArabicQuestionAnsweringDataset-elemam
阿拉伯语问答数据集ArabicQuestionAnsweringDataset-elemam 数据来源:互联网公开数据 标签:自然语言处理, 阿拉伯语, 问答系统, 文本理解, 机器阅读, 语料库, 数据集, 文本摘要 数据概述: 该数据集包含来自阿拉伯语文本的问答对,旨在用于训练和评估阿拉伯语问答系统。主要特征如下:...



