-
古登堡项目科学技术领域文本数据集ProjectGutenbergScienceandTechnologyTextDataset-ramachandrabharadwaj
古登堡项目科学技术领域文本数据集ProjectGutenbergScienceandTechnologyTextDataset-ramachandrabharadwaj 数据来源:互联网公开数据 标签:古登堡项目, 文本数据, 科学技术, 语料库, 自然语言处理, 文本分析, 电子书, 数据集 数据概述: 该数据集包含来自古登堡项目(Project... -
哲学文本语义分析数据集PhilosophyTextSemanticAnalysis-abodezoabi1
哲学文本语义分析数据集PhilosophyTextSemanticAnalysis-abodezoabi1 数据来源:互联网公开数据 标签:哲学, 文本分析, 语义理解, 自然语言处理, 文本分类, 知识图谱, 学术研究, 语料库 数据概述: 该数据集包含来自哲学领域的数据,记录了不同哲学家的文本片段,主要用于语义分析和文本挖掘研究。主要特征如下:... -
多语种词语词性标注数据集MultilingualWordPart-of-SpeechTaggingDataset-khlifimohamed
多语种词语词性标注数据集MultilingualWordPart-of-SpeechTaggingDataset-khlifimohamed 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 多语言, 文本分析, 语言学, 语料库, 机器学习, 词语 数据概述:... -
坦桑尼亚新闻文本分类数据集TanzaniaNewsTextClassificationDataset-rantosarobidy
坦桑尼亚新闻文本分类数据集TanzaniaNewsTextClassificationDataset-rantosarobidy 数据来源:互联网公开数据 标签:文本分类, 新闻, 坦桑尼亚, 自然语言处理, 情感分析, 语料库, 机器学习, 政治 数据概述: 该数据集包含来自坦桑尼亚新闻网站的数据,记录了新闻文章的内容及其所属的类别。主要特征如下:... -
印地语文本语句数据集HindiTextStatements-krishna000
印地语文本语句数据集HindiTextStatements-krishna000 数据来源:互联网公开数据 标签:印地语, 文本数据, 语言分析, 自然语言处理, 文本挖掘, 语料库, 情感分析, 机器翻译 数据概述: 该数据集包含来自不同来源的印地语文本语句。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料。... -
音乐家传记文本信息数据集MusicianBiographyTextInformation-janldeboer
音乐家传记文本信息数据集MusicianBiographyTextInformation-janldeboer 数据来源:互联网公开数据 标签:音乐家, 传记, 文本分析, 自然语言处理, 文本分类, 音乐史, 语料库, 艺术家 数据概述: 该数据集包含来自互联网的音乐家传记文本信息,记录了多位音乐家的生平、作品、以及相关链接等内容。主要特征如下:... -
自然语言处理命名实体识别数据集NaturalLanguageProcessingNamedEntityRecognitionDataset-aigeeky
自然语言处理命名实体识别数据集NaturalLanguageProcessingNamedEntityRecognitionDataset-aigeeky 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 数据集, 机器学习, 语料库, 信息抽取, 文本分析 数据概述:... -
阿拉伯语问答知识库数据集ArabicQuestionAnsweringKnowledgeBaseDataset-hudamaher
阿拉伯语问答知识库数据集ArabicQuestionAnsweringKnowledgeBaseDataset-hudamaher 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 阿拉伯语, 文本分类, 情感分析, 知识抽取, 机器阅读理解, 语料库 数据概述:... -
词汇索引构建词表数据集VocabularyIndexingNIPSDataset-von07raphael
词汇索引构建词表数据集VocabularyIndexingNIPSDataset-von07raphael 数据来源:互联网公开数据 标签:词汇索引, 文本处理, 词嵌入, 自然语言处理, 词表构建, 机器学习, 语料库, 数据预处理 数据概述:... -
文本分类意图识别数据集TextClassificationIntentRecognitionDataset-imgremlin
文本分类意图识别数据集TextClassificationIntentRecognitionDataset-imgremlin 数据来源:互联网公开数据 标签:文本分类, 意图识别, 自然语言处理, 语义分析, 数据标注, 机器学习, 语料库, 问答系统 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-ahmetelgn
电影评论情感分析数据集MovieReviewSentimentAnalysis-ahmetelgn 数据来源:互联网公开数据 标签:情感分析, 电影评论, 文本分类, 自然语言处理, 机器学习, 情感极性, 数据标注, 语料库 数据概述: 该数据集包含来自互联网电影数据库(IMDB)的电影评论文本,记录了评论内容及其对应的情感极性标签。主要特征如下:... -
人机对话交互文本数据集Human-MachineDialogueInteractionTextData-swiftchris
人机对话交互文本数据集Human-MachineDialogueInteractionTextData-swiftchris 数据来源:互联网公开数据 标签:人机对话, 聊天记录, 自然语言处理, 文本生成, 对话系统, 情感分析, 机器学习, 语料库 数据概述:... -
论文摘要生成模型训练数据集PaperAbstractGenerationModelTrainingData-pavankandru
论文摘要生成模型训练数据集PaperAbstractGenerationModelTrainingData-pavankandru 数据来源:互联网公开数据 标签:论文摘要, 自然语言处理, 文本摘要, 机器学习, 语义分析, 语料库, 文本生成, 数据集 数据概述:... -
通用问答意图识别训练数据集GeneralQuestionAnsweringIntentRecognitionTrainingDataset-leixinyang
通用问答意图识别训练数据集GeneralQuestionAnsweringIntentRecognitionTrainingDataset-leixinyang 数据来源:互联网公开数据 标签:问答系统, 意图识别, 自然语言处理, 文本分类, 机器学习, 数据标注, 语料库, 知识检索 数据概述:... -
社交媒体草坪话题文本数据集SocialMediaLawnTopicTextDataset-gracejin27
社交媒体草坪话题文本数据集SocialMediaLawnTopicTextDataset-gracejin27 数据来源:互联网公开数据 标签:草坪, 社交媒体, 文本数据, 话题分析, 内容提取, 链接, 数据挖掘, 语料库 数据概述: 该数据集包含来自社交媒体平台的数据,记录了与“草坪”相关的话题讨论文本及相关链接。主要特征如下:... -
新闻事件文本分类数据集NewsEventTextClassificationDataset-xuyatian
新闻事件文本分类数据集NewsEventTextClassificationDataset-xuyatian 数据来源:互联网公开数据 标签:文本分类,新闻,事件,自然语言处理,机器学习,情感分析,数据标注,语料库 数据概述: 该数据集包含来自新闻媒体的文本数据,记录了各种新闻事件的描述。主要特征如下:... -
孟加拉语地区文本情感分析数据集BengaliRegionTextSentimentAnalysis-abdullaharean
孟加拉语地区文本情感分析数据集BengaliRegionTextSentimentAnalysis-abdullaharean 数据来源:互联网公开数据 标签:情感分析, 孟加拉语, 文本分类, 地区文本, 自然语言处理, 情感极性, 机器学习, 语料库 数据概述:... -
社交媒体情绪分析语料数据集SocialMediaSentimentAnalysisCorpus-hanadialmograbi
社交媒体情绪分析语料数据集SocialMediaSentimentAnalysisCorpus-hanadialmograbi 数据来源:互联网公开数据 标签:情绪分析, 文本分类, 自然语言处理, 情感识别, 社交媒体, 语料库, 机器学习, 情感极性 数据概述:... -
孟加拉语文本数据集BanglaTextDataset-sameen53
孟加拉语文本数据集BanglaTextDataset-sameen53 数据来源:互联网公开数据 标签:孟加拉语, 文本数据, 自然语言处理, 语料库, 文本分析, 语言模型, 情感分析, 机器翻译 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种主题的孟加拉语文本片段。主要特征如下: 时间跨度:数据未标明具体时间,可视为静态文本语料。... -
Discord聊天记录情感分析数据集DiscordChatLogsSentimentAnalysis-mrgentle
Discord聊天记录情感分析数据集DiscordChatLogsSentimentAnalysis-mrgentle 数据来源:互联网公开数据 标签:社交媒体, 聊天记录, 情感分析, 自然语言处理, 文本数据, 情感识别, 数据挖掘, 语料库 数据概述: 该数据集包含来自 Discord...