-
英语-豪萨语翻译语料库数据集English-HausaTranslationCorpusDataset-gigikenneth
英语-豪萨语翻译语料库数据集English-HausaTranslationCorpusDataset-gigikenneth 数据来源:互联网公开数据 标签:语言翻译,语料库,自然语言处理,多语言,机器翻译,文本分析,语言资源,人工智能 数据概述: 该数据集包含来自英语到豪萨语的平行语料,记录了双语文本对,适用于机器翻译和语言学研究。主要特征如下:... -
日常对话情绪刺激语料库DailyDialogEmotionStimulusISEAR数据集-fadjar
日常对话情绪刺激语料库DailyDialogEmotionStimulusISEAR数据集-fadjar 数据来源:互联网公开数据 标签:日常对话,情绪分析,语料库,数据集,自然语言处理,机器学习,情感识别,心理学 数据概述:... -
-
英语学习文本数据集en-train-csv-elguapo
英语学习文本数据集en-train-csv-elguapo 数据来源:互联网公开数据 标签:英语学习,文本数据,自然语言处理,语言模型,数据集,语料库,机器学习,文本分析 数据概述: 该数据集包含了用于英语学习的文本数据,记录了大量的英语句子,段落及文章。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时期的英语文本。 地理范围:... -
命名实体识别标注语料库数据集-endofnight17j03
命名实体识别标注语料库数据集-endofnight17j03 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,语料库,信息抽取,标注数据 数据概述:该数据集包含用于命名实体识别(NER)任务的标注语料,记录了文本中各种命名实体的详细信息。主要特征如下:... -
创意写作文本清洗数据集-mohamednafea01
创意写作文本清洗数据集-mohamednafea01 数据来源:互联网公开数据 标签:文本数据,创意写作,数据清洗,自然语言处理,文本分析,语料库,机器学习,NLP 数据概述: 该数据集包含经过清洗的创意写作文本,旨在为自然语言处理和文本分析任务提供高质量的语料库。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和类型的创意写作文本。... -
保罗-科埃略炼金术士小说文本数据集-stealthtechnologies
保罗-科埃略炼金术士小说文本数据集-stealthtechnologies 数据来源:互联网公开数据 标签:小说,文学,文本分析,数据集,阅读理解,情感分析,自然语言处理,语料库 数据概述: 该数据集包含保罗·科埃略创作的小说《炼金术士》的文本数据,记录了小说的完整内容。主要特征如下: 时间跨度:数据记录的时间范围为小说创作出版至今。... -
情感与主题分析数据集SentimentandTopicAnalysisDataset-yojn710
情感与主题分析数据集SentimentandTopicAnalysisDataset-yojn710 数据来源:互联网公开数据 标签:情感分析,主题建模,数据集,文本挖掘,机器学习,自然语言处理,数据科学,语料库 数据概述: 该数据集包含约30,000条文本记录,涵盖了不同来源的文本内容,旨在用于情感和主题分析。主要特征如下:... -
希伯来文化平台科技文化视角多语言平行文本数据集
希伯来文化平台科技文化视角多语言平行文本数据集 数据来源:互联网公开数据 标签:平行文本,多语言,希伯来语,文化,科技,HTML,文本挖掘,机器翻译,语料库 数据概述: 本数据集收录了来自以色列领先的希伯来文化平台Hitdarderut... -
柯勒律治诗歌伪标签数据集ColeridgePseudo-LabelsDataset-chienhsianghung
柯勒律治诗歌伪标签数据集ColeridgePseudo-LabelsDataset-chienhsianghung 数据来源:互联网公开数据 标签:诗歌,文本分析,自然语言处理,伪标签,机器学习,情感分析,诗歌风格,语料库 数据概述: 该数据集包含由柯勒律治诗歌生成的伪标签数据,旨在用于训练文本分析和自然语言处理模型。主要特征如下:... -
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03
命名实体识别语料库NamedEntityRecognitionCorpus-endofnight17j03 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,文本分析,机器学习,信息提取,人工智能,语料库 数据概述:... -
ArgRewritev2语料库数据集-nghtctrl
ArgRewritev2语料库数据集-nghtctrl 数据来源:互联网公开数据 标签:自然语言处理,语料库,文本生成,机器翻译,文本重写,数据集,语言模型,文本分析 数据概述: 该数据集包含 ArgRewrite v2 语料库的数据,记录了文本重写任务的多种变体。主要特征如下: 时间跨度:数据记录的时间范围为数据集构建和发布时间。... -
元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata
元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,信息检索,数据挖掘,语料库,语言模型 数据概述: 该数据集包含来自多个来源的语料库数据,记录了不同领域的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
质量控制语料库数据集QCCorpusDataset-ashokurlana
质量控制语料库数据集QCCorpusDataset-ashokurlana 数据来源:互联网公开数据 标签:质量控制,语料库,数据集,自然语言处理,文本分析,机器学习,语言技术,数据标注 数据概述:该数据集包含来自质量控制领域的语料数据,记录了与质量控制相关的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu
路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu 数据来源:互联网公开数据 标签:文本分类,新闻,自然语言处理,机器学习,数据集,信息检索,语料库,文本分析 数据概述: 该数据集包含来自路透社的新闻报道,主要用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围主要集中在1987年。... -
柯勒律治诗歌语料库数据集ColeridgeCorpusDataset-tungmphung
柯勒律治诗歌语料库数据集ColeridgeCorpusDataset-tungmphung 数据来源:互联网公开数据 标签:诗歌,语料库,自然语言处理,文本分析,文学研究,情感分析,文本挖掘,数据集 数据概述: 该数据集包含英国浪漫主义诗人塞缪尔·泰勒·柯勒律治(Samuel Taylor Coleridge)的诗歌作品。主要特征如下:... -
拉丁语语料库数据集CorpusLatinDataset-nerdofdot
拉丁语语料库数据集CorpusLatinDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,语料库,语言研究,古文献,自然语言处理,历史语言学,文本分析,古籍数字化 数据概述: 该数据集包含来自拉丁语文献的语料,记录了拉丁语在不同历史时期的文本内容。主要特征如下:... -
大规模多语种文本训练数据集ALL-MASCTrainDatasets-saeed1507100
大规模多语种文本训练数据集ALL-MASCTrainDatasets-saeed1507100 数据来源:互联网公开数据 标签:文本数据,多语种,自然语言处理,机器学习,语料库,文本分析,语言学,训练数据 数据概述: 该数据集包含大规模多语种文本训练数据,主要用于自然语言处理(NLP)模型的训练和评估。主要特征如下:... -
大规模LLM提示语料库数据集LargeLanguageModelPromptCorpusDataset-mrt0933
大规模LLM提示语料库数据集LargeLanguageModelPromptCorpusDataset-mrt0933 数据来源:互联网公开数据 标签:自然语言处理,LLM,提示词,数据集,文本生成,人工智能,机器学习,语料库,Prompt 数据概述:... -
可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit
可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit 数据来源:互联网公开数据 标签:文本分析,可读性评估,数据集,自然语言处理,教育研究,机器学习,语料库,语言技术 数据概述: 该数据集包含用于可读性评估的文本数据,记录了多种不同难度级别的文本样本。主要特征如下: 时间跨度:...