-
波斯语口语与正式语料文本风格分类数据集PersianColloquialandFormalTextStyleClassificationDataset-p...
波斯语口语与正式语料文本风格分类数据集PersianColloquialandFormalTextStyleClassificationDataset-parsahaghighi 数据来源:互联网公开数据 标签:文本分类, 口语识别, 语料库, 波斯语, 语言风格, 自然语言处理, 机器学习, 文本分析 数据概述:... -
希腊语新约圣经文本数据集NewTestamentGreekTextDataset-nikosraftogiannis
希腊语新约圣经文本数据集NewTestamentGreekTextDataset-nikosraftogiannis 数据来源:互联网公开数据 标签:圣经, 希腊语, 文本分析, 语言学, 语料库, 宗教, 文本挖掘, 古希腊语 数据概述: 该数据集包含来自希腊语新约圣经的文本数据,记录了新约圣经各书卷的希腊语原文。主要特征如下:... -
法国经济文本数据分析数据集FrenchEconomyTextDataAnalysis-nekuitiefangbiediant
法国经济文本数据分析数据集FrenchEconomyTextDataAnalysis-nekuitiefangbiediant 数据来源:互联网公开数据 标签:经济, 法国, 文本分析, 新闻, 数据挖掘, 自然语言处理, 文本分类, 语料库 数据概述:... -
仇恨言论与反驳语句数据集HateSpeechandCounterSpeechDataset-shoaibkarnure
仇恨言论与反驳语句数据集HateSpeechandCounterSpeechDataset-shoaibkarnure 数据来源:互联网公开数据 标签:仇恨言论, 反驳语句, 文本分析, 情感分析, 自然语言处理, 社交媒体, 语料库, 文本分类 数据概述:... -
文学作品句子语料数据集LiterarySentenceCorpus-harshm27
文学作品句子语料数据集LiterarySentenceCorpus-harshm27 数据来源:互联网公开数据 标签:文学, 句子, 语料库, 文本分析, 自然语言处理, 文本挖掘, 情感分析, 语言学 数据概述: 该数据集包含来自古腾堡计划(Project Gutenberg)电子书的句子数据,记录了文学作品中的句子片段。主要特征如下:... -
文学创作文本生成数据集LiteratureCreationTextGeneration-nashaatrjouda
文学创作文本生成数据集LiteratureCreationTextGeneration-nashaatrjouda 数据来源:互联网公开数据 标签:文本生成, 语言模型, 创作, 故事生成, 自然语言处理, 语料库, 文本分析, 叙事结构 数据概述: 该数据集包含用于文本生成任务的语料,记录了文学作品中的叙事文本片段。主要特征如下:... -
越南语文本数据分析数据集VietnameseTextDataAnalysis-nguynththanhho
越南语文本数据分析数据集VietnameseTextDataAnalysis-nguynththanhho 数据来源:互联网公开数据 标签:越南语, 文本数据, 自然语言处理, 语料库, 文本分析, 数据清洗, 语言模型, 机器学习 数据概述:... -
泰米尔经典提鲁可拉尔诗歌数据集ThirukkuralVerseDataset-atreyakatnam
泰米尔经典提鲁可拉尔诗歌数据集ThirukkuralVerseDataset-atreyakatnam 数据来源:互联网公开数据 标签:泰米尔语, 诗歌, 古典文学, 文化研究, 文本分析, 语料库, 哲学, 道德 数据概述: 该数据集包含来自泰米尔古典文学作品《提鲁可拉尔》(Thirukkural)的诗歌,记录了这部作品中的诗句。主要特征如下:... -
越南新闻问答数据集VietnamNewsQuestionAnsweringDataset-hunglvt
越南新闻问答数据集VietnamNewsQuestionAnsweringDataset-hunglvt 数据来源:互联网公开数据 标签:新闻, 问答, 自然语言处理, 文本摘要, 信息抽取, 越南语, 语料库, 数据集 数据概述: 该数据集包含来自越南新闻网站的数据,记录了新闻文章及其对应的问答对,旨在促进越南语自然语言处理领域的研究。主要特征如下:... -
英语写作技巧评估作文数据集EnglishWritingSkillEvaluationEssayDataset-stephenmurph
英语写作技巧评估作文数据集EnglishWritingSkillEvaluationEssayDataset-stephenmurph 数据来源:互联网公开数据 标签:英语写作, 文本分析, 写作评估, 语料库, 文本特征, 自然语言处理, 机器学习, 写作训练 数据概述:... -
新闻文本分类BBC数据集NewsTextClassificationBBCDataset-mosesmoncy
新闻文本分类BBC数据集NewsTextClassificationBBCDataset-mosesmoncy 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 机器学习, 自然语言处理, 语料库, BBC新闻, 多分类, 文本分析 数据概述:... -
孟加拉语词形还原数据集BengaliLemmaDataset-jakir57
孟加拉语词形还原数据集BengaliLemmaDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 自然语言处理, 孟加拉语, 语言学, 文本分析, 词干提取, 词汇分析, 语料库 数据概述: 该数据集包含孟加拉语词汇的词形还原数据,记录了孟加拉语单词的词形与其对应的词元(lemma)之间的映射关系。主要特征如下:... -
中文情感分析训练数据集ChineseSentimentAnalysisTrainingDataset-johnnyzhuoweichen
中文情感分析训练数据集ChineseSentimentAnalysisTrainingDataset-johnnyzhuoweichen 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情感标注, 负面情感, 情绪识别, 自然语言处理, 机器学习, 语料库 数据概述:... -
恐怖小说文本作者识别数据集HorrorNovelTextAuthorIdentification-anuj8june
恐怖小说文本作者识别数据集HorrorNovelTextAuthorIdentification-anuj8june 数据来源:互联网公开数据 标签:文本分类, 作者识别, 恐怖小说, 自然语言处理, 机器学习, 风格分析, 文本特征, 语料库 数据概述: 该数据集包含来自恐怖小说的数据,记录了不同作者创作的文本片段,旨在用于识别作者。主要特征如下:... -
俄语翻译平行语料数据集Russian-EnglishParallelCorpus-etosyoma
俄语翻译平行语料数据集Russian-EnglishParallelCorpus-etosyoma 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 语料库, 文本对齐, 自然语言处理, 语言学, 数据集 数据概述: 该数据集包含俄语与英语的平行文本,记录了俄语原文及其对应的英语译文。主要特征如下:... -
瑞克与莫蒂剧本对话数据集RickandMortyScriptDialogueDataset-karmaa21
瑞克与莫蒂剧本对话数据集RickandMortyScriptDialogueDataset-karmaa21 数据来源:互联网公开数据 标签:剧本分析, 动画剧集, 文本数据, 对话内容, 角色互动, 自然语言处理, 情感分析, 语料库 数据概述: 该数据集包含来自瑞克与莫蒂动画剧集的剧本对话内容,记录了剧集中角色之间的对话文本。主要特征如下:... -
日语-英语机器翻译平行语料数据集Japanese-EnglishMachineTranslationParallelCorpus-arvindvasa
日语-英语机器翻译平行语料数据集Japanese-EnglishMachineTranslationParallelCorpus-arvindvasa 数据来源:互联网公开数据 标签:机器翻译, 语料库, 日语, 英语, 文本数据, 自然语言处理, 语言学习, 翻译模型 数据概述:... -
英语词频统计分析数据集EnglishWordFrequencyAnalysis-ivancanepa
英语词频统计分析数据集EnglishWordFrequencyAnalysis-ivancanepa 数据来源:互联网公开数据 标签:词频统计, 英语, 文本分析, 自然语言处理, 词性标注, 语料库, 语言学, 数据挖掘 数据概述: 该数据集包含来自公开语料库的英语单词及其出现频率信息,旨在为语言学研究和自然语言处理任务提供基础数据。主要特征如下:... -
泰卢固语词性标注数据集TeluguPart-of-SpeechTaggingDataset-mahathibodela
泰卢固语词性标注数据集TeluguPart-of-SpeechTaggingDataset-mahathibodela 数据来源:互联网公开数据 标签:词性标注, 泰卢固语, 自然语言处理, 语言学, 文本分析, 语料库, 机器学习, 标注数据 数据概述: 该数据集包含泰卢固语文本的词性标注数据,记录了泰卢固语单词及其对应的词性标签。主要特征如下:... -
英语-泰卢固语翻译数据集English-TeluguTranslationDataset-peaking1
英语-泰卢固语翻译数据集English-TeluguTranslationDataset-peaking1 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 文本翻译, 泰卢固语, 英语, 翻译模型, 自然语言处理, 语料库 数据概述: 该数据集包含英语到泰卢固语的翻译文本对,记录了英语短语或句子及其对应的泰卢固语翻译。主要特征如下:...