-
印地语-英语平行语料库数据集-harshityadavjnu
印地语-英语平行语料库数据集-harshityadavjnu 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,印地语,英语,语料库,语言学,文本分析,跨语言 数据概述:该数据集包含印地语和英语的平行文本数据,旨在用于机器翻译、跨语言信息检索等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于语料库的收集时间。... -
大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202
大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,数据拆分,文本分析,人工智能,模型训练 数据概述: 该数据集为大型语言模型版本三(LLM V3)的数据集,按照数据来源进行拆分,记录了不同来源的文本数据。主要特征如下:... -
灾害推文文本嵌入数据集DisasterTweetsTextEmbeddingsDataset-askaraitzhan
灾害推文文本嵌入数据集DisasterTweetsTextEmbeddingsDataset-askaraitzhan 数据来源:互联网公开数据 标签:灾害管理,社交媒体,文本分析,自然语言处理,机器学习,情感分析,危机响应,社会研究 数据概述:... -
学生学术写作评价数据集DF-LLM-StudentDataset-alvaromendizabal
学生学术写作评价数据集DF-LLM-StudentDataset-alvaromendizabal 数据来源:互联网公开数据 标签:学术写作,数据集,自然语言处理,LLM,文本分析,教育,写作评估,机器学习 数据概述: 该数据集包含来自不同学生的学术写作样本,旨在用于评估和改进学生学术写作能力。主要特征如下:... -
英语文档学习与研究数据集LECREnglishDocumentsDataset-gabrielbchacon
英语文档学习与研究数据集LECREnglishDocumentsDataset-gabrielbchacon 数据来源:互联网公开数据 标签:英语文档,数据集,语言学,自然语言处理,机器学习,文本分析,教育,学术研究 数据概述:... -
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器翻译,深度学习,文本分析,语言模型,信息检索 数据概述: 该数据集包含来自DRCAT(Dynamic Relation-based Content Adaptation... -
标题twitch平台玩口袋妖怪红聊天记录数据集TwitchPlayPokémonRedChatsDataset-kedarmore
标题twitch平台玩口袋妖怪红聊天记录数据集TwitchPlayPokémonRedChatsDataset-kedarmore 数据来源:互联网公开数据 标签:游戏,社交媒体,数据集,聊天记录,玩家互动,机器学习,文本分析,行为研究 数据概述:... -
新闻事件标题文本数据集NewsEventHeadlineTextData-keitazoumana
新闻事件标题文本数据集NewsEventHeadlineTextData-keitazoumana 数据来源:互联网公开数据 标签:新闻文本, 文本分析, 自然语言处理, 事件检测, 情感分析, 标题生成, 数据挖掘, 机器学习 数据概述: 该数据集包含来自新闻媒体的标题文本数据,记录了新闻报道的标题信息。主要特征如下:... -
阿拉伯诗人诗歌作品数据集-adhamdiaa
阿拉伯诗人诗歌作品数据集-adhamdiaa 数据来源:互联网公开数据 标签:诗歌,阿拉伯文化,文学,数据集,自然语言处理,文本分析,情感分析,文化研究 数据概述: 该数据集包含了来自多个阿拉伯诗人的诗歌作品,旨在为研究阿拉伯文学和文化提供数据支持。主要特征如下: 时间跨度: 数据涵盖了从古典时期到现代的阿拉伯诗歌。 地理范围:... -
社交网络节点嵌入测试数据集SocialNetworkNodeEmbeddingTestData-yangz0ey
社交网络节点嵌入测试数据集SocialNetworkNodeEmbeddingTestData-yangz0ey 数据来源:互联网公开数据 标签:社交网络, 节点嵌入, 图神经网络, 机器学习, 文本分析, 数据挖掘, 相似度计算, 社区发现 数据概述: 该数据集包含来自社交网络的数据,记录了用于测试节点嵌入算法的结构化数据。主要特征如下:... -
生活技巧指导文本数据分析数据集LifeSkillGuidanceTextDataAnalysis-harshaduddu
生活技巧指导文本数据分析数据集LifeSkillGuidanceTextDataAnalysis-harshaduddu 数据来源:互联网公开数据 标签:生活技巧, 指导文本, 文本分析, 自然语言处理, 标题生成, 文本摘要, 内容生成, 数据挖掘 数据概述:... -
写作评估与生成文本分析数据集WritingEvaluation-GeneratedTextAnalysisDataset-conjuring92
写作评估与生成文本分析数据集WritingEvaluation-GeneratedTextAnalysisDataset-conjuring92 数据来源:互联网公开数据 标签:文本生成, 写作评估, 自然语言处理, 机器学习, 文本分析, 创作质量, 论文写作, 语料库 数据概述:... -
人工智能生成文本对比人类文本清洗数据集-dillonwongso
人工智能生成文本对比人类文本清洗数据集-dillonwongso 数据来源:互联网公开数据 标签:人工智能,文本生成,文本清洗,数据集,自然语言处理,机器学习,文本分析,对比研究 数据概述: 该数据集包含来自不同来源的人工智能生成文本和人类编写的文本,并经过清洗处理,旨在用于比较分析。主要特征如下:... -
知识图谱实体文本数据集KnowledgeGraphEntityTextDataset-chiritacatalinaelena
知识图谱实体文本数据集KnowledgeGraphEntityTextDataset-chiritacatalinaelena 数据来源:互联网公开数据 标签:知识图谱, 实体识别, 文本摘要, 自然语言处理, 数据清洗, 文本分析, 数据库, 信息检索 数据概述:... -
土耳其诗歌文本数据集TurkishPoemsTextDataset-kaanefekeles
土耳其诗歌文本数据集TurkishPoemsTextDataset-kaanefekeles 数据来源:互联网公开数据 标签:诗歌, 土耳其语, 文本分析, 诗歌创作, 情感分析, 文本挖掘, 自然语言处理, 文化研究 数据概述: 该数据集包含来自土耳其的诗歌文本,记录了不同诗人的作品。主要特征如下:... -
关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999
关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999 数据来源:互联网公开数据 标签:关键词提取,自然语言处理,文本挖掘,数据集,机器学习,信息检索,文本分析,学术研究 数据概述: 该数据集包含用于训练和评估YAKE(Yet Another Keyword... -
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar 数据来源:互联网公开数据 标签:文本分析, 写作风格, 机器生成文本, 文本分类, 自然语言处理, 论文写作, 语言模型, 数据集 数据概述:... -
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo 数据来源:互联网公开数据 标签:论文翻译,韩国留学,数据集,机器翻译,自然语言处理,语言学,文本分析,韩语 数据概述: 该数据集包含韩国留学申请相关的论文翻译数据,旨在促进机器翻译和语言学习研究。主要特征如下:... -
Reddit恐怖故事数据集SpookyRedditStoriesDataset-justjoshtings
Reddit恐怖故事数据集SpookyRedditStoriesDataset-justjoshtings 数据来源:互联网公开数据 标签:恐怖故事,数据集,文本分析,情感分析,自然语言处理,社交媒体,机器学习,内容创作 数据概述: 该数据集包含来自Reddit平台上的恐怖故事数据,记录了用户发布的各类恐怖故事内容。主要特征如下:... -
加州大学圣迭戈分校UCSDReddit子版块数据集-luketaylor12345
加州大学圣迭戈分校UCSDReddit子版块数据集-luketaylor12345 数据来源:互联网公开数据 标签:社交媒体,Reddit,数据集,文本分析,自然语言处理,情感分析,社区研究,机器学习 数据概述: 该数据集包含了来自加州大学圣迭戈分校(UCSD)相关的 Reddit 子版块的数据,记录了用户在 Reddit...