-
越南语句情感分析数据集-taitruong256
越南语句情感分析数据集-taitruong256 数据来源:互联网公开数据 标签:越南语,情感分析,NLP,数据集,文本处理,机器学习,自然语言处理,语言学 数据概述: 该数据集包含来自越南语的句子及其对应的情感标签,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,但包含多个不同时期的越南语文本。... -
讽刺文本识别与情感分析数据集Sarcasm-ZipDataset-jazimhammad
讽刺文本识别与情感分析数据集Sarcasm-ZipDataset-jazimhammad 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本分类,语言模型,人工智能,文本挖掘 数据概述: 该数据集专注于包含讽刺语气的文本数据,记录了不同来源的文本内容,适用于讽刺文本识别和情感分析等任务。主要特征如下:... -
人工智能生成文本对比人类文本清洗数据集-dillonwongso
人工智能生成文本对比人类文本清洗数据集-dillonwongso 数据来源:互联网公开数据 标签:人工智能,文本生成,文本清洗,数据集,自然语言处理,机器学习,文本分析,对比研究 数据概述: 该数据集包含来自不同来源的人工智能生成文本和人类编写的文本,并经过清洗处理,旨在用于比较分析。主要特征如下:... -
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,深度学习,人工智能,多语言支持 数据概述: 该数据集包含来自多个来源的大规模文本数据,用于扩充和训练大规模语言模型。主要特征如下:... -
知识图谱实体文本数据集KnowledgeGraphEntityTextDataset-chiritacatalinaelena
知识图谱实体文本数据集KnowledgeGraphEntityTextDataset-chiritacatalinaelena 数据来源:互联网公开数据 标签:知识图谱, 实体识别, 文本摘要, 自然语言处理, 数据清洗, 文本分析, 数据库, 信息检索 数据概述:... -
政治新闻文本情感分析数据集PoliticalNewsTextSentimentAnalysis-rishikashili
政治新闻文本情感分析数据集PoliticalNewsTextSentimentAnalysis-rishikashili 数据来源:互联网公开数据 标签:情感分析, 文本分类, 新闻文本, 政治评论, 自然语言处理, 机器学习, 数据标注, 印度语 数据概述: 该数据集包含来自互联网的政治新闻文本,记录了文本内容及其对应的情感极性。主要特征如下:... -
孟加拉新闻文章文本分类数据集BanglaNewspaperArticleTextClassification-feyddautha
孟加拉新闻文章文本分类数据集BanglaNewspaperArticleTextClassification-feyddautha 数据来源:互联网公开数据 标签:文本分类, 新闻文章, 孟加拉语, 自然语言处理, 语料库, 情感分析, 标题分析, 深度学习 数据概述: 该数据集包含来自孟加拉国新闻媒体的文章数据,旨在用于文本分类任务。主要特征如下:... -
多语言语音指令识别与翻译数据集MultilingualSpeechCommandRecognitionandTranslationDataset-prianshujha
多语言语音指令识别与翻译数据集MultilingualSpeechCommandRecognitionandTranslationDataset-prianshujha 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, 多语言, 语音翻译, 机器学习, 语料库, 印度语言, 声学模型 数据概述:... -
临床电子病历三元组训练模型数据集LECRTripletTrainingModelDataset-takamichitoda
临床电子病历三元组训练模型数据集LECRTripletTrainingModelDataset-takamichitoda 数据来源:互联网公开数据 标签:医疗健康,电子病历,三元组,深度学习,自然语言处理,文本挖掘,医学研究,知识图谱 数据概述: 该数据集包含用于训练临床电子病历(Electronic Health Record,... -
Reddit问吧恶作剧问题数据集AskRedditTrollQuestionsDataset-nkalyanv
Reddit问吧恶作剧问题数据集AskRedditTrollQuestionsDataset-nkalyanv 数据来源:互联网公开数据 标签:Reddit, 恶作剧, 问吧, 用户生成内容, 自然语言处理, 社交媒体分析, 文本挖掘, 数据集... -
社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-actuallyayush
社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-actuallyayush 数据来源:互联网公开数据 标签:情感分析, 文本分类, 社交媒体, 推文, 自然语言处理, 机器学习, 数据标注, 情感极性 数据概述:... -
土耳其诗歌文本数据集TurkishPoemsTextDataset-kaanefekeles
土耳其诗歌文本数据集TurkishPoemsTextDataset-kaanefekeles 数据来源:互联网公开数据 标签:诗歌, 土耳其语, 文本分析, 诗歌创作, 情感分析, 文本挖掘, 自然语言处理, 文化研究 数据概述: 该数据集包含来自土耳其的诗歌文本,记录了不同诗人的作品。主要特征如下:... -
科研机构缩写预测评估数据集ResearchInstitutionAbbreviationPredictionEvaluationDataset-vanle73
科研机构缩写预测评估数据集ResearchInstitutionAbbreviationPredictionEvaluationDataset-vanle73 数据来源:互联网公开数据 标签:机构缩写, 文本预测, 机器学习, 自然语言处理, 评估数据集, 命名实体识别, 深度学习, 数据分析 数据概述:... -
中文社交媒体情感分析数据集ChineseSocialMediaSentimentAnalysisDataset-elhamamichaimae
中文社交媒体情感分析数据集ChineseSocialMediaSentimentAnalysisDataset-elhamamichaimae 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本挖掘, 自然语言处理, 情感分类, 中文文本, 舆情分析, 机器学习 数据概述:... -
虚假与真实新闻数据集-noyeemhossain135
虚假与真实新闻数据集-noyeemhossain135 数据来源:互联网公开数据 标签:新闻,虚假新闻,真实新闻,自然语言处理,文本分类,机器学习,舆情分析,数据挖掘 数据概述:该数据集包含来自互联网上的新闻文章,记录了虚假新闻和真实新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了新闻文章的发布时间。... -
越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen
越南语-苗语翻译平衡语料库数据集Pho-MTBalanceLabelDataset-baotanguyen 数据来源:互联网公开数据 标签:机器翻译,语料库,越南语,苗语,语言学,自然语言处理,双语数据,文本数据 数据概述: 该数据集包含越南语和苗语的双语平行文本,旨在促进越南语和苗语之间的机器翻译研究。主要特征如下:... -
关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999
关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999 数据来源:互联网公开数据 标签:关键词提取,自然语言处理,文本挖掘,数据集,机器学习,信息检索,文本分析,学术研究 数据概述: 该数据集包含用于训练和评估YAKE(Yet Another Keyword... -
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar
写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar 数据来源:互联网公开数据 标签:文本分析, 写作风格, 机器生成文本, 文本分类, 自然语言处理, 论文写作, 语言模型, 数据集 数据概述:... -
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo 数据来源:互联网公开数据 标签:论文翻译,韩国留学,数据集,机器翻译,自然语言处理,语言学,文本分析,韩语 数据概述: 该数据集包含韩国留学申请相关的论文翻译数据,旨在促进机器翻译和语言学习研究。主要特征如下:... -
数据1-3个月垃圾邮件与正常邮件分类数据集1-3MonthsCleanedSpamandHamEmailsDataset-ashishgoraniya
1-3个月垃圾邮件与正常邮件分类数据集1-3MonthsCleanedSpamandHamEmailsDataset-ashishgoraniya 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,数据挖掘,信息安全 数据概述:...