-
新冠疫情社交媒体情感分析数据集COVID-19SentimentAnalysisDataset-nathaniae
新冠疫情社交媒体情感分析数据集COVID-19SentimentAnalysisDataset-nathaniae 数据来源:互联网公开数据 标签:新冠疫情,社交媒体,情感分析,自然语言处理,文本挖掘,情感分类,公共卫生,舆情分析 数据概述: 该数据集包含来自社交媒体平台关于新冠疫情的文本数据,旨在分析公众对疫情的情感态度。主要特征如下:... -
情感分析社交媒体文本数据集-yumnagamal
情感分析社交媒体文本数据集-yumnagamal 数据来源:互联网公开数据 标签:情感分析,社交媒体,文本数据,自然语言处理,情感分类,数据集,机器学习 数据概述:... -
问答游戏节目数据集JeopardyCSVDataset-mosesmoncy
问答游戏节目数据集JeopardyCSVDataset-mosesmoncy 数据来源:互联网公开数据 标签:问答游戏,数据集,教育,知识竞赛,机器学习,自然语言处理,数据分析,历史研究 数据概述: 该数据集包含来自问答游戏节目《Jeopardy!》的问答对数据,记录了节目中出现的各类问题和答案。主要特征如下:... -
英语-沃森对话数据集English-WatsonDialogueDataset-yukikawawaki
英语-沃森对话数据集English-WatsonDialogueDataset-yukikawawaki 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,文本分析,机器学习,情感分析,语言理解,问答系统 数据概述: 该数据集包含来自IBM沃森(Watson)的英语对话数据,记录了人与沃森对话系统的交互信息。主要特征如下:... -
特朗普与拜登总统辩论分析数据集-mitramir5
特朗普与拜登总统辩论分析数据集-mitramir5 数据来源:互联网公开数据 标签:政治,辩论,数据集,文本分析,自然语言处理,情感分析,舆情分析,美国大选 数据概述: 该数据集包含了来自特朗普和拜登总统辩论的文本数据,旨在进行深入的语言和情感分析。主要特征如下:... -
写作质量预测与实际得分数据集-mcpenguin
写作质量预测与实际得分数据集-mcpenguin 数据来源:互联网公开数据 标签:写作质量,预测,评估,自然语言处理,机器学习,文本分析,教育,评分 数据概述: 该数据集包含了写作样本及其对应的预测质量评分和实际得分,旨在用于研究和开发写作质量评估模型。主要特征如下: 时间跨度:数据记录的时间范围涵盖了多个时间段的写作样本。... -
法律公开测试数据集PublicTestLegalDataset-minhnguyendichnhat
法律公开测试数据集PublicTestLegalDataset-minhnguyendichnhat 数据来源:互联网公开数据 标签:法律,数据集,文本分析,自然语言处理,法律文本,机器学习,司法,文本分类 数据概述: 该数据集包含来自公开法律文本的数据,旨在用于法律领域的测试和评估。主要特征如下: 时间跨度:... -
Jigsaw恶意评论分类挑战赛评论数据集-koheishima
Jigsaw恶意评论分类挑战赛评论数据集-koheishima 数据来源:互联网公开数据 标签:恶意评论,文本分类,自然语言处理,情感分析,社交媒体,评论数据,毒性检测,在线社区,机器学习 数据概述: 本数据集包含了来自Jigsaw... -
新闻摘要生成评估数据集-新闻文章与人工摘要-随机抽样数据
新闻摘要生成评估数据集-新闻文章与人工摘要-随机抽样数据 数据来源:互联网公开数据 标签:新闻,摘要,文本摘要,自然语言处理,机器学习,评估,文本分析,内容生成 数据概述:... -
情感词典文本挖掘数据集SentimentLexiconsforTextMiningDataset-ekrembayar
情感词典文本挖掘数据集SentimentLexiconsforTextMiningDataset-ekrembayar 数据来源:互联网公开数据 标签:情感分析,文本挖掘,数据集,自然语言处理,机器学习,情感词典,数据标注,语义分析 数据概述: 该数据集包含用于情感分析的情感词典和文本挖掘相关数据,记录了词汇的情感极性及其在文本中的应用。主要特征如下:... -
巴基斯坦推特情绪分析数据集PakistanTweetsDataset-ameerhamza123
巴基斯坦推特情绪分析数据集PakistanTweetsDataset-ameerhamza123 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,文本挖掘,舆情研究,国际关系 数据概述: 该数据集包含来自巴基斯坦地区推特的公开数据,记录了用户在社交媒体上的言论和情感表达。主要特征如下:... -
社交媒体推文主题建模数据集WSTopicModelingTweetsDataset-ahmedeep
社交媒体推文主题建模数据集WSTopicModelingTweetsDataset-ahmedeep 数据来源:互联网公开数据 标签:社交媒体,推文,主题建模,文本分析,自然语言处理,数据挖掘,机器学习,舆情分析 数据概述: 该数据集包含来自社交媒体平台(如Twitter)的推文数据,主要用于主题建模和文本分析。主要特征如下:... -
台湾社交媒体情绪分析数据集ML-BIG5Data-TaiwanSocialMediaSentimentAnalysisDataset-shaykhaaldawsari
台湾社交媒体情绪分析数据集ML-BIG5Data-TaiwanSocialMediaSentimentAnalysisDataset-shaykhaaldawsari 数据来源:互联网公开数据 标签:情绪分析,社交媒体,中文文本,心理学,机器学习,自然语言处理,情感计算,台湾 数据概述:... -
中文文本分类标签数据集-训练集-独有标签及原始标签数据-hengwdai
中文文本分类标签数据集-训练集-独有标签及原始标签数据-hengwdai 数据来源:互联网公开数据 标签:文本分类,自然语言处理,中文,标签,训练集,RoBERTa,机器学习 数据概述: 本数据集包含三个子集,均与中文文本分类任务相关,主要基于RoBERTa模型进行标签生成与处理。 AM-1 (使用180_filtered_rb标记的训练集):... -
印度公共评论情感分析数据集JantaNLPDataset-vijuc895
印度公共评论情感分析数据集JantaNLPDataset-vijuc895 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本挖掘,社交媒体,印度语言,多语言处理 数据概述: 该数据集来自Janta NLP项目,主要包含印度公共平台的评论数据,用于情感分析任务。主要特征如下:... -
韩国文本到SQL生成数据集Ko-Text2SQLDataset-cocolabhub
韩国文本到SQL生成数据集Ko-Text2SQLDataset-cocolabhub 数据来源:互联网公开数据 标签:自然语言处理,文本到SQL,数据集,语义解析,机器学习,数据库,人工智能,韩国语 数据概述: 该数据集由韩国文本到SQL生成任务的数据组成,旨在促进韩国语环境下文本到SQL技术的研发。主要特征如下:... -
BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige
BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器翻译,文本生成,深度学习,BERT模型 数据概述: 该数据集包含了用于训练和评估BERT模型的基础文本数据,用于构建BERT模型的基线实验。主要特征如下:... -
亚马逊图书评论数据集AmazonBookReviewDataset-manishthilagar
亚马逊图书评论数据集AmazonBookReviewDataset-manishthilagar 数据来源:互联网公开数据 标签:图书评论,数据集,自然语言处理,情感分析,机器学习,电商分析,消费者行为,数据挖掘 数据概述: 该数据集包含来自亚马逊的图书评论数据,记录了用户对图书的评价和评分等信息。主要特征如下:... -
印度新冠疫情新闻数据集IndianNewsDataCorona-nikhilmishra21
印度新冠疫情新闻数据集IndianNewsDataCorona-nikhilmishra21 数据来源:互联网公开数据 标签:新冠疫情,印度,新闻数据,自然语言处理,文本分析,疫情分析,新闻媒体,公共卫生 数据概述: 该数据集包含来自印度新闻媒体关于新冠疫情的报道数据,记录了疫情期间的新闻文章内容。主要特征如下:... -
社交媒体用户个性化推荐数据集SLP用户推荐数据集-ktgiahieu
社交媒体用户个性化推荐数据集SLP用户推荐数据集-ktgiahieu 数据来源:互联网公开数据 标签:社交媒体,用户行为,个性化推荐,机器学习,自然语言处理,数据集,用户画像,推荐系统 数据概述:该数据集包含来自社交媒体平台的用户行为数据,旨在用于个性化推荐系统的研究和开发。主要特征如下: 时间跨度:数据记录的时间范围为平台用户交互的完整历史记录。...