-
股票市场新闻数据集-arthuruguendemendona
股票市场新闻数据集-arthuruguendemendona 数据来源:互联网公开数据 标签:股票市场,新闻,情感分析,自然语言处理,金融科技,文本分析,市场预测,机器学习 数据概述: 该数据集包含来自各种新闻来源的股票市场相关新闻文章,记录了股票市场的新闻事件和市场情绪。主要特征如下: 时间跨度:数据记录的时间范围从[起始年份]到[结束年份]。... -
数学问题解答数据集-jaimatadi22
数学问题解答数据集-jaimatadi22 数据来源:互联网公开数据 标签:数学,问题解答,数据集,教育,机器学习,自然语言处理,文本分析,算术 数据概述: 该数据集包含一系列简单的数学问题及其对应的解答。主要特征如下: 时间跨度: 数据记录的时间范围不限。 地理范围: 数据来源不限。 数据维度: 数据集包括数学问题文本,对应的正确答案。 数据格式:... -
垃圾短信分类数据集SpamSMSClassificationDataset-geetmukherjee
垃圾短信分类数据集SpamSMSClassificationDataset-geetmukherjee 数据来源:互联网公开数据 标签:短信分类,垃圾短信,数据集,文本分析,机器学习,自然语言处理,通信安全,数据挖掘 数据概述: 该数据集包含来自公开来源的短信数据,记录了用户收到的短信内容及其是否为垃圾短信的标签。主要特征如下:... -
土耳其语文本数据集Linux-denizhanahin
土耳其语文本数据集Linux-denizhanahin 数据来源:互联网公开数据 标签:土耳其语,文本,数据集,自然语言处理,语言模型,文本分析,机器翻译,Linux 数据概述: 该数据集包含来自Linux环境下的土耳其语文本数据,主要记录了各种Linux系统和应用程序的土耳其语文本信息。主要特征如下:... -
多语言句子对相似度数据集PAWS-XAnchorsDataset-themirachathumina
多语言句子对相似度数据集PAWS-XAnchorsDataset-themirachathumina 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,句子相似度,多语言,文本分析,语义理解,深度学习 数据概述: 该数据集包含来自PAWS-X项目的多语言句子对数据,记录了不同语言中句子对的相似度关系。主要特征如下:... -
电影类型分析数据集MovieDatasetwithGenres-garimatata
电影类型分析数据集MovieDatasetwithGenres-garimatata 数据来源:互联网公开数据 标签:电影,数据集,类型分析,电影推荐,机器学习,文本分析,娱乐,影视 数据概述: 该数据集包含来自互联网的电影数据,记录了电影的详细信息,包括电影名称,上映年份,评分,评论,演员,导演以及电影类型等。主要特征如下:... -
评论余弦相似度结果数据集YorumCosineSimilaritySonuclariDataset-hasankuluk1
评论余弦相似度结果数据集YorumCosineSimilaritySonuclariDataset-hasankuluk1 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,相似度计算,机器学习,情感分析,文本挖掘,信息检索 数据概述: 该数据集包含来自网络评论的余弦相似度计算结果,记录了不同评论之间的相似度分数。主要特征如下:... -
局部敏感哈希LSH文档数据集-massivedatamining
局部敏感哈希LSH文档数据集-massivedatamining 数据来源:互联网公开数据 标签:文本分析,局部敏感哈希,数据集,文档检索,信息检索,机器学习,自然语言处理,相似性搜索 数据概述:该数据集包含了用于研究和评估局部敏感哈希(LSH)算法的文档集合。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于文档的创建时间。... -
Formspring问答社交平台数据集FormspringDataset-ppujari
Formspring问答社交平台数据集FormspringDataset-ppujari 数据来源:互联网公开数据 标签:社交媒体,问答,数据集,文本分析,自然语言处理,用户行为,情感分析,社交网络 数据概述: 该数据集包含来自 Formspring 社交问答平台的数据,记录了用户在平台上的提问,回答及相关互动信息。主要特征如下:... -
美国高中生议论文写作能力评估数据集AESPersuadeDataset-mcqueencaine
美国高中生议论文写作能力评估数据集AESPersuadeDataset-mcqueencaine 数据来源:互联网公开数据 标签:教育评估,议论文写作,数据集,机器学习,文本分析,教育技术,自然语言处理,高中教育 数据概述: 该数据集包含来自美国高中生议论文写作能力评估项目(Automated Essay Scoring -... -
微信公众号新闻数据数据集-mastermust
微信公众号新闻数据数据集-mastermust 数据来源:互联网公开数据 标签:微信公众号,新闻,社交媒体,文本分析,自然语言处理,舆情分析,数据集,内容分析 数据概述: 该数据集包含来自微信公众号的新闻文章数据,记录了微信公众号发布的文章内容,发布时间,阅读量,点赞量等信息。主要特征如下:... -
消费者情感分析数据集SentimentAnalysisofRelianceDataset-vivekshah2004
消费者情感分析数据集SentimentAnalysisofRelianceDataset-vivekshah2004 数据来源:互联网公开数据 标签:情感分析,消费者行为,数据集,自然语言处理,机器学习,零售业,文本分析,商业智能 数据概述: 该数据集记录了消费者对Reliance公司及其产品的情感评价,适用于情感分析,文本挖掘等任务。主要特征如下:... -
最近10篇帖子数据集Last10PostsDataDataset-agrimjain0206
最近10篇帖子数据集Last10PostsDataDataset-agrimjain0206 数据来源:互联网公开数据 标签:社交媒体,帖子数据,数据集,文本分析,情感分析,自然语言处理,数据挖掘,网络行为 数据概述: 该数据集包含来自社交媒体平台的最近10篇帖子数据,记录了用户发布的内容。主要特征如下:... -
电影多标签分类验证集数据集-chizhauhan
电影多标签分类验证集数据集-chizhauhan 数据来源:互联网公开数据 标签:电影,多标签分类,数据集,机器学习,文本分析,情感分析,电影推荐,自然语言处理 数据概述: 该数据集包含了电影的多标签分类验证集数据,用于评估和验证多标签分类模型在电影领域的表现。主要特征如下: 时间跨度:数据记录的时间跨度不明确,主要关注于电影本身的内容和属性。... -
截断512令牌数据集Truncation512TokensDataset-satoshissss
截断512令牌数据集Truncation512TokensDataset-satoshissss 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本截断,机器学习,深度学习,文本分析,语言模型,文本挖掘 数据概述:... -
句子生成脚本数据集SentenceScriptDataset-indunil19
句子生成脚本数据集SentenceScriptDataset-indunil19 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,深度学习,语言模型,文本分析,人工智能,写作辅助 数据概述: 该数据集包含用于句子生成的脚本数据,记录了各种主题和风格的句子及相关信息。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于脚本的创作时间。... -
CommonLit阅读理解难度评估辅助数据集CommonLitReadabilityPrizeAuxiliaryDataDataset-chamecall
CommonLit阅读理解难度评估辅助数据集CommonLitReadabilityPrizeAuxiliaryDataDataset-chamecall 数据来源:互联网公开数据 标签:自然语言处理,阅读理解,文本分析,数据集,可读性评估,教育,机器学习,语言学 数据概述:... -
Gemma模型个人身份信息PII数据集-minhsienweng
Gemma模型个人身份信息PII数据集-minhsienweng 数据来源:互联网公开数据 标签:PII,数据集,Gemma,隐私保护,自然语言处理,机器学习,文本分析,数据安全 数据概述: 该数据集包含了与Gemma模型相关的个人身份信息(PII)数据,旨在用于隐私保护和安全研究。主要特征如下:... -
板球比赛解说数据集CricketCommentaryDataset-shineucc
板球比赛解说数据集CricketCommentaryDataset-shineucc 数据来源:互联网公开数据 标签:板球,体育赛事,数据集,解说文本,自然语言处理,机器学习,文本分析,体育研究 数据概述: 该数据集包含来自板球比赛解说的文本数据,记录了比赛过程中的实时解说内容。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
假新闻检测数据集FakeNewsDetectionDataset-ayush0510
假新闻检测数据集FakeNewsDetectionDataset-ayush0510 数据来源:互联网公开数据 标签:假新闻,数据集,文本分析,机器学习,自然语言处理,信息检索,社会研究,媒体分析 数据概述:该数据集包含来自Kaggle的假新闻数据,记录了真实和虚假新闻文章的关键信息。主要特征如下:...