-
城市网络社交媒体评论情感分析数据集CityNetInstagramCommentsSentimentAnalysisDataset-vrashad
城市网络社交媒体评论情感分析数据集CityNetInstagramCommentsSentimentAnalysisDataset-vrashad 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,文本挖掘,机器学习,情感识别,自然语言处理,城市研究 数据概述:... -
大规模通用文本数据集LLM-Text-Data-abramova
大规模通用文本数据集LLM-Text-Data-abramova 数据来源:互联网公开数据 标签:文本数据,自然语言处理,大型语言模型,数据集,文本分析,机器学习,数据挖掘,通用领域 数据概述:该数据集包含了大规模的通用文本数据,旨在支持大型语言模型(LLM)的训练,评估和研究。主要特征如下:... -
推特私信数据集TwitterDMDataset-jiayu991011
推特私信数据集TwitterDMDataset-jiayu991011 数据来源:互联网公开数据 标签:推特,私信,社交媒体,自然语言处理,文本分析,情感分析,数据集,用户行为 数据概述: 该数据集包含来自推特(Twitter)的私信数据,记录了用户之间的私信内容和相关信息。主要特征如下:... -
无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147
无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147 数据来源:互联网公开数据 标签:主题分析,数据集,文本挖掘,自然语言处理,文本分类,机器学习,数据分析,信息检索 数据概述: 该数据集包含来自公开互联网资源的文本数据,记录了不使用TF-IDF方法进行主题分析的文本样本。主要特征如下:... -
疾病诊断标签清洗数据集-vasanth5794
疾病诊断标签清洗数据集-vasanth5794 数据来源:互联网公开数据 标签:医学诊断,数据集,标签清洗,数据预处理,自然语言处理,机器学习,医疗健康,数据质量 数据概述: 该数据集包含经过清洗和整理的疾病诊断标签数据,旨在用于医学诊断相关的研究和应用。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于原始数据的收集时间。... -
莱特币NLP挑战赛第一部分数据集LitecoinNLPChallengePart1Dataset-dschettler8845
莱特币NLP挑战赛第一部分数据集LitecoinNLPChallengePart1Dataset-dschettler8845 数据来源:互联网公开数据 标签:莱特币,自然语言处理,数据集,文本分析,金融科技,加密货币,情感分析,机器学习 数据概述:... -
智能助手15版本语音识别与动作控制数据集Assist15-Akt-Data-yufenghua520
智能助手15版本语音识别与动作控制数据集Assist15-Akt-Data-yufenghua520 数据来源:互联网公开数据 标签:智能助手,语音识别,动作控制,数据集,人工智能,自然语言处理,语音技术,人机交互 数据概述: 该数据集来源于Assist15项目,主要记录了智能助手在语音识别与动作控制任务中的数据。主要特征如下:... -
网络欺凌事件分析数据集Cyber-bullyingIncidentAnalysisDataset-madhubalaji
网络欺凌事件分析数据集Cyber-bullyingIncidentAnalysisDataset-madhubalaji 数据来源:互联网公开数据 标签:网络欺凌,数据集,社交媒体,文本分析,自然语言处理,情感分析,欺凌检测,社会学 数据概述: 该数据集包含来自社交媒体平台的网络欺凌相关数据,记录了用户在网络上遭受欺凌的事件信息。主要特征如下:... -
短文本分析与自组织映射模型数据集ShortTextAnalysisandSOMModelDataset-iqraali22
短文本分析与自组织映射模型数据集ShortTextAnalysisandSOMModelDataset-iqraali22 数据来源:互联网公开数据 标签:文本分析,自组织映射,数据集,自然语言处理,机器学习,情感分析,主题建模,数据可视化 数据概述:... -
俄罗斯联邦储蓄银行Sberbank黑客松比赛数据集-cupcke
俄罗斯联邦储蓄银行Sberbank黑客松比赛数据集-cupcke 数据来源:互联网公开数据 标签:银行业,黑客松,数据集,机器学习,金融科技,自然语言处理,风险评估,数据分析 数据概述: 该数据集包含来自俄罗斯联邦储蓄银行(Sberbank)黑客松比赛的数据,记录了参赛者在比赛中使用的各类数据。主要特征如下:... -
阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli
阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli 数据来源:互联网公开数据 标签:新闻,阿塞拜疆语,数据集,自然语言处理,文本分析,机器学习,新闻挖掘,语言研究 数据概述: 该数据集包含来自阿塞拜疆当地新闻网站Ayna AZ的新闻文章,记录了近年来的新闻内容。主要特征如下:... -
亚马逊商品评论数据集AmazonProductReviewsDataset-zobiabilal
亚马逊商品评论数据集AmazonProductReviewsDataset-zobiabilal 数据来源:互联网公开数据 标签:商品评论,消费者行为,情感分析,自然语言处理,机器学习,文本挖掘,市场调研,电商 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了用户对商品的评价和反馈。主要特征如下:... -
亚马逊商品评论情感分析数据集AmazonProductReviewsSentimentAnalysisDataset-maqeel732
亚马逊商品评论情感分析数据集AmazonProductReviewsSentimentAnalysisDataset-maqeel732 数据来源:互联网公开数据 标签:电商,评论分析,情感分析,自然语言处理,机器学习,文本挖掘,用户行为,数据分析 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,主要用于情感分析和用户行为研究。主要特征如下:... -
灾难问答数据集DisasterQuestionsDataset-anjaneyavarma5598
灾难问答数据集DisasterQuestionsDataset-anjaneyavarma5598 数据来源:互联网公开数据 标签:灾难管理,问答系统,数据集,自然语言处理,机器学习,信息检索,灾害研究,应急响应 数据概述: 该数据集包含来自公开渠道的灾难相关信息,记录了与各类灾难相关的问答数据。主要特征如下:... -
体育新闻数据集2010-2023年数据集-newsdataio
体育新闻数据集2010-2023年数据集-newsdataio 数据来源:互联网公开数据 标签:体育新闻,数据集,文本分析,自然语言处理,机器学习,新闻学,媒体报道,体育事件 数据概述: 该数据集包含2010年至2023年的体育新闻数据,涵盖了全球主要体育赛事和运动员的新闻报道。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
葡萄牙语词频列表数据集15000PortugueseFrequencyListDataset-jacobgifford
葡萄牙语词频列表数据集15000PortugueseFrequencyListDataset-jacobgifford 数据来源:互联网公开数据 标签:葡萄牙语,词频,语言学,自然语言处理,数据集,文本分析,语言学习,词汇研究 数据概述:... -
泰米尔语短篇故事机器阅读理解数据集TamilShortStoryMRCDataset-charlesey
泰米尔语短篇故事机器阅读理解数据集TamilShortStoryMRCDataset-charlesey 数据来源:互联网公开数据 标签:泰米尔语,短篇故事,机器阅读理解,自然语言处理,数据集,文本分析,语言学,人工智能 数据概述: 该数据集包含泰米尔语短篇故事数据,旨在用于机器阅读理解(MRC)任务。主要特征如下:... -
ChatGPTReddit评论数据集ChatGPTRedditCommentsDataset-ermila
ChatGPTReddit评论数据集ChatGPTRedditCommentsDataset-ermila 数据来源:互联网公开数据 标签:Reddit, 社交媒体, 评论数据, 机器学习, 自然语言处理, 文本分析, 人工智能, 社会研究 数据概述:该数据集包含来自Reddit社交平台的评论数据,记录了用户在不同子版块下的评论内容。主要特征如下:... -
屏幕爱情主题数据集HackerearthLoveintheScreenDataset-ritwikrohitashwa
屏幕爱情主题数据集HackerearthLoveintheScreenDataset-ritwikrohitashwa 数据来源:互联网公开数据 标签:情感分析,屏幕内容,数据集,文本挖掘,自然语言处理,情感计算,媒体研究,人机交互 数据概述: 该数据集包含来自 Hackerearth... -
谷歌专利大型语言模型数据集GooglePatentsLargeLanguageModelsDataset-andrssebastian
谷歌专利大型语言模型数据集GooglePatentsLargeLanguageModelsDataset-andrssebastian 数据来源:互联网公开数据 标签:专利,大型语言模型,自然语言处理,数据集,机器学习,文本分析,知识产权,技术创新 数据概述:...