找到12,007个数据集

标签: 自然语言处理

过滤结果
  • 城市网络社交媒体评论情感分析数据集CityNetInstagramCommentsSentimentAnalysisDataset-vrashad

    2025年4月26日   

    城市网络社交媒体评论情感分析数据集CityNetInstagramCommentsSentimentAnalysisDataset-vrashad 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,文本挖掘,机器学习,情感识别,自然语言处理,城市研究 数据概述:...
    packageimg
  • 大规模通用文本数据集LLM-Text-Data-abramova

    2025年4月26日   

    大规模通用文本数据集LLM-Text-Data-abramova 数据来源:互联网公开数据 标签:文本数据,自然语言处理,大型语言模型,数据集,文本分析,机器学习,数据挖掘,通用领域 数据概述:该数据集包含了大规模的通用文本数据,旨在支持大型语言模型(LLM)的训练,评估和研究。主要特征如下:...
    packageimg
  • 推特私信数据集TwitterDMDataset-jiayu991011

    2025年4月26日   

    推特私信数据集TwitterDMDataset-jiayu991011 数据来源:互联网公开数据 标签:推特,私信,社交媒体,自然语言处理,文本分析,情感分析,数据集,用户行为 数据概述: 该数据集包含来自推特(Twitter)的私信数据,记录了用户之间的私信内容和相关信息。主要特征如下:...
    packageimg
  • 无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147

    2025年4月26日   

    无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147 数据来源:互联网公开数据 标签:主题分析,数据集,文本挖掘,自然语言处理,文本分类,机器学习,数据分析,信息检索 数据概述: 该数据集包含来自公开互联网资源的文本数据,记录了不使用TF-IDF方法进行主题分析的文本样本。主要特征如下:...
    packageimg
  • 疾病诊断标签清洗数据集-vasanth5794

    2025年4月26日   

    疾病诊断标签清洗数据集-vasanth5794 数据来源:互联网公开数据 标签:医学诊断,数据集,标签清洗,数据预处理,自然语言处理,机器学习,医疗健康,数据质量 数据概述: 该数据集包含经过清洗和整理的疾病诊断标签数据,旨在用于医学诊断相关的研究和应用。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于原始数据的收集时间。...
    packageimg
  • 莱特币NLP挑战赛第一部分数据集LitecoinNLPChallengePart1Dataset-dschettler8845

    2025年4月26日   

    莱特币NLP挑战赛第一部分数据集LitecoinNLPChallengePart1Dataset-dschettler8845 数据来源:互联网公开数据 标签:莱特币,自然语言处理,数据集,文本分析,金融科技,加密货币,情感分析,机器学习 数据概述:...
    packageimg
  • 智能助手15版本语音识别与动作控制数据集Assist15-Akt-Data-yufenghua520

    2025年4月26日   

    智能助手15版本语音识别与动作控制数据集Assist15-Akt-Data-yufenghua520 数据来源:互联网公开数据 标签:智能助手,语音识别,动作控制,数据集,人工智能,自然语言处理,语音技术,人机交互 数据概述: 该数据集来源于Assist15项目,主要记录了智能助手在语音识别与动作控制任务中的数据。主要特征如下:...
    packageimg
  • 网络欺凌事件分析数据集Cyber-bullyingIncidentAnalysisDataset-madhubalaji

    2025年4月26日   

    网络欺凌事件分析数据集Cyber-bullyingIncidentAnalysisDataset-madhubalaji 数据来源:互联网公开数据 标签:网络欺凌,数据集,社交媒体,文本分析,自然语言处理,情感分析,欺凌检测,社会学 数据概述: 该数据集包含来自社交媒体平台的网络欺凌相关数据,记录了用户在网络上遭受欺凌的事件信息。主要特征如下:...
    packageimg
  • 短文本分析与自组织映射模型数据集ShortTextAnalysisandSOMModelDataset-iqraali22

    2025年4月26日   

    短文本分析与自组织映射模型数据集ShortTextAnalysisandSOMModelDataset-iqraali22 数据来源:互联网公开数据 标签:文本分析,自组织映射,数据集,自然语言处理,机器学习,情感分析,主题建模,数据可视化 数据概述:...
    packageimg
  • 俄罗斯联邦储蓄银行Sberbank黑客松比赛数据集-cupcke

    2025年4月26日   

    俄罗斯联邦储蓄银行Sberbank黑客松比赛数据集-cupcke 数据来源:互联网公开数据 标签:银行业,黑客松,数据集,机器学习,金融科技,自然语言处理,风险评估,数据分析 数据概述: 该数据集包含来自俄罗斯联邦储蓄银行(Sberbank)黑客松比赛的数据,记录了参赛者在比赛中使用的各类数据。主要特征如下:...
    packageimg
  • 阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli

    2025年4月26日   

    阿塞拜疆语新闻数据集AynaAZAzerbaijaniNewsDataset-anardashdamirli 数据来源:互联网公开数据 标签:新闻,阿塞拜疆语,数据集,自然语言处理,文本分析,机器学习,新闻挖掘,语言研究 数据概述: 该数据集包含来自阿塞拜疆当地新闻网站Ayna AZ的新闻文章,记录了近年来的新闻内容。主要特征如下:...
    packageimg
  • 亚马逊商品评论数据集AmazonProductReviewsDataset-zobiabilal

    2025年4月26日   

    亚马逊商品评论数据集AmazonProductReviewsDataset-zobiabilal 数据来源:互联网公开数据 标签:商品评论,消费者行为,情感分析,自然语言处理,机器学习,文本挖掘,市场调研,电商 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了用户对商品的评价和反馈。主要特征如下:...
    packageimg
  • 亚马逊商品评论情感分析数据集AmazonProductReviewsSentimentAnalysisDataset-maqeel732

    2025年4月26日   

    亚马逊商品评论情感分析数据集AmazonProductReviewsSentimentAnalysisDataset-maqeel732 数据来源:互联网公开数据 标签:电商,评论分析,情感分析,自然语言处理,机器学习,文本挖掘,用户行为,数据分析 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,主要用于情感分析和用户行为研究。主要特征如下:...
    packageimg
  • 灾难问答数据集DisasterQuestionsDataset-anjaneyavarma5598

    2025年4月26日   

    灾难问答数据集DisasterQuestionsDataset-anjaneyavarma5598 数据来源:互联网公开数据 标签:灾难管理,问答系统,数据集,自然语言处理,机器学习,信息检索,灾害研究,应急响应 数据概述: 该数据集包含来自公开渠道的灾难相关信息,记录了与各类灾难相关的问答数据。主要特征如下:...
    packageimg
  • 体育新闻数据集2010-2023年数据集-newsdataio

    2025年4月26日   

    体育新闻数据集2010-2023年数据集-newsdataio 数据来源:互联网公开数据 标签:体育新闻,数据集,文本分析,自然语言处理,机器学习,新闻学,媒体报道,体育事件 数据概述: 该数据集包含2010年至2023年的体育新闻数据,涵盖了全球主要体育赛事和运动员的新闻报道。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 葡萄牙语词频列表数据集15000PortugueseFrequencyListDataset-jacobgifford

    2025年4月26日   

    葡萄牙语词频列表数据集15000PortugueseFrequencyListDataset-jacobgifford 数据来源:互联网公开数据 标签:葡萄牙语,词频,语言学,自然语言处理,数据集,文本分析,语言学习,词汇研究 数据概述:...
    packageimg
  • 泰米尔语短篇故事机器阅读理解数据集TamilShortStoryMRCDataset-charlesey

    2025年4月26日   

    泰米尔语短篇故事机器阅读理解数据集TamilShortStoryMRCDataset-charlesey 数据来源:互联网公开数据 标签:泰米尔语,短篇故事,机器阅读理解,自然语言处理,数据集,文本分析,语言学,人工智能 数据概述: 该数据集包含泰米尔语短篇故事数据,旨在用于机器阅读理解(MRC)任务。主要特征如下:...
    packageimg
  • ChatGPTReddit评论数据集ChatGPTRedditCommentsDataset-ermila

    2025年4月26日   

    ChatGPTReddit评论数据集ChatGPTRedditCommentsDataset-ermila 数据来源:互联网公开数据 标签:Reddit, 社交媒体, 评论数据, 机器学习, 自然语言处理, 文本分析, 人工智能, 社会研究 数据概述:该数据集包含来自Reddit社交平台的评论数据,记录了用户在不同子版块下的评论内容。主要特征如下:...
    packageimg
  • 屏幕爱情主题数据集HackerearthLoveintheScreenDataset-ritwikrohitashwa

    2025年4月26日   

    屏幕爱情主题数据集HackerearthLoveintheScreenDataset-ritwikrohitashwa 数据来源:互联网公开数据 标签:情感分析,屏幕内容,数据集,文本挖掘,自然语言处理,情感计算,媒体研究,人机交互 数据概述: 该数据集包含来自 Hackerearth...
    packageimg
  • 谷歌专利大型语言模型数据集GooglePatentsLargeLanguageModelsDataset-andrssebastian

    2025年4月26日   

    谷歌专利大型语言模型数据集GooglePatentsLargeLanguageModelsDataset-andrssebastian 数据来源:互联网公开数据 标签:专利,大型语言模型,自然语言处理,数据集,机器学习,文本分析,知识产权,技术创新 数据概述:...
    packageimg