找到11,739个数据集

标签: 自然语言处理

过滤结果
  • 问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat

    2025年4月23日   

    问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,命令识别,问题分析,语言模型,智能问答 数据概述:...
    packageimg
  • 航空情感分析数据集社交媒体情感分析的黄金标准

    2025年4月23日   

    标题:航空情感分析数据集社交媒体情感分析的黄金标准 数据内容: 该数据集包含来自社交媒体平台的航空相关推文数据,涉及航空公司、情感分析、地理位置、时间戳等多个维度。具体字段包括: - tweet_id:推文的唯一标识符 - airline_sentiment:推文对航空公司的整体情感倾向(正面、负面、中性) -...
    packageimg
  • 法律领域命名实体识别数据集-pratikpujarichef

    2025年4月23日   

    法律领域命名实体识别数据集-pratikpujarichef 数据来源:互联网公开数据 标签:命名实体识别,法律,自然语言处理,文本分析,数据集,机器学习,司法,合同 数据概述: 该数据集包含从法律文本中提取的命名实体数据,旨在用于法律领域的命名实体识别(NER)任务。主要特征如下: 时间跨度:数据覆盖的时间范围不限,主要取决于收集到的法律文本的时间。...
    packageimg
  • 消费者情感分析电商数据集SentimentAnalysisE-commerceDataset-rabbyshajinislam

    2025年4月23日   

    消费者情感分析电商数据集SentimentAnalysisE-commerceDataset-rabbyshajinislam 数据来源:互联网公开数据 标签:情感分析,电商,数据集,自然语言处理,机器学习,消费者行为,文本分析,商业智能 数据概述: 该数据集包含来自电商平台的消费者评论数据,记录了用户对商品的情感倾向和评价。主要特征如下:...
    packageimg
  • 垃圾短信检测数据集SMSSpamDataset-hanzvivatma

    2025年4月23日   

    垃圾短信检测数据集SMSSpamDataset-hanzvivatma 数据来源:互联网公开数据 标签:文本分类,垃圾短信,自然语言处理,机器学习,数据集,短信,NLP,文本分析 数据概述: 该数据集包含了大量短信文本数据,用于垃圾短信的检测与识别。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了短信内容在一定时间内的收集。 地理范围:...
    packageimg
  • 瑞典语情感分析数据集-wlinds

    2025年4月23日   

    瑞典语情感分析数据集-wlinds 数据来源:互联网公开数据 标签:情感分析,瑞典语,自然语言处理,文本挖掘,数据集,情感分类,语言学,机器学习 数据概述: 该数据集包含了瑞典语文本,用于情感分析任务。主要特征如下: 时间跨度: 数据记录的时间范围不定,主要取决于数据来源。 地理范围: 数据主要来源于瑞典。 数据维度:...
    packageimg
  • 命名实体识别零样本与少样本学习数据集NERCSZero-ShotandFew-ShotDataset-abdullahahmedabooof

    2025年4月23日   

    命名实体识别零样本与少样本学习数据集NERCSZero-ShotandFew-ShotDataset-abdullahahmedabooof 数据来源:互联网公开数据 标签:命名实体识别,零样本学习,少样本学习,数据集,自然语言处理,机器学习,文本分析,人工智能 数据概述:...
    packageimg
  • 语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak

    2025年4月23日   

    语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak 数据来源:互联网公开数据 标签:文本分析,语义理解,自然语言处理,机器学习,信息检索,人工智能,语言模型,数据挖掘 数据概述: 该数据集包含来自公开资源的数据,记录了用于衡量文本间语义相关性的文本对。主要特征如下:...
    packageimg
  • 亚马逊商品法国评论及其英文翻译数据集-dargolex

    2025年4月23日   

    亚马逊商品法国评论及其英文翻译数据集-dargolex 数据来源:互联网公开数据 标签:亚马逊评论,法国评论,英语翻译,多语言数据集,自然语言处理,商品评价 数据概述: 本数据集包含来自亚马逊商品的法国评论及其对应的英文翻译。原始评论数据来源于Hugging Face,由Phillip Keung、Yichao Lu、György...
    packageimg
  • 单词统计与频率分析数据集WordStatisticsandFrequencyAnalysisDataset-ment696

    2025年4月23日   

    单词统计与频率分析数据集WordStatisticsandFrequencyAnalysisDataset-ment696 数据来源:互联网公开数据 标签:语言分析,文本挖掘,数据集,频率统计,自然语言处理,词汇研究,机器学习,教育研究 数据概述:...
    packageimg
  • 数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy

    2025年4月23日   

    数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy 数据来源:互联网公开数据 标签:数字语言,马拉雅拉姆,数据集,自然语言处理,文本分析,机器学习,语言学,人工智能 数据概述: 该数据集包含来自互联网和公开资源的马拉雅拉姆语言文本数据,记录了各种类型的马拉雅拉姆文本。主要特征如下:...
    packageimg
  • 土耳其网络数据集TurkishWebDatasettg-2024-1-denizhanahin

    2025年4月23日   

    土耳其网络数据集TurkishWebDatasettg-2024-1-denizhanahin 数据来源:互联网公开数据 标签:网络数据,土耳其,数据集,文本分析,机器学习,自然语言处理,社交媒体,数据挖掘 数据概述: 该数据集包含来自土耳其互联网公开数据的信息,记录了土耳其网络环境下的各类文本数据。主要特征如下:...
    packageimg
  • 情绪识别数据集6-EmotionData-rahulshelke98

    2025年4月23日   

    情绪识别数据集6-EmotionData-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,数据集,机器学习,自然语言处理,情感分析,心理学,文本分析,人工智能 数据概述:该数据集包含来自多个来源的情绪识别数据,记录了不同文本的情绪标签。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。...
    packageimg
  • 命名实体识别数据集-土耳其语-语料库NER数据集-土耳其语-语料库-niubi666

    2025年4月23日   

    命名实体识别数据集-土耳其语-语料库NER数据集-土耳其语-语料库-niubi666 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,机器学习,文本分析,土耳其语,语料库,人工智能 数据概述:该数据集包含土耳其语的命名实体识别数据,记录了土耳其语文本中的关键实体,如人名,组织名,地名等。主要特征如下:...
    packageimg
  • 多语言情感分析数据集MBERT五语言情感分析数据集-pragyanshusingh01

    2025年4月23日   

    多语言情感分析数据集MBERT五语言情感分析数据集-pragyanshusingh01 数据来源:互联网公开数据 标签:多语言处理,情感分析,机器学习,自然语言处理,深度学习,数据集,文本挖掘,多语言情感识别 数据概述:该数据集包含来自多语言情感分析(MBERT 5-Lang...
    packageimg
  • 灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3

    2025年4月23日   

    灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3 数据来源:互联网公开数据 标签:自然语言处理,灾害应急,文本分类,数据集,机器学习,信息检索,危机管理,社会媒体分析 数据概述:该数据集包含来自Twitter的推文数据,记录了与灾害事件相关的文本信息。主要特征如下:...
    packageimg
  • 双语样本数据集BitextSampleDataset-pragadeeshn01

    2025年4月23日   

    双语样本数据集BitextSampleDataset-pragadeeshn01 数据来源:互联网公开数据 标签:双语文本,数据集,自然语言处理,机器学习,翻译,语言学,文本分析,人工智能 数据概述: 该数据集包含来自不同来源的双语文本样本数据,主要用于机器翻译,文本对齐和自然语言处理研究。主要特征如下:...
    packageimg
  • 有毒评论测试数据集-husanrahmatullayev

    2025年4月23日   

    有毒评论测试数据集-husanrahmatullayev 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,情感分析,有毒内容,机器学习,评论数据,文本分类 数据概述: 该数据集包含用于测试有毒评论检测模型的文本数据,记录了各种类型的在线评论,并标注了其毒性。主要特征如下:...
    packageimg
  • 电子邮件数据集10万条记录EmailDatasetwith100kRecords-mravikiran

    2025年4月23日   

    电子邮件数据集10万条记录EmailDatasetwith100kRecords-mravikiran 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,垃圾邮件检测,情感分析,机器学习,数据挖掘 数据概述: 该数据集包含来自公开渠道的电子邮件数据,记录了电子邮件的内容,发送者,接收者,主题,发送时间等信息。主要特征如下:...
    packageimg
  • 新冠疫情期间社交媒体情绪分析数据集COVID-19PandemicTwitterSentimentAnalysisDataset-osamam0

    2025年4月23日   

    新冠疫情期间社交媒体情绪分析数据集COVID-19PandemicTwitterSentimentAnalysisDataset-osamam0 数据来源:互联网公开数据 标签:社交媒体,情绪分析,数据集,公共卫生,机器学习,自然语言处理,舆情分析,数据挖掘 数据概述:...
    packageimg