找到11,684个数据集

标签: 自然语言处理

过滤结果
  • 国家橄榄球联盟NFL测试脚本数据集-narender129

    2025年5月29日   

    国家橄榄球联盟NFL测试脚本数据集-narender129 数据来源:互联网公开数据 标签:橄榄球,NFL,测试脚本,数据分析,运动,机器学习,自然语言处理,体育 数据概述:该数据集包含来自国家橄榄球联盟(NFL)的测试脚本数据,记录了橄榄球比赛中的各种测试脚本和相关信息。主要特征如下: 时间跨度:数据记录的时间范围为未知。...
    packageimg
  • 电商评论数据集电商评论数据集140000条-zeuss2k3

    2025年5月29日   

    电商评论数据集电商评论数据集140000条-zeuss2k3 数据来源:互联网公开数据 标签:电商评论,数据集,自然语言处理,文本分析,情感分析,消费者行为,市场研究,用户反馈 数据概述: 该数据集包含140,000条来自电商平台的商品评论数据,记录了消费者对商品的评价和反馈信息。主要特征如下: 时间跨度: 数据记录的时间范围从2018年到2022年。...
    packageimg
  • 印度语文件数据集HindiLanguageFilesDataset-sherinkk

    2025年5月29日   

    印度语文件数据集HindiLanguageFilesDataset-sherinkk 数据来源:互联网公开数据 标签:印度语,文本数据,数据集,自然语言处理,机器学习,语言研究,文本分析,多语言 数据概述: 该数据集包含来自印度语(Hindi)环境下的各类文本文件,记录了印度语在不同场景下的使用情况。主要特征如下:...
    packageimg
  • MBTI人格类型作者特征数据集MBTI作者特征数据集-arlene025

    2025年5月29日   

    MBTI人格类型作者特征数据集MBTI作者特征数据集-arlene025 数据来源:互联网公开数据 标签:MBTI人格类型,作者特征,数据集,心理学研究,文本分析,自然语言处理,机器学习,数据分析 数据概述: 该数据集包含来自互联网公开资源的文本数据,记录了不同MBTI人格类型的作者特征,适用于心理学研究、文本分析和机器学习等任务。主要特征如下:...
    packageimg
  • LSTM模型预训练数据文件数据集-cristianozhuo

    2025年5月29日   

    LSTM模型预训练数据文件数据集-cristianozhuo 数据来源:互联网公开数据 标签:深度学习,自然语言处理,LSTM,预训练,文本数据,数据集,序列建模,机器学习 数据概述: 该数据集包含用于LSTM(长短期记忆网络)模型预训练的文本数据,旨在为深度学习模型提供基础的语言知识。主要特征如下:...
    packageimg
  • 代码单元排序预测数据集CodeCellOrderingPredictionDataset-dragonzhang

    2025年5月29日   

    代码单元排序预测数据集CodeCellOrderingPredictionDataset-dragonzhang 数据来源:互联网公开数据 标签:代码单元, 排序预测, 机器学习, 自然语言处理, 代码分析, 数据集, Kaggle, Python 数据概述:...
    packageimg
  • 电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-dhruva786

    2025年5月29日   

    电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-dhruva786 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 电影评论, 情感极性, 机器学习, 数据标注, 情感识别 数据概述: 该数据集包含来自互联网的电影评论数据,记录了电影评论文本及其对应的情感极性标签。主要特征如下:...
    packageimg
  • 开放助手对话数据集OASST1-SL-valterh

    2025年5月29日   

    开放助手对话数据集OASST1-SL-valterh 数据来源:互联网公开数据 标签:对话数据,自然语言处理,机器学习,情感分析,文本生成,对话系统,开源,多语言 数据概述: 该数据集包含来自开放助手(Open Assistant)项目的对话数据,主要记录了用户与AI助手的多轮对话内容。主要特征如下:...
    packageimg
  • 印度新闻摘要文章数据集IndiaNewsSummaryArticleDataset-umangjjw

    2025年5月29日   

    印度新闻摘要文章数据集IndiaNewsSummaryArticleDataset-umangjjw 数据来源:互联网公开数据 标签:新闻摘要, 印度新闻, 文本摘要, 自然语言处理, 文本分析, 机器翻译, 语料库, 印度文化 数据概述: 该数据集包含来自印度新闻网站的文章及其摘要,旨在为自然语言处理和文本分析任务提供支持。主要特征如下:...
    packageimg
  • 深度学习实践教学案例数据集DeepLearningPracticeTeachingCaseDatasets-shi520chao

    2025年5月29日   

    深度学习实践教学案例数据集DeepLearningPracticeTeachingCaseDatasets-shi520chao 数据来源:互联网公开数据 标签:深度学习, 教学案例, 计算机视觉, 自然语言处理, 机器学习, 模型训练, 实践项目, MXNet, PaddlePaddle 数据概述:...
    packageimg
  • 文本摘要生成训练数据集TextSummarizationTrainingData-mridul3301

    2025年5月29日   

    文本摘要生成训练数据集TextSummarizationTrainingData-mridul3301 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 摘要生成, 数据集, 文本处理, 语料库 数据概述: 该数据集包含用于文本摘要生成的训练数据,记录了原文与其对应的摘要文本。主要特征如下:...
    packageimg
  • 招聘信息薪资预测数据集JobPostingSalaryPrediction-annatrofy

    2025年5月29日   

    招聘信息薪资预测数据集JobPostingSalaryPrediction-annatrofy 数据来源:互联网公开数据 标签:招聘信息, 薪资预测, 文本分析, 机器学习, 自然语言处理, 职位描述, 地理位置, 合同类型 数据概述:...
    packageimg
  • 英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn

    2025年5月29日   

    英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn 数据来源:互联网公开数据 标签:光学字符识别,文本处理,数据集,自然语言处理,机器学习,英语语言,标点符号,计算机视觉 数据概述: 该数据集专注于英国英语中的标点符号光学字符识别(OCR),记录了各种文档中的标点符号及其识别结果。主要特征如下:...
    packageimg
  • 餐饮评论分析数据集Yelp本地生活服务Dataset-tisage

    2025年5月29日   

    餐饮评论分析数据集Yelp本地生活服务Dataset-tisage 数据来源:互联网公开数据 标签:餐饮评论,数据集,自然语言处理,用户反馈,机器学习,商业分析,市场研究,用户体验 数据概述: 该数据集来自 Yelp 网站,主要记录了餐饮行业的用户评论数据,适用于评论分析、情感分析等任务。主要特征如下:...
    packageimg
  • 美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777

    2025年5月29日   

    美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777 数据来源:互联网公开数据 标签:政府文件,数据集,数据清洗,文本分析,自然语言处理,档案管理,信息检索,历史研究 数据概述: 该数据集包含来自美国国家档案馆(GA)的政府文件数据,记录了已清理的政府文件文本内容。主要特征如下:...
    packageimg
  • 阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb

    2025年5月29日   

    阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 社交媒体, 语言学, 情感分析, 语料库 数据概述:...
    packageimg
  • 社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab

    2025年5月29日   

    社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab 数据来源:互联网公开数据 标签:文本分析,有害言论,社交媒体,自然语言处理,机器学习,情感分析,文本分类,数据挖掘 数据概述: 该数据集包含了来自社交媒体平台的文本数据,用于有害言论检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,具体取决于原始数据来源。...
    packageimg
  • 社交媒体情绪分析推文数据集SocialMediaSentimentAnalysisTweets-atharvpatawar

    2025年5月29日   

    社交媒体情绪分析推文数据集SocialMediaSentimentAnalysisTweets-atharvpatawar 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 社交媒体, 推文, 自然语言处理, 情绪识别, 数据标注, 机器学习 数据概述: 该数据集包含来自Twitter的推文数据,记录了推文内容及其对应的情感极性。主要特征如下:...
    packageimg
  • 嵌入向量数据集EmbeddingsVectorsDataset-ahmedembedded

    2025年5月17日   

    嵌入向量数据集EmbeddingsVectorsDataset-ahmedembedded 数据来源:互联网公开数据 标签:嵌入向量, 机器学习, 深度学习, 自然语言处理, 模型训练, 特征工程, 数据分析, 向量空间 数据概述: 该数据集包含预计算的嵌入向量,用于表示数据中的特征。主要特征如下: 时间跨度:数据未明确时间戳,可视为静态嵌入向量集合。...
    packageimg
  • 新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064

    2025年5月29日   

    新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064 数据来源:互联网公开数据 标签:文本摘要, 新闻摘要, 自然语言处理, 文本生成, 机器翻译, 深度学习, 语料库, 摘要模型 数据概述:...
    packageimg