找到5,692个数据集

标签: 文本分析

过滤结果
  • 文本连贯性评估伪标签数据集TextCoherenceEvaluationPseudo-labelingDataset-abdulkadirguner

    2025年5月30日   

    文本连贯性评估伪标签数据集TextCoherenceEvaluationPseudo-labelingDataset-abdulkadirguner 数据来源:互联网公开数据 标签:文本连贯性, 自然语言处理, 伪标签, 文本分析, 机器学习, 文本特征, 语篇分析, 模型预测 数据概述:...
    packageimg
  • 问答质量评估数据集QuestionAnsweringQualityAssessment-adityaecdrid

    2025年5月30日   

    问答质量评估数据集QuestionAnsweringQualityAssessment-adityaecdrid 数据来源:互联网公开数据 标签:问答系统, 文本分析, 质量评估, 机器学习, 自然语言处理, 深度学习, 模型训练, 预测 数据概述: 该数据集包含用于评估问答对质量的结构化数据,主要用于训练和测试问答质量评估模型。主要特征如下:...
    packageimg
  • 乌克兰公共采购推荐系统数据集ZakupkiHackRecSysDataset-mrmorj

    2025年5月30日   

    乌克兰公共采购推荐系统数据集ZakupkiHackRecSysDataset-mrmorj 数据来源:互联网公开数据 标签:采购数据,推荐系统,机器学习,乌克兰,公共部门,文本分析,数据集,自然语言处理 数据概述: 该数据集源于乌克兰公共采购平台 Zakupki.Pro,记录了乌克兰公共部门的采购信息,主要用于构建推荐系统。主要特征如下:...
    packageimg
  • 众筹项目文本与结果分析数据集CrowdfundingProjectTextandOutcomeAnalysis-antonionoca

    2025年5月30日   

    众筹项目文本与结果分析数据集CrowdfundingProjectTextandOutcomeAnalysis-antonionoca 数据来源:互联网公开数据 标签:众筹,项目分析,文本分析,项目状态,自然语言处理,文本特征,项目成功率,机器学习 数据概述:...
    packageimg
  • 维基百科STEM领域文章数据集Wiki17kSTEMArticlesDataset-manchvictor

    2025年5月30日   

    维基百科STEM领域文章数据集Wiki17kSTEMArticlesDataset-manchvictor 数据来源:互联网公开数据 标签:维基百科,STEM,数据集,文本分析,自然语言处理,机器学习,学术资源,科学教育 数据概述:该数据集包含来自维基百科的STEM领域文章,记录了17000多篇与科学、技术、工程和数学相关的内容。主要特征如下:...
    packageimg
  • 基于BERT的论文嵌入数据集BERTEmbeddingsforEssayDataset-byrdofafeather

    2025年5月30日   

    基于BERT的论文嵌入数据集BERTEmbeddingsforEssayDataset-byrdofafeather 数据来源:互联网公开数据 标签:自然语言处理,文本分析,论文写作,深度学习,BERT,数据集,文本嵌入,学术研究 数据概述: 该数据集包含了使用BERT模型生成的论文嵌入向量,旨在为论文写作、文本分析等任务提供支持。主要特征如下:...
    packageimg
  • 语言模型系统大规模数据集LMSys72KDataset-qinhaoyang

    2025年5月30日   

    语言模型系统大规模数据集LMSys72KDataset-qinhaoyang 数据来源:互联网公开数据 标签:语言模型,自然语言处理,数据集,机器学习,文本分析,人工智能,大数据,文本生成 数据概述: 该数据集由LMSys项目提供,包含大规模的文本数据,适用于语言模型训练、自然语言处理及文本生成等任务。主要特征如下:...
    packageimg
  • 文本分析与自然语言处理数据集TextAnalysisandNLPDataset-jayjinnie

    2025年5月30日   

    文本分析与自然语言处理数据集TextAnalysisandNLPDataset-jayjinnie 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,机器学习,情感分析,文本分类,语言模型,信息提取 数据概述: 该数据集包含来自多个来源的文本数据,记录了各类文本内容及其相关属性。主要特征如下:...
    packageimg
  • 求职平台职位描述数据集IndeedJobDescriptionsDataset-sophiatu2

    2025年5月30日   

    求职平台职位描述数据集IndeedJobDescriptionsDataset-sophiatu2 数据来源:互联网公开数据 标签:人力资源,职位描述,数据集,文本分析,机器学习,职业发展,数据挖掘,自然语言处理 数据概述: 该数据集包含来自求职平台Indeed的职位描述数据,记录了不同行业和地区的招聘信息。主要特征如下:...
    packageimg
  • 越南股市新闻数据集VietnameseStockNewsDataset-frozenrainbow

    2025年5月30日   

    越南股市新闻数据集VietnameseStockNewsDataset-frozenrainbow 数据来源:互联网公开数据 标签:股市新闻,数据集,金融市场,自然语言处理,投资分析,经济研究,文本分析,机器学习 数据概述:该数据集包含来自越南多个新闻媒体的股市相关新闻报道,记录了关于越南股市的最新动态、公司财报、市场分析等信息。主要特征如下:...
    packageimg
  • Mercari商品价格预测数据集-illgorhek

    2025年5月30日   

    Mercari商品价格预测数据集-illgorhek 数据来源:互联网公开数据 标签:电商,价格预测,数据集,机器学习,商品销售,自然语言处理,文本分析,推荐系统 数据概述: 该数据集包含来自Mercari电商平台上的商品信息,用于商品价格预测。主要特征如下: 时间跨度:数据记录的时间跨度未知,具体取决于数据集的发布时间。...
    packageimg
  • 机器翻译Transformer模型数据集TransformerMTDataset-doltinukuid

    2025年5月30日   

    机器翻译Transformer模型数据集TransformerMTDataset-doltinukuid 数据来源:互联网公开数据 标签:机器翻译,Transformer,数据集,自然语言处理,深度学习,语言学,人工智能,文本分析...
    packageimg
  • 俄罗斯新闻文本数据集Lenta-FontankaDataset-hosstell

    2025年5月30日   

    俄罗斯新闻文本数据集Lenta-FontankaDataset-hosstell 数据来源:互联网公开数据 标签:新闻文本,自然语言处理,文本分析,情感分析,俄语,数据集,文本分类,信息检索 数据概述: 该数据集包含了来自Lenta.ru和Fontanka.ru两个俄罗斯新闻网站的文本数据,记录了新闻文章的详细信息。主要特征如下:...
    packageimg
  • 文本毒性分类数据集-chenxidong

    2025年5月30日   

    文本毒性分类数据集-chenxidong 数据来源:互联网公开数据 标签:文本分类,毒性检测,自然语言处理,机器学习,情感分析,文本分析,数据安全,社交媒体 数据概述: 该数据集包含了大量的文本数据,并标注了文本的毒性程度,旨在用于训练和评估文本毒性分类模型。主要特征如下: 时间跨度:...
    packageimg
  • 网页抓取数据集CrawlData-fdfyaytkt

    2025年5月30日   

    网页抓取数据集CrawlData-fdfyaytkt 数据来源:互联网公开数据 标签:网页抓取,数据集,文本分析,自然语言处理,网络数据,信息检索,数据挖掘,网络爬虫 数据概述: 该数据集包含了从互联网上抓取到的网页内容数据,涵盖了各种主题和来源。主要特征如下: 时间跨度: 数据记录的时间范围不定,取决于网页抓取的具体时间。 地理范围:...
    packageimg
  • 有价值沟通数据集ValuableCommunicationDataset-yarome

    2025年5月30日   

    有价值沟通数据集ValuableCommunicationDataset-yarome 数据来源:互联网公开数据 标签:沟通研究,数据集,社交媒体,文本分析,情感分析,自然语言处理,心理学,数据挖掘 数据概述:该数据集包含来自社交媒体平台的有价值沟通数据,记录了用户之间的交流信息。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2021年。...
    packageimg
  • 商品销售价格预测数据集ProductSalesPricePrediction-drewsy1991

    2025年5月30日   

    商品销售价格预测数据集ProductSalesPricePrediction-drewsy1991 数据来源:互联网公开数据 标签:商品销售, 价格预测, 机器学习, 文本分析, 商品描述, 电商, 零售, 数据挖掘 数据概述:...
    packageimg
  • 新冠疫情常见问题解答数据集COVID-19FAQsDataset-mohankrishnan02

    2025年5月30日   

    新冠疫情常见问题解答数据集COVID-19FAQsDataset-mohankrishnan02 数据来源:互联网公开数据 标签:新冠疫情,FAQ,问答,数据集,自然语言处理,文本分析,健康,公共卫生 数据概述: 该数据集包含了关于新冠疫情的常见问题与解答,旨在提供关于COVID-19的全面信息。主要特征如下:...
    packageimg
  • 甲状腺手术相关医学文献数据集ThyroidSurgeryMedicalLiteratureDataset-emirhancelik

    2025年5月30日   

    甲状腺手术相关医学文献数据集ThyroidSurgeryMedicalLiteratureDataset-emirhancelik 数据来源:互联网公开数据 标签:医学文献, 甲状腺手术, 儿童, 手术结果, 临床研究, 文本分析, 医疗健康, 数据挖掘 数据概述: 该数据集包含来自医学文献的数据,记录了儿童甲状腺手术的相关信息。主要特征如下:...
    packageimg
  • 图像描述词频统计数据集ImageDescriptionWordFrequencyStatistics-ritchie46

    2025年5月30日   

    图像描述词频统计数据集ImageDescriptionWordFrequencyStatistics-ritchie46 数据来源:互联网公开数据 标签:图像描述, 词频统计, 文本分析, 自然语言处理, 计算机视觉, 语料库, 数据挖掘, 图像检索 数据概述:...
    packageimg