找到10,965个数据集

标签: TXT

过滤结果
  • 组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet

    2025年4月24日   

    组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet 数据来源:互联网公开数据 标签:故事文本,数据集,自然语言处理,文本分析,机器学习,文本生成,数据分析,语言模型 数据概述: 该数据集包含来自多个来源的组合故事文本数据,记录了各类故事文本的内容和结构。主要特征如下:...
    packageimg
  • HMS竞赛排行榜数据集HMSLeaderboardDataset-samvelkoch

    2025年4月24日   

    HMS竞赛排行榜数据集HMSLeaderboardDataset-samvelkoch 数据来源:互联网公开数据 标签:医疗,竞赛,排行榜,数据集,机器学习,疾病预测,数据分析,医学研究 数据概述: 该数据集包含了HMS(Huma Medical System)竞赛的排行榜数据,记录了参赛者在疾病预测任务中的表现。主要特征如下:...
    packageimg
  • 维基百科句子数据集WikiSentencesV2-ranjitp20

    2025年4月24日   

    维基百科句子数据集WikiSentencesV2-ranjitp20 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言模型,文本语料库,信息检索,机器学习,文本摘要 数据概述: 该数据集包含了来自维基百科的句子,旨在为自然语言处理任务提供大规模文本语料库。主要特征如下:...
    packageimg
  • 夜曲乐队歌词主题演变分析数据集1996-2020-crazyrichbayesians

    2025年4月24日   

    夜曲乐队歌词主题演变分析数据集1996-2020-crazyrichbayesians 数据来源:互联网公开数据 标签:夜曲乐队,歌词分析,主题演变,音乐,芬兰,欧洲金属,文本挖掘,数据分析 数据概述:...
    packageimg
  • 拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot

    2025年4月24日   

    拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,数据集,文本分割,语言处理,数据挖掘,历史文献,自然语言处理,语言学研究 数据概述: 该数据集包含拉丁语的文本分割数据,记录了拉丁语文本的分割和标注信息。主要特征如下:...
    packageimg
  • Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane

    2025年4月23日   

    Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,机器学习,文本分析,深度学习,语义理解,人工智能 数据概述: 该数据集包含Solon词嵌入模型生成的词向量数据,记录了大量词汇在多维空间中的表示。主要特征如下:...
    packageimg
  • Ansys软件结构动力学仿真数据集-qinpeichao

    2025年4月23日   

    Ansys软件结构动力学仿真数据集-qinpeichao 数据来源:互联网公开数据 标签:结构动力学,有限元分析,仿真,Ansys,振动,模态分析,数据集,工程应用 数据概述:该数据集包含Ansys软件进行的结构动力学仿真结果,记录了不同结构在各种载荷条件下的动力学响应。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同结构在不同工况下的仿真结果。...
    packageimg
  • 用户评论情感分析训练数据集TrainDataProcessed-UserReviewSentimentAnalysisDataset-liangjingxin

    2025年4月23日   

    用户评论情感分析训练数据集TrainDataProcessed-UserReviewSentimentAnalysisDataset-liangjingxin 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,用户评论,文本挖掘,机器学习,情感分类,中文...
    packageimg
  • 训练模型修改上下文数据集TrainingModelModifiedContextDataset-pandaslambda

    2025年4月23日   

    训练模型修改上下文数据集TrainingModelModifiedContextDataset-pandaslambda 数据来源:互联网公开数据 标签:机器学习,自然语言处理,数据集,模型训练,文本分析,上下文理解,深度学习,人工智能 数据概述: 该数据集包含用于训练和修改模型上下文的数据,记录了用于提升模型理解和生成能力的文本数据。主要特征如下:...
    packageimg
  • 文学作品按体裁分类数据集-mehedihasan9021

    2025年4月23日   

    文学作品按体裁分类数据集-mehedihasan9021 数据来源:互联网公开数据 标签:文学,数据集,文本分析,自然语言处理,情感分析,分类,语料库,文本挖掘 数据概述: 该数据集包含按体裁分类的文学作品数据,旨在为文本分析和自然语言处理研究提供丰富的语料。主要特征如下: 时间跨度:数据涵盖不同时期和时代的文学作品。...
    packageimg
  • 印地语维基百科数据集HindiWikipediaDataset-vjdwary

    2025年4月23日   

    印地语维基百科数据集HindiWikipediaDataset-vjdwary 数据来源:互联网公开数据 标签:维基百科,印地语,数据集,自然语言处理,文本分析,机器学习,语言资源,多语言处理 数据概述: 该数据集包含来自印地语维基百科的文本数据,记录了维基百科上的文章内容。主要特征如下:...
    packageimg
  • 英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas

    2025年4月23日   

    英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,语言模型,文本分析,多语言,人工智能 数据概述: 该数据集包含英语到孟加拉语的平行语料,记录了双语翻译的对应句子。主要特征如下:...
    packageimg
  • Telegram电报垃圾消息检测数据集-kartikaytandon

    2025年4月23日   

    Telegram电报垃圾消息检测数据集-kartikaytandon 数据来源:互联网公开数据 标签:垃圾消息,电报,数据集,自然语言处理,机器学习,文本分类,社交媒体,信息安全 数据概述:该数据集包含了来自 Telegram 电报平台的垃圾消息数据,旨在用于垃圾消息检测和分类。主要特征如下:...
    packageimg
  • 伦理考量相关数据集-nasifsafwan

    2025年4月23日   

    伦理考量相关数据集-nasifsafwan 数据来源:互联网公开数据 标签:伦理学,数据集,社会科学,机器学习,偏见,公平性,人工智能伦理,数据隐私 数据概述: 该数据集包含了与伦理考量相关的数据,旨在促进对伦理问题的研究和分析。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时期的数据。 地理范围:...
    packageimg
  • 自然语言处理数据集NLP数据集-mkmanoj353

    2025年4月23日   

    自然语言处理数据集NLP数据集-mkmanoj353 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述:该数据集包含来自多个来源的自然语言处理数据,记录了大量文本数据以支持各种NLP任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 印尼语语料库文本数据集LanguageSetfromKorpusNusantara-ahmdfkhr3

    2025年4月23日   

    印尼语语料库文本数据集LanguageSetfromKorpusNusantara-ahmdfkhr3 数据来源:互联网公开数据 标签:印尼语,语料库,文本数据,自然语言处理,语言学,词汇分析,文本挖掘,机器学习 数据概述: 该数据集收录了来自印尼语语料库 Nusantara (Korpus Nusantara)...
    packageimg
  • 中文情感分析数据集ChnSentiCorp-HTL-AllDataset-honyuu

    2025年4月23日   

    中文情感分析数据集ChnSentiCorp-HTL-AllDataset-honyuu 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本分类,中文,数据集,评论,机器学习,情感识别 数据概述: 该数据集包含来自ChnSentiCorp的中文情感分析数据,涵盖了酒店评论文本。主要特征如下:...
    packageimg
  • 波斯语翻译英语验证数据集ParsinluTranslationEN-FAValidationDataset-nouriehmadanian

    2025年4月23日   

    波斯语翻译英语验证数据集ParsinluTranslationEN-FAValidationDataset-nouriehmadanian 数据来源:互联网公开数据 标签:机器翻译,波斯语,英语,数据集,自然语言处理,文本翻译,语言学,验证 数据概述: 该数据集包含来自Parsinlu项目,用于验证波斯语到英语翻译模型的性能。主要特征如下:...
    packageimg
  • 数独图像与解答数据集SudokuImagewithSolutionDataset-amarlove

    2025年4月23日   

    数独图像与解答数据集SudokuImagewithSolutionDataset-amarlove 数据来源:互联网公开数据 标签:图像处理,数独,数据集,计算机视觉,机器学习,图像识别,人工智能,数学教育 数据概述: 该数据集包含数独游戏的图像及其对应的解答,记录了数独题目图片和正确解答的组合。主要特征如下:...
    packageimg
  • 测井数据分析数据集-syedhuzaifaahmed

    2025年4月23日   

    测井数据分析数据集-syedhuzaifaahmed 数据来源:互联网公开数据 标签:测井,油气勘探,地球物理,数据集,岩性识别,机器学习,数据分析,地质工程 数据概述:该数据集包含测井数据,记录了井下地层岩石的物理性质信息。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于具体测井数据的采集时间。...
    packageimg