找到5,744个数据集

标签: 文本分析

过滤结果
  • ChatGPTReddit评论数据集ChatGPTRedditCommentsDataset-ermila

    2025年4月26日   

    ChatGPTReddit评论数据集ChatGPTRedditCommentsDataset-ermila 数据来源:互联网公开数据 标签:Reddit, 社交媒体, 评论数据, 机器学习, 自然语言处理, 文本分析, 人工智能, 社会研究 数据概述:该数据集包含来自Reddit社交平台的评论数据,记录了用户在不同子版块下的评论内容。主要特征如下:...
    packageimg
  • 谷歌专利大型语言模型数据集GooglePatentsLargeLanguageModelsDataset-andrssebastian

    2025年4月26日   

    谷歌专利大型语言模型数据集GooglePatentsLargeLanguageModelsDataset-andrssebastian 数据来源:互联网公开数据 标签:专利,大型语言模型,自然语言处理,数据集,机器学习,文本分析,知识产权,技术创新 数据概述:...
    packageimg
  • 英国议会辩论记录数据集HansardDataset-darisdzakwanhoesien2

    2025年4月26日   

    英国议会辩论记录数据集HansardDataset-darisdzakwanhoesien2 数据来源:互联网公开数据 标签:议会记录,辩论,文本分析,自然语言处理,政治学,数据集,语义分析,英国 数据概述:该数据集包含英国议会(House of Commons)的辩论记录,即Hansard记录。主要特征如下:...
    packageimg
  • 亚马逊产品评论与元数据数据集AmazonProductReviewsandMetadataDataset-devisriprasadpuvvala

    2025年4月26日   

    亚马逊产品评论与元数据数据集AmazonProductReviewsandMetadataDataset-devisriprasadpuvvala 数据来源:互联网公开数据 标签:电子商务,产品评论,数据集,文本分析,情感分析,机器学习,数据挖掘,商业智能 数据概述:...
    packageimg
  • 英语缩写与全称对照数据集EnglishContractionsDataset-hadimotamedi

    2025年4月26日   

    英语缩写与全称对照数据集EnglishContractionsDataset-hadimotamedi 数据来源:互联网公开数据 标签:语言学,数据集,文本分析,自然语言处理,英语学习,词法研究,教育工具,词典编纂 数据概述: 该数据集包含英语中常见的缩写形式及其对应的全称,记录了英语语言中的缩写用法及其原词。主要特征如下:...
    packageimg
  • 生成的学校作文数据集GeneratedSchoolEssaysDataset-ashishgargmp20

    2025年4月26日   

    生成的学校作文数据集GeneratedSchoolEssaysDataset-ashishgargmp20 数据来源:互联网公开数据 标签:作文生成,教育数据,自然语言处理,机器学习,教学资源,写作辅导,文本分析,人工智能 数据概述:该数据集包含由计算机生成的学校作文数据,记录了不同年级和科目的作文内容。主要特征如下:...
    packageimg
  • 高棉语文本数据集KhmerTextDataset123-layacheadeth

    2025年4月26日   

    高棉语文本数据集KhmerTextDataset123-layacheadeth 数据来源:互联网公开数据 标签:自然语言处理,文本分析,高棉语,机器学习,语言模型,数据集,多语言处理,文本分类 数据概述: 该数据集包含来自互联网的高棉语文本数据,记录了高棉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。...
    packageimg
  • 论文摘要数据集PaperDTSDataset-nbviet

    2025年4月26日   

    论文摘要数据集PaperDTSDataset-nbviet 数据来源:互联网公开数据 标签:论文,摘要,数据集,文本分析,自然语言处理,机器学习,学术研究,信息检索 数据概述: 该数据集包含来自Paper DTS的数据,记录了论文的摘要信息。主要特征如下: 时间跨度:数据记录的时间范围为不详。 地理范围:数据覆盖范围不详。...
    packageimg
  • 自然语言处理论文摘要数据集ACLDataset-ch4itanyap4ndey

    2025年4月26日   

    自然语言处理论文摘要数据集ACLDataset-ch4itanyap4ndey 数据来源:互联网公开数据 标签:自然语言处理,NLP,论文,数据集,文本分析,机器学习,学术研究,摘要 数据概述:该数据集包含来自ACL (Association for Computational Linguistics,计算语言学协会)...
    packageimg
  • 语言分类数据集LanguageClassificationDataset-jhaamanvaibhav

    2025年4月26日   

    语言分类数据集LanguageClassificationDataset-jhaamanvaibhav 数据来源:互联网公开数据 标签:语言分类,自然语言处理,数据集,机器学习,文本分析,多语言,数据挖掘,文本分类 数据概述: 该数据集包含来自多个来源的语言分类数据,记录了不同语言的文本样本及其对应的语言标签。主要特征如下:...
    packageimg
  • 团队项目文件包数据集GroupProjectFilePackageDataset-andrew06

    2025年4月26日   

    团队项目文件包数据集GroupProjectFilePackageDataset-andrew06 数据来源:互联网公开数据 标签:团队协作,文件管理,数据集,项目管理,文本分析,数据挖掘,社交网络,协作效率 数据概述: 该数据集包含与团队项目相关的文件包数据,记录了团队成员在项目协作过程中产生的文件信息。主要特征如下:...
    packageimg
  • 姓名与性别分类数据集GenderClassificationbyNameandGenderDataset-noorulainashraf

    2025年4月26日   

    姓名与性别分类数据集GenderClassificationbyNameandGenderDataset-noorulainashraf 数据来源:互联网公开数据 标签:性别分类,姓名分析,数据集,机器学习,文本分析,社会研究,自然语言处理,人口统计 数据概述:...
    packageimg
  • 宗教文本数据集ReligiousTextsDataset-mahitnandanad

    2025年4月26日   

    宗教文本数据集ReligiousTextsDataset-mahitnandanad 数据来源:互联网公开数据 标签:宗教,文本分析,数据集,文献研究,自然语言处理,文化研究,历史研究,学术资源 数据概述: 该数据集包含来自多种宗教的经典文本,记录了不同宗教的教义,历史和文化内容。主要特征如下: 时间跨度:数据记录的时间范围从古代到现代。...
    packageimg
  • Facebook内容摘要数据集Facebook内容摘要数据集-snehajadeja

    2025年4月26日   

    Facebook内容摘要数据集Facebook内容摘要数据集-snehajadeja 数据来源:互联网公开数据 标签:社交网络,内容摘要,数据集,自然语言处理,机器学习,文本分析,社交媒体,信息提取 数据概述:该数据集包含来自Facebook的内容摘要数据,记录了用户发布内容的摘要信息。主要特征如下:...
    packageimg
  • 作文评分数据集EssayScoringDataset-pulakamsrilakshmi

    2025年4月26日   

    作文评分数据集EssayScoringDataset-pulakamsrilakshmi 数据来源:互联网公开数据 标签:教育技术,自然语言处理,机器学习,评分系统,文本分析,数据集,教育研究,人工智能 数据概述: 该数据集包含来自作文评分系统的数据,记录了学生作文及其对应的评分信息。主要特征如下:...
    packageimg
  • 乌尔都语文本词频统计数据集-乌尔都语文本语料库

    2025年4月26日   

    乌尔都语文本词频统计数据集-乌尔都语文本语料库 数据来源:互联网公开数据 标签:乌尔都语,文本分析,自然语言处理,词频统计,语料库,语言学,N-gram 数据概述: 本数据集基于在线报纸和书籍的抓取构建的乌尔都语语料库,包含了不同长度的N-gram及其对应的出现频率。数据文件包括:...
    packageimg
  • 食品评论情感分析数据集SentimentAnalysisFoodReviewsDataset-cngkhutnguyn

    2025年4月26日   

    食品评论情感分析数据集SentimentAnalysisFoodReviewsDataset-cngkhutnguyn 数据来源:互联网公开数据 标签:情感分析,食品评论,数据集,自然语言处理,机器学习,消费者行为,文本分析,市场研究 数据概述: 该数据集包含来自食品评论网站或平台的用户评论数据,记录了消费者对食品产品的评价和情感倾向。主要特征如下:...
    packageimg
  • GPT-2模型训练数据集EP2-LR8e5-blackitten13

    2025年4月26日   

    GPT-2模型训练数据集EP2-LR8e5-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,GPT-2,机器学习,模型训练,语言模型,文本分析 数据概述: 该数据集用于训练 GPT-2 模型,由 EP2 (Epoch 2) 和 LR8e5 (Learning Rate 8e-5)...
    packageimg
  • CommonLit阅读理解文章可读性数据集-chiraggodaw

    2025年4月26日   

    CommonLit阅读理解文章可读性数据集-chiraggodaw 数据来源:互联网公开数据 标签:阅读理解,可读性,数据集,自然语言处理,文本分析,教育,机器学习,语言评估 数据概述: 该数据集包含了来自CommonLit平台的中小学阅读理解文章,以及它们的可读性评分。主要特征如下: 时间跨度: 数据记录的时间范围涵盖了多个学年。 地理范围:...
    packageimg
  • 论文评分数据集EssayScoringDataset-caokhoihuynh

    2025年4月26日   

    论文评分数据集EssayScoringDataset-caokhoihuynh 数据来源:互联网公开数据 标签:论文,写作,评分,数据集,自然语言处理,文本分析,教育,机器学习 数据概述: 该数据集包含学生的论文及其对应的评分信息,旨在用于论文评分模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了学生写作的多个年份。...
    packageimg