找到5,725个数据集

标签: 文本分析

过滤结果
  • 机器翻译训练与评估数据集NMTTranslationDataset-jeevats

    2025年5月29日   

    机器翻译训练与评估数据集NMTTranslationDataset-jeevats 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,翻译模型,文本分析,多语言,深度学习,人工智能 数据概述: 该数据集包含用于机器翻译任务的双语平行文本数据,记录了源语言和目标语言之间的翻译对。主要特征如下:...
    packageimg
  • 孟加拉语语音信号质量评估数据集BengaliSpeechSignalQualityAssessment-tianzili

    2025年5月29日   

    孟加拉语语音信号质量评估数据集BengaliSpeechSignalQualityAssessment-tianzili 数据来源:互联网公开数据 标签:语音识别, 信号处理, 孟加拉语, 信噪比, 文本分析, 语音质量, 机器学习, 数据标注 数据概述:...
    packageimg
  • 基于LLM的深度伪造文本检测数据集-dileepjayamal

    2025年5月29日   

    基于LLM的深度伪造文本检测数据集-dileepjayamal 数据来源:互联网公开数据 标签:LLM,深度伪造,文本检测,数据集,自然语言处理,机器学习,人工智能,文本分析 数据概述: 该数据集包含了由大型语言模型(LLM)生成的深度伪造文本,旨在用于检测和识别这些虚假文本。主要特征如下:...
    packageimg
  • 电影评论数据集MovieCriticismDataset-mrriandmstique

    2025年5月29日   

    电影评论数据集MovieCriticismDataset-mrriandmstique 数据来源:互联网公开数据 标签:电影评论,数据集,文本分析,情感分析,自然语言处理,电影研究,文化研究,社会学 数据概述:该数据集包含来自互联网公开资源的电影评论数据,记录了各类电影的评论内容及评分信息。主要特征如下:...
    packageimg
  • 文本主题演化分析数据集TextTopicEvolutionAnalysis-mengjie12138

    2025年5月29日   

    文本主题演化分析数据集TextTopicEvolutionAnalysis-mengjie12138 数据来源:互联网公开数据 标签:主题建模, 文本分析, 动态主题, 时间序列分析, 词频统计, 文本挖掘, 自然语言处理, 数据可视化 数据概述: 该数据集包含从未知来源收集的文本数据,并经过处理,用于研究文本主题随时间的变化。主要特征如下:...
    packageimg
  • 孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif

    2025年5月29日   

    孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,语言模型,文本分析,机器翻译,文本生成 数据概述: 该数据集包含孟加拉语文本的摘要数据,记录了孟加拉语文章及其对应的摘要信息。主要特征如下:...
    packageimg
  • 智能合约安全漏洞检测数据集SmartContractSecurityVulnerabilityDetectionDataset-hoangnahd

    2025年5月29日   

    智能合约安全漏洞检测数据集SmartContractSecurityVulnerabilityDetectionDataset-hoangnahd 数据来源:互联网公开数据 标签:智能合约, 安全漏洞, 静态分析, 机器学习, 文本分析, 以太坊, 形式验证, 代码审计 数据概述:...
    packageimg
  • 印度尼西亚新闻社交媒体文本数据集IndonesiaNewsSocialMediaText-iannarsa

    2025年5月29日   

    印度尼西亚新闻社交媒体文本数据集IndonesiaNewsSocialMediaText-iannarsa 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 新闻内容, 舆情分析, 情感分析, 印度尼西亚, 语言处理, 传播分析 数据概述:...
    packageimg
  • 阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextA...

    2025年5月29日   

    阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextAnalysis-ibrahim2002 数据来源:互联网公开数据 标签:阿拉伯语, 问答系统, 文本分析, 信息检索, 事实判断, 自然语言处理, 机器阅读理解, 数据集 数据概述:...
    packageimg
  • 维基文库标题草稿数据集ZhWikiSourceTitleDraftDataset-raynardj

    2025年5月29日   

    维基文库标题草稿数据集ZhWikiSourceTitleDraftDataset-raynardj 数据来源:互联网公开数据 标签:维基文库,标题,草稿,文本分析,自然语言处理,数据集,中文,语料库 数据概述: 该数据集包含来自维基文库(ZhWikiSource)的标题草稿数据,记录了维基文库中标题草稿的详细信息。主要特征如下:...
    packageimg
  • Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555

    2025年5月29日   

    Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:文本数据,翻译,评论,自然语言处理,机器学习,多语言,文本分析,情感分析 数据概述: 该数据集来自 Jigsaw 竞赛,主要包含了经过翻译的评论文本,旨在用于多语言环境下的有害评论检测任务。主要特征如下:...
    packageimg
  • 有毒评论文本分析数据集ToxicCommentClassificationChallengeDataset-toru59er

    2025年5月29日   

    有毒评论文本分析数据集ToxicCommentClassificationChallengeDataset-toru59er 数据来源:互联网公开数据 标签:文本分析,情感分析,自然语言处理,机器学习,毒性检测,评论分类,深度学习,数据竞赛 数据概述: 该数据集来自 Kaggle...
    packageimg
  • 电商评论数据集电商评论数据集140000条-zeuss2k3

    2025年5月29日   

    电商评论数据集电商评论数据集140000条-zeuss2k3 数据来源:互联网公开数据 标签:电商评论,数据集,自然语言处理,文本分析,情感分析,消费者行为,市场研究,用户反馈 数据概述: 该数据集包含140,000条来自电商平台的商品评论数据,记录了消费者对商品的评价和反馈信息。主要特征如下: 时间跨度: 数据记录的时间范围从2018年到2022年。...
    packageimg
  • 印度语文件数据集HindiLanguageFilesDataset-sherinkk

    2025年5月29日   

    印度语文件数据集HindiLanguageFilesDataset-sherinkk 数据来源:互联网公开数据 标签:印度语,文本数据,数据集,自然语言处理,机器学习,语言研究,文本分析,多语言 数据概述: 该数据集包含来自印度语(Hindi)环境下的各类文本文件,记录了印度语在不同场景下的使用情况。主要特征如下:...
    packageimg
  • MBTI人格类型作者特征数据集MBTI作者特征数据集-arlene025

    2025年5月29日   

    MBTI人格类型作者特征数据集MBTI作者特征数据集-arlene025 数据来源:互联网公开数据 标签:MBTI人格类型,作者特征,数据集,心理学研究,文本分析,自然语言处理,机器学习,数据分析 数据概述: 该数据集包含来自互联网公开资源的文本数据,记录了不同MBTI人格类型的作者特征,适用于心理学研究、文本分析和机器学习等任务。主要特征如下:...
    packageimg
  • 印度新闻摘要文章数据集IndiaNewsSummaryArticleDataset-umangjjw

    2025年5月29日   

    印度新闻摘要文章数据集IndiaNewsSummaryArticleDataset-umangjjw 数据来源:互联网公开数据 标签:新闻摘要, 印度新闻, 文本摘要, 自然语言处理, 文本分析, 机器翻译, 语料库, 印度文化 数据概述: 该数据集包含来自印度新闻网站的文章及其摘要,旨在为自然语言处理和文本分析任务提供支持。主要特征如下:...
    packageimg
  • 招聘信息薪资预测数据集JobPostingSalaryPrediction-annatrofy

    2025年5月29日   

    招聘信息薪资预测数据集JobPostingSalaryPrediction-annatrofy 数据来源:互联网公开数据 标签:招聘信息, 薪资预测, 文本分析, 机器学习, 自然语言处理, 职位描述, 地理位置, 合同类型 数据概述:...
    packageimg
  • 美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777

    2025年5月29日   

    美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777 数据来源:互联网公开数据 标签:政府文件,数据集,数据清洗,文本分析,自然语言处理,档案管理,信息检索,历史研究 数据概述: 该数据集包含来自美国国家档案馆(GA)的政府文件数据,记录了已清理的政府文件文本内容。主要特征如下:...
    packageimg
  • 新冠疫情新闻主题分析数据集COVID-19NewsTopicAnalysis-tirikford

    2025年5月29日   

    新冠疫情新闻主题分析数据集COVID-19NewsTopicAnalysis-tirikford 数据来源:互联网公开数据 标签:新冠疫情, 文本分析, 主题模型, LDA, 新闻文章, 疫情传播, 舆情分析, 数据可视化 数据概述: 该数据集包含来自新闻媒体关于新冠疫情的报道文章,记录了文章内容及其主题分布。主要特征如下:...
    packageimg
  • 社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab

    2025年5月29日   

    社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab 数据来源:互联网公开数据 标签:文本分析,有害言论,社交媒体,自然语言处理,机器学习,情感分析,文本分类,数据挖掘 数据概述: 该数据集包含了来自社交媒体平台的文本数据,用于有害言论检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,具体取决于原始数据来源。...
    packageimg