找到5,692个数据集

标签: 文本分析

过滤结果
  • 虚假与真实新闻分类数据集PreprocessedFakeandRealNewsDataset-bhuvanagayathri

    2025年5月30日   

    虚假与真实新闻分类数据集PreprocessedFakeandRealNewsDataset-bhuvanagayathri 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,信息辨别,深度学习,数据分析 数据概述: 该数据集包含经过预处理的虚假与真实新闻文本数据,记录了新闻文章的文本内容及其标签。主要特征如下:...
    packageimg
  • 句子嵌入模型数据集SBERTModelDataset-piyu2397

    2025年5月30日   

    句子嵌入模型数据集SBERTModelDataset-piyu2397 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语义相似度,深度学习,文本嵌入,语义理解 数据概述: 该数据集包含用于训练和评估句子嵌入模型(SBERT, 句子-BERT)的数据,记录了文本句子的嵌入向量及其相关属性。主要特征如下:...
    packageimg
  • 加密货币情感分析数据集CleanedCryptoSentimentAnalysisDataset-goddiao

    2025年5月30日   

    加密货币情感分析数据集CleanedCryptoSentimentAnalysisDataset-goddiao 数据来源:互联网公开数据 标签:加密货币,情感分析,数据集,文本分析,自然语言处理,金融科技,社交媒体,市场情绪 数据概述: 该数据集包含了从社交媒体平台(如Twitter)收集的关于加密货币的文本数据,并进行了情感分析。主要特征如下:...
    packageimg
  • 完整词典数据集Dict-Full-v1Dataset-phong2004

    2025年5月30日   

    完整词典数据集Dict-Full-v1Dataset-phong2004 数据来源:互联网公开数据 标签:词典,数据集,自然语言处理,词汇学,语言研究,机器学习,文本分析,教育技术 数据概述: 该数据集包含一个完整且经过整理的词典数据,记录了词汇及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围为词典的最近一次更新时间(具体年份未提供)。...
    packageimg
  • 儿童文学作品文本分析数据集Children-sLiteratureTextAnalysis-mamainwuxi

    2025年5月30日   

    儿童文学作品文本分析数据集Children-sLiteratureTextAnalysis-mamainwuxi 数据来源:互联网公开数据 标签:儿童文学, 文本分析, 情感分析, 图神经网络, 文本分类, 机器学习, 自然语言处理, 叙事结构 数据概述:...
    packageimg
  • 问答对相似度分析数据集QuestionPairSimilarityAnalysis-gmhost

    2025年5月30日   

    问答对相似度分析数据集QuestionPairSimilarityAnalysis-gmhost 数据来源:互联网公开数据 标签:问答对, 文本匹配, 相似度计算, 自然语言处理, 机器学习, 文本分析, 对比分析, 数据集 数据概述: 该数据集包含来自问答社区的文本数据,记录了问题对之间的相似度信息,可用于训练和评估文本匹配模型。主要特征如下:...
    packageimg
  • 刑事案件事实描述与判决数据集CriminalCaseFactsandJudgments-xieshuangyang

    2025年5月30日   

    刑事案件事实描述与判决数据集CriminalCaseFactsandJudgments-xieshuangyang 数据来源:互联网公开数据 标签:刑事案件, 判决文书, 事实描述, 法律文本, 文本分析, 自然语言处理, 案件分析, 司法数据 数据概述: 该数据集包含来自中国裁判文书网的刑事案件相关数据,记录了案件的事实描述和判决结果。主要特征如下:...
    packageimg
  • 歌词生成与自然语言处理数据集LyricsNanogptDataset-razaali10

    2025年5月30日   

    歌词生成与自然语言处理数据集LyricsNanogptDataset-razaali10 数据来源:互联网公开数据 标签:自然语言处理,歌词生成,数据集,文本分析,机器学习,深度学习,语言模型,文本生成 数据概述: 该数据集包含来自多个来源的歌词数据,记录了不同风格和类型的歌词文本。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。...
    packageimg
  • 阿拉伯语翻译数据集TranslationtoArabicDataset-elemam

    2025年5月30日   

    阿拉伯语翻译数据集TranslationtoArabicDataset-elemam 数据来源:互联网公开数据 标签:语言翻译,数据集,机器学习,自然语言处理,多语言,阿拉伯语,文本分析,人工智能 数据概述: 该数据集包含从多种语言翻译到阿拉伯语的文本数据,主要记录了不同语言到阿拉伯语的翻译样本。主要特征如下:...
    packageimg
  • 电影与相机产品属性关联分析数据集Movie-CameraProductAttributeCorrelationAnalysis-rimasalshehri

    2025年5月30日   

    电影与相机产品属性关联分析数据集Movie-CameraProductAttributeCorrelationAnalysis-rimasalshehri 数据来源:互联网公开数据 标签:电影数据, 电影属性, 相机数据, 相机参数, 数据关联, 文本分析, 机器学习, 行业分析 数据概述:...
    packageimg
  • 数学竞赛试题与答案数据集MathCompetitionProblemsandAnswers-konstantinboyko

    2025年5月30日   

    数学竞赛试题与答案数据集MathCompetitionProblemsandAnswers-konstantinboyko 数据来源:互联网公开数据 标签:数学竞赛, 试题, 答案, AIME, IMO, 文本分析, 数学教育, 数据集 数据概述: 该数据集包含来自数学竞赛的试题及其对应的解答,旨在为研究人员和学生提供学习和分析的资源。主要特征如下:...
    packageimg
  • 学术论文摘要文本分析数据集AcademicPaperAbstractTextAnalysis-sunidhiprakash

    2025年5月30日   

    学术论文摘要文本分析数据集AcademicPaperAbstractTextAnalysis-sunidhiprakash 数据来源:互联网公开数据 标签:文本分析, 学术研究, 自然语言处理, 论文摘要, 机器学习, 文本摘要, 计算机科学, 金融工程 数据概述:...
    packageimg
  • 视频字幕过滤数据集SubtitleFilteredDataset-hooong

    2025年5月30日   

    视频字幕过滤数据集SubtitleFilteredDataset-hooong 数据来源:互联网公开数据 标签:字幕,视频,文本分析,自然语言处理,数据集,内容过滤,机器学习,数据清洗 数据概述: 该数据集包含经过筛选和过滤的视频字幕数据,旨在用于文本分析、内容过滤和自然语言处理任务。主要特征如下:...
    packageimg
  • Airbnb房源与评论数据集AirbnbListingsandReviewsDataset-rahimzulfiqarali

    2025年5月30日   

    Airbnb房源与评论数据集AirbnbListingsandReviewsDataset-rahimzulfiqarali 数据来源:互联网公开数据 标签:住宿服务,旅游行业,数据集,用户评论,机器学习,数据挖掘,文本分析,旅游经济 数据概述:...
    packageimg
  • 查询扩展技术数据集QueryExpansionDataset-fallzqm

    2025年5月30日   

    查询扩展技术数据集QueryExpansionDataset-fallzqm 数据来源:互联网公开数据 标签:信息检索,查询扩展,数据集,自然语言处理,机器学习,搜索引擎,文本分析,人工智能 数据概述: 该数据集专注于查询扩展技术,记录了用户查询及其扩展后的相关查询信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 虚假新闻预处理数据集-gongjunmin

    2025年5月30日   

    虚假新闻预处理数据集-gongjunmin 数据来源:互联网公开数据 标签:虚假新闻,文本分析,自然语言处理,数据集,机器学习,新闻分类,信息检索,舆情分析 数据概述: 该数据集包含了经过预处理的虚假新闻数据,旨在用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖近年来新闻报道。...
    packageimg
  • 学生写作评估与生成文本数据集StudentEssayAssessmentandGeneratedTextDataset-conjuring92

    2025年5月30日   

    学生写作评估与生成文本数据集StudentEssayAssessmentandGeneratedTextDataset-conjuring92 数据来源:互联网公开数据 标签:文本生成, 写作评估, 机器学习, 自然语言处理, 文本分析, 情感分析, 教育, 写作风格 数据概述:...
    packageimg
  • 维基百科电影数据与互联网电影数据库IMDb信息关联数据集-takanami

    2025年5月30日   

    维基百科电影数据与互联网电影数据库IMDb信息关联数据集-takanami 数据来源:互联网公开数据 标签:电影,维基百科,IMDb,数据集,文本分析,信息检索,数据挖掘,关联分析 数据概述: 该数据集整合了维基百科电影条目信息和互联网电影数据库(IMDb)数据,记录了电影的详细信息及其关联。主要特征如下: 时间跨度:...
    packageimg
  • Reddit问答社区帖子数据集AskRedditDataset-gaganagarwal77

    2025年5月30日   

    Reddit问答社区帖子数据集AskRedditDataset-gaganagarwal77 数据来源:互联网公开数据 标签:问答社区,数据集,社交媒体,文本分析,自然语言处理,机器学习,网络行为,数据挖掘 数据概述:...
    packageimg
  • 堤坝巡查与管理文本数据集LeveePatrolandManagementTextDataset-ictworld

    2025年5月30日   

    堤坝巡查与管理文本数据集LeveePatrolandManagementTextDataset-ictworld 数据来源:互联网公开数据 标签:堤坝, 巡查, 管理, 水利, 文本分析, 自然语言处理, 越南语, 法规文件, 风险管理 数据概述: 该数据集包含来自越南相关法规文件的文本数据,记录了关于堤坝巡查与管理的相关规定和指导方针。主要特征如下:...
    packageimg