找到5,744个数据集

标签: 文本分析

过滤结果
  • 英语写作关联特征训练数据集-kentakikuhi

    2025年4月25日   

    英语写作关联特征训练数据集-kentakikuhi 数据来源:互联网公开数据 标签:英语写作,数据集,自然语言处理,文本分析,机器学习,语言模型,写作质量,关联特征 数据概述: 该数据集包含了用于训练英语写作关联特征的数据,旨在提升写作质量和理解写作模式。主要特征如下: 时间跨度:数据没有明确的时间跨度,但通常涵盖现代英语写作。...
    packageimg
  • 股票市场推文数据集StockTweetsDataset-anku97

    2025年4月25日   

    股票市场推文数据集StockTweetsDataset-anku97 数据来源:互联网公开数据 标签:股票市场,推文,社交媒体,情感分析,自然语言处理,文本分析,金融科技,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的股票市场相关推文,记录了用户对不同股票的观点和讨论。主要特征如下:...
    packageimg
  • 基于推特的性别暴力数据集Gender-BasedViolenceTwitterDataset-rouansiri

    2025年4月25日   

    基于推特的性别暴力数据集Gender-BasedViolenceTwitterDataset-rouansiri 数据来源:互联网公开数据 标签:性别暴力,推特数据,文本分析,自然语言处理,社会科学,情感分析,机器学习,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了与性别暴力相关的推文内容。主要特征如下:...
    packageimg
  • 自然语言处理任务问答数据集NewQAT5Dataset-hritik619916

    2025年4月25日   

    自然语言处理任务问答数据集NewQAT5Dataset-hritik619916 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,信息检索,深度学习,人工智能 数据概述:该数据集包含来自多个来源的问答对数据,适用于自然语言处理领域的问答系统训练和研究。主要特征如下:...
    packageimg
  • 垃圾邮件分类数据集EmailSpamClassificationDataset-harshsinha1234

    2025年4月25日   

    垃圾邮件分类数据集EmailSpamClassificationDataset-harshsinha1234 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,文本分析,机器学习,自然语言处理,文本挖掘,数据预处理,信息检索 数据概述: 该数据集包含来自互联网的电子邮件数据,用于垃圾邮件的分类研究。主要特征如下:...
    packageimg
  • 代码资源来源数据集CodeJit-SourceDataset-ducanger

    2025年4月25日   

    代码资源来源数据集CodeJit-SourceDataset-ducanger 数据来源:互联网公开数据 标签:软件开发,代码资源,数据集,文本分析,机器学习,编程语言,开源资源,数据挖掘 数据概述: 该数据集包含来自CodeJit开源平台的代码资源数据,记录了多种编程语言的项目代码,文档和元信息。主要特征如下:...
    packageimg
  • IMDB电影评论数据集IMDBDatasetforPractice-kkguruamit

    2025年4月25日   

    IMDB电影评论数据集IMDBDatasetforPractice-kkguruamit 数据来源:互联网公开数据 标签:电影评论,数据集,情感分析,自然语言处理,机器学习,文本分析,学术资源,数据挖掘 数据概述: 该数据集包含来自IMDB的电影评论数据,记录了用户对电影的评论及其对应的情感标签。主要特征如下:...
    packageimg
  • 大小写字母识别数据集-suryatejamenta

    2025年4月25日   

    大小写字母识别数据集-suryatejamenta 数据来源:互联网公开数据 标签:字母识别,数据集,图像处理,机器学习,计算机视觉,文本分析,模式识别,人工智能 数据概述: 该数据集包含由大小写字母组成的图像数据,用于训练和评估字母识别模型。主要特征如下: 时间跨度:数据记录时间跨度不限,数据为静态图像。...
    packageimg
  • 标记预处理脚本数据集MarkedPreprocessingScriptDataset-slx3zippy

    2025年4月25日   

    标记预处理脚本数据集MarkedPreprocessingScriptDataset-slx3zippy 数据来源:互联网公开数据 标签:文本处理,预处理,数据集,自然语言处理,脚本,Python,数据清洗,文本分析 数据概述: 该数据集包含用于文本预处理的Python脚本和相关数据,主要用于演示和评估文本处理流程。主要特征如下:...
    packageimg
  • Facebook情感分析数据集FacebookSentimentAnalysisDataset-mortena

    2025年4月25日   

    Facebook情感分析数据集FacebookSentimentAnalysisDataset-mortena 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,自然语言处理,机器学习,文本分析,社交网络,数据挖掘 数据概述: 该数据集包含来自Facebook平台的数据,记录了用户发布的内容及其情感倾向。主要特征如下:...
    packageimg
  • 罗马新闻文本数据集News-RomanDataset-zeshanali

    2025年4月25日   

    罗马新闻文本数据集News-RomanDataset-zeshanali 数据来源:互联网公开数据 标签:新闻文本,自然语言处理,文本分析,情感分析,信息检索,文本分类,机器学习,意大利语 数据概述: 该数据集包含来自罗马地区新闻网站的文本数据,记录了各类新闻文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 波斯语数据集PersianDataset-amirali10281

    2025年4月25日   

    波斯语数据集PersianDataset-amirali10281 数据来源:互联网公开数据 标签:波斯语,语言学,自然语言处理,数据集,文本分析,机器翻译,文本分类,语音识别 数据概述: 该数据集包含波斯语文本和相关数据,旨在为波斯语语言处理研究提供支持。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同时期和类型的波斯语文本。...
    packageimg
  • 人工智能黑客马拉松电影类型分类数据集AICHackathonMovieGenreClassificationData-r3kste

    2025年4月25日   

    人工智能黑客马拉松电影类型分类数据集AICHackathonMovieGenreClassificationData-r3kste 数据来源:互联网公开数据 标签:电影,类型分类,数据集,机器学习,自然语言处理,文本分析,情感分析,影视娱乐 数据概述:...
    packageimg
  • 金融领域情感分析数据集FinanceSentimentAnalysisDataset-mltrev23

    2025年4月25日   

    金融领域情感分析数据集FinanceSentimentAnalysisDataset-mltrev23 数据来源:互联网公开数据 标签:金融,情感分析,数据集,自然语言处理,机器学习,文本分析,投资研究,市场情绪 数据概述: 该数据集包含来自金融领域的文本数据,记录了与金融市场,股票,投资等相关的文本内容及其情感倾向。主要特征如下:...
    packageimg
  • 菜肴菜系分类数据集CuisineDataset-mfarazf

    2025年4月25日   

    菜肴菜系分类数据集CuisineDataset-mfarazf 数据来源:互联网公开数据 标签:菜肴,菜系,分类,机器学习,自然语言处理,文本分析,饮食文化,数据集 数据概述: 该数据集包含来自不同菜系的菜肴配料数据,用于菜肴的自动分类和分析。主要特征如下: 时间跨度: 数据记录的时间范围不定,涵盖了不同菜系的菜肴配料信息。 地理范围:...
    packageimg
  • 学生反馈情感分析数据集SentimentalAnalysisonStudentFeedbackDataset-chandusrujan

    2025年4月25日   

    学生反馈情感分析数据集SentimentalAnalysisonStudentFeedbackDataset-chandusrujan 数据来源:互联网公开数据 标签:情感分析,学生反馈,数据集,文本分析,教育研究,自然语言处理,机器学习,教育技术 数据概述:...
    packageimg
  • 立陶宛金融新闻多标签数据集LithuanianFinancialNewsDatasetMultilabeled-pavelstefanovi

    2025年4月25日   

    立陶宛金融新闻多标签数据集LithuanianFinancialNewsDatasetMultilabeled-pavelstefanovi 数据来源:互联网公开数据 标签:金融新闻,数据集,多标签分类,自然语言处理,机器学习,文本分析,新闻挖掘,金融科技 数据概述:...
    packageimg
  • 人工智能文章抓取清理扩展数据集AIArticleScrapedCleanedExtraDataDataset-alikmondal

    2025年4月25日   

    人工智能文章抓取清理扩展数据集AIArticleScrapedCleanedExtraDataDataset-alikmondal 数据来源:互联网公开数据 标签:人工智能,文章抓取,数据清理,自然语言处理,机器学习,文本分析,信息提取,数据集 数据概述:...
    packageimg
  • 亚马逊评论字幕数据集ARC-SubsDataset-philipkd

    2025年4月25日   

    亚马逊评论字幕数据集ARC-SubsDataset-philipkd 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,字幕,情感分析,机器翻译,评论,亚马逊 数据概述: 该数据集包含了来自亚马逊网站的商品评论以及对应的字幕数据,旨在为自然语言处理任务提供训练和评估资源。主要特征如下:...
    packageimg
  • 泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit

    2025年4月25日   

    泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,泰米尔语,数据集,自然语言处理,文本分析,机器学习,信息检索,语言技术 数据概述: 该数据集包含来自泰米尔语新闻媒体的数据,记录了不同类别的泰米尔语新闻文章。主要特征如下:...
    packageimg