找到5,744个数据集

标签: 文本分析

过滤结果
  • 突尼斯自然语言处理数据集NLPTunisiaDataset-mikemollel

    2025年4月25日   

    突尼斯自然语言处理数据集NLPTunisiaDataset-mikemollel 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,突尼斯语,语言学,机器学习,人工智能,文本挖掘 数据概述:该数据集包含来自突尼斯的自然语言处理数据,记录了突尼斯语文本的多方面信息。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2021年。...
    packageimg
  • 路透社报道的德国DAX指数三年文章数据集-wissemch

    2025年4月25日   

    路透社报道的德国DAX指数三年文章数据集-wissemch 数据来源:互联网公开数据 标签:金融新闻,数据集,DAX指数,路透社,文本分析,自然语言处理,量化交易,经济分析 数据概述:该数据集包含来自路透社的关于德国DAX指数的新闻文章,记录了三年内关于DAX指数的报道内容。主要特征如下:...
    packageimg
  • 大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet

    2025年4月25日   

    大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet 数据来源:互联网公开数据 标签:语言模型,机器学习,自然语言处理,深度学习,人工智能,文本生成,文本分析,大数据 数据概述: 该数据集包含用于训练大型语言模型(LLM)的文本数据,特别适用于JAX框架下的LLaMA 13B模型。主要特征如下:...
    packageimg
  • 阿拉伯国家自杀事件数据集ArabicSuicideDataset-houlmixa

    2025年4月25日   

    阿拉伯国家自杀事件数据集ArabicSuicideDataset-houlmixa 数据来源:互联网公开数据 标签:自杀,阿拉伯国家,心理健康,数据集,文本分析,自然语言处理,情感分析,社会学 数据概述: 该数据集包含了来自阿拉伯国家关于自杀事件的数据,旨在为研究自杀行为,心理健康和社会问题提供数据支持。主要特征如下: 时间跨度:...
    packageimg
  • 网络热点事件监测数据集NetworkHeatDataset-antonigarciamolina

    2025年4月25日   

    网络热点事件监测数据集NetworkHeatDataset-antonigarciamolina 数据来源:互联网公开数据 标签:网络热点,事件监测,数据集,社交媒体,文本分析,自然语言处理,舆情分析,社会研究 数据概述:该数据集包含来自社交媒体平台的数据,记录了各类网络热点事件的详细信息。主要特征如下:...
    packageimg
  • 钓鱼邮件检测数据集-mohammadaoalhija

    2025年4月25日   

    钓鱼邮件检测数据集-mohammadaoalhija 数据来源:互联网公开数据 标签:钓鱼邮件,网络安全,数据集,文本分析,机器学习,恶意软件,自然语言处理,电子邮件 数据概述: 该数据集包含来自不同来源的钓鱼邮件和正常邮件样本,用于钓鱼邮件检测和分析。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同年份的钓鱼邮件样本。...
    packageimg
  • YouTube视频评论情感分析数据集YouTubeVideoCommentSentimentAnalysisDataset-vinhsokaggle

    2025年4月25日   

    YouTube视频评论情感分析数据集YouTubeVideoCommentSentimentAnalysisDataset-vinhsokaggle 数据来源:互联网公开数据 标签:YouTube,视频,评论,情感分析,自然语言处理,机器学习,文本分析,社交媒体 数据概述:...
    packageimg
  • 印度总理莫迪推特数据分析数据集ModiTwitterDataAnalysisDataset-suyashkira

    2025年4月25日   

    印度总理莫迪推特数据分析数据集ModiTwitterDataAnalysisDataset-suyashkira 数据来源:互联网公开数据 标签:推特数据,政治分析,社交媒体,文本分析,情感分析,印度,莫迪,大数据 数据概述: 该数据集包含印度总理纳伦德拉·莫迪(Narendra...
    packageimg
  • 德国邮件XML数据集GermanEmailsinXMLDataset-jordanrich

    2025年4月25日   

    德国邮件XML数据集GermanEmailsinXMLDataset-jordanrich 数据来源:互联网公开数据 标签:电子邮件,数据集,XML格式,文本分析,邮件挖掘,自然语言处理,数据挖掘,信息检索 数据概述: 该数据集包含来自德国的电子邮件数据,记录了各类邮件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2010年。...
    packageimg
  • 印地语数据集HindiDataset-yash3056

    2025年4月25日   

    印地语数据集HindiDataset-yash3056 数据来源:互联网公开数据 标签:印地语,数据集,自然语言处理,文本分析,机器学习,语言学习,学术研究,文化研究 数据概述:该数据集包含来自互联网和学术来源的印地语文本数据,记录了各种主题的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 电视节目标签数据集TVShowsLabeledDataset-loucass003

    2025年4月25日   

    电视节目标签数据集TVShowsLabeledDataset-loucass003 数据来源:互联网公开数据 标签:电视节目,数据集,标签,分类,机器学习,娱乐,影视,文本分析 数据概述:该数据集包含来自互联网的电视节目数据,记录了各类电视节目的详细信息和标签。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同年份的电视节目。...
    packageimg
  • 自然语言处理项目数据集NLPProjectDataset-nikunjphutela

    2025年4月25日   

    自然语言处理项目数据集NLPProjectDataset-nikunjphutela 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,深度学习,语言模型,数据集,文本分类,情感分析 数据概述: 该数据集为自然语言处理项目专用,记录了多种文本数据及相关标注信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 环境主题歌曲歌词数据集EnvironmentalSongLyricsDataset-putuodeirfanardika

    2025年4月25日   

    环境主题歌曲歌词数据集EnvironmentalSongLyricsDataset-putuodeirfanardika 数据来源:互联网公开数据 标签:歌词,环境,音乐,数据集,文本分析,自然语言处理,文化研究,社会科学 数据概述: 该数据集包含来自互联网的关于环境主题的歌曲歌词。主要特征如下:...
    packageimg
  • 英语词汇与定义数据集VAL-EN-DFDataset-bamps53

    2025年4月25日   

    英语词汇与定义数据集VAL-EN-DFDataset-bamps53 数据来源:互联网公开数据 标签:英语词汇,定义,数据集,自然语言处理,词义消歧,语言学,文本分析,机器学习 数据概述: 该数据集包含了大量的英语词汇及其对应的定义,主要用于自然语言处理和语言学研究。主要特征如下: 时间跨度:数据记录的时间范围不限,持续更新。...
    packageimg
  • 美国州长推特数据集2020年1月20日至2020年7月22日-dk0lli

    2025年4月25日   

    美国州长推特数据集2020年1月20日至2020年7月22日-dk0lli 数据来源:互联网公开数据 标签:推特数据,州长,社交媒体,2020年,政治分析,文本分析,社会研究,数据集 数据概述:该数据集包含来自2020年1月20日至2020年7月22日期间美国各州州长在推特上发布的推文数据。主要特征如下:...
    packageimg
  • Commonlit阅读理解文本特征数据集-vaibhavnakrani

    2025年4月25日   

    Commonlit阅读理解文本特征数据集-vaibhavnakrani 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,文本分析,数据集,教育,机器学习,文本特征,语言模型 数据概述: 该数据集包含了Commonlit阅读理解竞赛的文本数据,旨在帮助研究人员和开发者构建更有效的阅读理解模型。主要特征如下:...
    packageimg
  • H2O-ai大型语言模型预测数据集-mianxiong

    2025年4月25日   

    H2O-ai大型语言模型预测数据集-mianxiong 数据来源:互联网公开数据 标签:大型语言模型,预测,数据集,自然语言处理,机器学习,人工智能,H2O.ai,文本分析 数据概述: 该数据集由 H2O.ai 提供,旨在用于大型语言模型(LLM)的预测任务,涵盖了各种文本数据和预测目标。主要特征如下: 时间跨度:...
    packageimg
  • IBM辩手论据识别数据集2020年IBMDebaterArgumentIdentificationasaSubtaskFindingsDataset202...

    2025年4月25日   

    IBM辩手论据识别数据集2020年IBMDebaterArgumentIdentificationasaSubtaskFindingsDataset2020-kaggleqrdl 数据来源:互联网公开数据 标签:IBM辩手,论据识别,自然语言处理,数据集,文本分析,机器学习,人工智能,辩论赛...
    packageimg
  • 学生与语言模型作文检测数据集Studentvs-LLMEssayDetectionDataset-tafartech

    2025年4月25日   

    学生与语言模型作文检测数据集Studentvs-LLMEssayDetectionDataset-tafartech 数据来源:互联网公开数据 标签:学生作文,语言模型,数据集,自然语言处理,文本分析,机器学习,学术研究,教育评估 数据概述:该数据集包含来自不同学生的作文以及由语言模型生成的作文样本,适用于作文检测和评估。主要特征如下:...
    packageimg
  • 团队协作与沟通数据集TeamsDataset-akash1vishwakarma

    2025年4月25日   

    团队协作与沟通数据集TeamsDataset-akash1vishwakarma 数据来源:互联网公开数据 标签:团队协作,沟通分析,数据集,社交网络,文本分析,自然语言处理,组织行为学,团队动力学 数据概述: 该数据集包含来自Microsoft Teams平台上的团队协作与沟通数据,记录了团队成员之间的互动信息。主要特征如下:...
    packageimg