找到11,989个数据集

标签: 自然语言处理

过滤结果
  • 英语词汇频率统计数据集WordsCSVDataset-jasperbutcher

    2025年4月24日   

    英语词汇频率统计数据集WordsCSVDataset-jasperbutcher 数据来源:互联网公开数据 标签:自然语言处理,文本分析,词频统计,数据集,语言学,词汇学习,机器学习,统计分析 数据概述: 该数据集包含了来自互联网的大量文本数据,记录了英语词汇的出现频率。主要特征如下:...
    packageimg
  • 土耳其语Twitter平台社交媒体攻击性语言检测数据集-eymaahner

    2025年4月24日   

    土耳其语Twitter平台社交媒体攻击性语言检测数据集-eymaahner 数据来源:互联网公开数据 标签:土耳其语, Twitter, 社交媒体, 攻击性语言, 情感分析, 自然语言处理, 文本分类, 机器学习 数据概述:...
    packageimg
  • StackOverflow问答数据集StackOverflowQuestionsDataset-sukuzhanay

    2025年4月24日   

    StackOverflow问答数据集StackOverflowQuestionsDataset-sukuzhanay 数据来源:互联网公开数据 标签:问答系统,编程,数据集,自然语言处理,文本分析,机器学习,开发者社区,数据挖掘 数据概述:该数据集包含来自 Stack Overflow...
    packageimg
  • 孟加拉语虚假新闻分类数据集-hakim11

    2025年4月24日   

    孟加拉语虚假新闻分类数据集-hakim11 数据来源:互联网公开数据 标签:虚假新闻,孟加拉语,自然语言处理,文本分类,机器学习,新闻分析,语言学,情感分析 数据概述:该数据集包含孟加拉语的虚假新闻文本,用于进行虚假新闻的检测与分类。主要特征如下: 时间跨度:数据收集的时间范围不明确,但包含了近期发布的新闻。...
    packageimg
  • 亚马逊产品评论数据集Product300AmazonDataset-hoang2909

    2025年4月24日   

    亚马逊产品评论数据集Product300AmazonDataset-hoang2909 数据来源:互联网公开数据 标签:亚马逊,产品评论,数据集,自然语言处理,消费者行为,电子商务,机器学习,市场分析 数据概述: 该数据集包含来自亚马逊的300个产品的用户评论数据,记录了产品评论的详细信息。主要特征如下:...
    packageimg
  • 歌曲创作与语言分析平台歌词数据集

    2025年4月24日   

    歌曲创作与语言分析平台歌词数据集 数据来源:互联网公开数据 标签:歌词,音乐,歌曲,语言,文本分析,自然语言处理,创作,文化,流派 数据概述:...
    packageimg
  • 通用语音编码器数据集PASE-jarfo1

    2025年4月24日   

    通用语音编码器数据集PASE-jarfo1 数据来源:互联网公开数据 标签:语音识别,语音编码,数据集,深度学习,自然语言处理,声学模型,音频处理,机器学习 数据概述: 该数据集源自PASE(Problem-Agnostic Speech Encoder)项目,旨在构建一个通用的语音编码器,能够处理各种语音相关的任务。主要特征如下:...
    packageimg
  • 词语类比测试数据集-julianschelb

    2025年4月24日   

    词语类比测试数据集-julianschelb 数据来源:互联网公开数据 标签:自然语言处理,词向量,类比,语义,语言模型,测试集,词汇,认知 数据概述:...
    packageimg
  • 回到未来三部曲电影剧本数据集BacktotheFutureTrilogyTranscriptsDataset-narref4

    2025年4月24日   

    回到未来三部曲电影剧本数据集BacktotheFutureTrilogyTranscriptsDataset-narref4 数据来源:互联网公开数据 标签:电影剧本,剧本分析,电影研究,文本数据,自然语言处理,电影台词,数据集,文化研究 数据概述:...
    packageimg
  • Reddit短内容数据集RedditShortDataset-swathikone

    2025年4月24日   

    Reddit短内容数据集RedditShortDataset-swathikone 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,情感分析,机器学习,自然语言处理,网络行为,内容分类 数据概述:该数据集包含来自Reddit平台的短内容数据,记录了用户发布在各个板块的简短文本信息。主要特征如下:...
    packageimg
  • arXiv论文摘要数据集FDL-Arxiv-FinalDataset-alssioalfonso

    2025年4月24日   

    arXiv论文摘要数据集FDL-Arxiv-FinalDataset-alssioalfonso 数据来源:互联网公开数据 标签:自然语言处理,机器学习,论文摘要,文本分析,数据集,学术研究,论文推荐,深度学习 数据概述: 该数据集包含来自arXiv(预印本服务器)的论文摘要数据,主要用于自然语言处理,机器学习等相关研究。主要特征如下:...
    packageimg
  • 印地语细粒度情感文本数据集EMOHI58KFine-grainedHindiEmotionDataText-debadityashome

    2025年4月24日   

    印地语细粒度情感文本数据集EMOHI58KFine-grainedHindiEmotionDataText-debadityashome 数据来源:互联网公开数据 标签:情感分析,印地语,数据集,自然语言处理,文本分类,情感识别,机器学习,多语言处理 数据概述: 该数据集包含来自公开来源的印地语文本数据,记录了不同情感的文本表达。主要特征如下:...
    packageimg
  • 金融新闻情感分析数据集EliciaNewsFinBERTDataset-a0204261w

    2025年4月24日   

    金融新闻情感分析数据集EliciaNewsFinBERTDataset-a0204261w 数据来源:互联网公开数据 标签:金融新闻,情感分析,自然语言处理,数据集,机器学习,文本分析,金融科技,新闻媒体 数据概述: 该数据集包含来自Elicia新闻的金融新闻数据,记录了新闻文章及其对应的情感标签。主要特征如下:...
    packageimg
  • 亚马逊商品评论数据集AmazonProductReviewsDataset-erturanzeynep

    2025年4月24日   

    亚马逊商品评论数据集AmazonProductReviewsDataset-erturanzeynep 数据来源:互联网公开数据 标签:电商,商品评论,数据集,情感分析,自然语言处理,文本挖掘,推荐系统,用户行为分析 数据概述: 该数据集包含来自亚马逊的商品评论数据,记录了用户对商品的评价和相关信息。主要特征如下:...
    packageimg
  • 电影评论数据集50000条评论MovieReviewDataset50000Rows-kunaljcdu

    2025年4月24日   

    电影评论数据集50000条评论MovieReviewDataset50000Rows-kunaljcdu 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,情感分析,机器学习,文本挖掘,文本分类,文化研究 数据概述:该数据集包含50000条电影评论,记录了观众对电影的详细评论内容及情感评分。主要特征如下:...
    packageimg
  • BBC新闻自然语言处理数据集BBCNewsNLPDataset-weslatimarwen

    2025年4月24日   

    BBC新闻自然语言处理数据集BBCNewsNLPDataset-weslatimarwen 数据来源:互联网公开数据 标签:新闻分析,自然语言处理,数据集,文本分类,机器学习,信息提取,语言模型,数据挖掘 数据概述: 该数据集包含来自BBC新闻的文本数据,记录了新闻文章的标题,内容,分类标签等信息。主要特征如下:...
    packageimg
  • 文本重写训练与测试数据集ParaphraserTrainingandTestSet-pravinkumardurairaj

    2025年4月24日   

    文本重写训练与测试数据集ParaphraserTrainingandTestSet-pravinkumardurairaj 数据来源:互联网公开数据 标签:自然语言处理,文本重写,数据集,机器学习,文本生成,语言模型,深度学习,数据科学 数据概述: 该数据集包含用于训练和测试文本重写模型的平行文本数据,记录了原始文本及其对应的重写版本。主要特征如下:...
    packageimg
  • 美国和加州立法提案摘要数据集-undersc0re

    2025年4月24日   

    美国和加州立法提案摘要数据集-undersc0re 数据来源:互联网公开数据 标签:立法,提案,摘要,文本分析,自然语言处理,美国,加州,法律,文本长度 数据概述: 本数据集包含了美国联邦立法提案和加州立法提案的摘要信息,总计超过23000条记录。数据分为训练集(train)、加州测试集(ca_test)和测试集(test)三个部分。...
    packageimg
  • 欺凌事件标注数据集2018年-felicitaarcadia

    2025年4月24日   

    欺凌事件标注数据集2018年-felicitaarcadia 数据来源:互联网公开数据 标签:欺凌,校园欺凌,数据集,文本分析,自然语言处理,情感分析,社会学,教育 数据概述: 该数据集包含2018年收集的欺凌事件相关文本数据,记录了各种形式的欺凌行为描述。主要特征如下: 时间跨度:数据记录的时间范围为2018年。...
    packageimg
  • 政治事实核查新闻数据集PolitifactNewsDataDataset-shaded

    2025年4月24日   

    政治事实核查新闻数据集PolitifactNewsDataDataset-shaded 数据来源:互联网公开数据 标签:新闻分析,政治研究,数据集,事实核查,机器学习,自然语言处理,社会舆论,媒体研究 数据概述: 该数据集包含来自政治事实核查网站Politifact的新闻数据,记录了政治声明,新闻报道及相关事实核查信息。主要特征如下:...
    packageimg