找到5,734个数据集

标签: 文本分析

过滤结果
  • 标题:客户服务聊天机器人数据集(Kundansingh08 Chat Bot Dataset)

    2025年5月28日   

    标题:客户服务聊天机器人数据集(Kundansingh08 Chat Bot Dataset) 数据来源:互联网公开数据 标签:聊天机器人,客户服务,自然语言处理,文本分析,数据集,机器学习,对话系统,人工智能 数据概述: 该数据集包含由 Kundansingh08...
    packageimg
  • TinyBERT文本相似度计算数据集-ktgiahieu

    2025年5月28日   

    TinyBERT文本相似度计算数据集-ktgiahieu 数据来源:互联网公开数据 标签:文本相似度,自然语言处理,数据集,语义分析,机器翻译,深度学习,文本分析,语言模型 数据概述: 该数据集是用于训练和评估基于TinyBERT模型的文本相似度计算任务的数据集。主要特征如下: 时间跨度:数据涵盖了不同时间段的文本数据。...
    packageimg
  • 数据帧替换操作数据集-goldy222

    2025年5月28日   

    数据帧替换操作数据集-goldy222 数据来源:互联网公开数据 标签:数据处理,数据清洗,数据转换,数据集,文本分析,机器学习,数据科学,Python 数据概述: 该数据集包含用于数据帧(DataFrame)替换操作的模拟数据,记录了在数据处理过程中,使用不同方法替换数据帧中特定值的情况。主要特征如下: 时间跨度: 数据记录的时间范围不限,模拟数据。...
    packageimg
  • 短信内容分类数据集SMSContentClassification-bobaaayoung

    2025年5月28日   

    短信内容分类数据集SMSContentClassification-bobaaayoung 数据来源:互联网公开数据 标签:短信分类, 文本分析, 自然语言处理, 垃圾短信, 营销短信, 短信内容, 文本标注, 二分类 数据概述: 该数据集包含来自互联网的短信内容,记录了用于短信内容分类的文本示例。主要特征如下:...
    packageimg
  • 政府机构缩写及命名实体识别数据集GovernmentAcronymandNamedEntityRecognitionDataset-osciiart

    2025年5月28日   

    政府机构缩写及命名实体识别数据集GovernmentAcronymandNamedEntityRecognitionDataset-osciiart 数据来源:互联网公开数据 标签:命名实体识别, 缩写识别, 文本分析, 自然语言处理, 机器学习, 政府机构, 数据标注, 语料库构建 数据概述:...
    packageimg
  • Jigsaw毒性评论清洗数据集JigsawCleanedToxicCommentsDataset-monideepde

    2025年5月28日   

    Jigsaw毒性评论清洗数据集JigsawCleanedToxicCommentsDataset-monideepde 数据来源:互联网公开数据 标签:文本分析,毒性检测,自然语言处理,数据集,机器学习,情感分析,评论清洗,社交媒体 数据概述: 该数据集包含了来自 Jigsaw...
    packageimg
  • 亚马逊商品评论数据集AmazonProductReviewsDataset-a2moosaei7

    2025年5月28日   

    亚马逊商品评论数据集AmazonProductReviewsDataset-a2moosaei7 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,文本分析,自然语言处理,消费者行为,数据挖掘,机器学习 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了用户对不同商品的评价和反馈。主要特征如下:...
    packageimg
  • 书籍相关推文情感分析数据集2023书籍相关推文情感分析Dataset-carneyjp

    2025年5月28日   

    书籍相关推文情感分析数据集2023书籍相关推文情感分析Dataset-carneyjp 数据来源:互联网公开数据 标签:推文,书籍,情感分析,社交媒体,自然语言处理,数据集,文本分析,社会研究 数据概述:该数据集包含来自社交媒体平台的233,360条与书籍相关的推文,并附带了情感分析结果。主要特征如下:...
    packageimg
  • 社交媒体推文分析数据集SocialMediaTweetAnalysisDataset-kokeyehya

    2025年5月28日   

    社交媒体推文分析数据集SocialMediaTweetAnalysisDataset-kokeyehya 数据来源:互联网公开数据 标签:推文数据, 社交媒体, 文本分析, 自然语言处理, 用户画像, 话题分析, 情感分析, 数据挖掘 数据概述:...
    packageimg
  • 互联网热门表情包图像与元数据数据集InternetPopularMemesImage-MetadataDataset-schesa

    2025年5月28日   

    互联网热门表情包图像与元数据数据集InternetPopularMemesImage-MetadataDataset-schesa 数据来源:互联网公开数据 标签:表情包, 图像识别, 文本分析, 社交媒体, 数据挖掘, 自然语言处理, 情感分析, 图像分类 数据概述:...
    packageimg
  • 华尔街赌注论坛股票讨论数据集WallStreetBetsData-StockDiscussionDataset-mathieucayssol

    2025年5月28日   

    华尔街赌注论坛股票讨论数据集WallStreetBetsData-StockDiscussionDataset-mathieucayssol 数据来源:互联网公开数据 标签:股票,金融,社交媒体,数据集,文本分析,情感分析,自然语言处理,华尔街 数据概述: 该数据集包含来自 Reddit 社交平台华尔街赌注(WallStreetBets,简称...
    packageimg
  • 阿拉伯语新闻摘要数据集ArabicNewsArticlesSummaryDataset-aymanmohamed104

    2025年5月28日   

    阿拉伯语新闻摘要数据集ArabicNewsArticlesSummaryDataset-aymanmohamed104 数据来源:互联网公开数据 标签:新闻摘要, 阿拉伯语, 文本摘要, 自然语言处理, 文本分析, 舆情分析, 语言模型, 摘要生成 数据概述:...
    packageimg
  • 美国密歇根大学学生行为数据集UMSIBotDataset-mohamedrashad102

    2025年5月28日   

    美国密歇根大学学生行为数据集UMSIBotDataset-mohamedrashad102 数据来源:互联网公开数据 标签:学生行为,数据集,自然语言处理,文本分析,社交媒体,情感分析,机器学习,教育 数据概述: 该数据集包含来自密歇根大学信息学院(UMSI)学生在社交媒体上的公开互动数据,记录了学生在各种在线平台上的行为和内容。主要特征如下:...
    packageimg
  • BKAI文档数据集BKAIDocumentDataset-phucnguyenlamp

    2025年5月28日   

    BKAI文档数据集BKAIDocumentDataset-phucnguyenlamp 数据来源:互联网公开数据 标签:BKAI,文档处理,数据集,自然语言处理,机器学习,文本分析,信息检索,人工智能 数据概述:该数据集包含来自BKAI的文档数据,记录了多种类型的文档信息,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • 文档检索数据集Retrieval-DocumentDataset-hlv305

    2025年5月28日   

    文档检索数据集Retrieval-DocumentDataset-hlv305 数据来源:互联网公开数据 标签:文档检索,数据集,信息检索,自然语言处理,机器学习,文本分析,人工智能,搜索引擎 数据概述: 该数据集包含来自多个来源的文档数据,记录了文档内容及其相关检索信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 波斯语新闻数据集PersianNewsDataset-fatemehmahdibabaee

    2025年5月28日   

    波斯语新闻数据集PersianNewsDataset-fatemehmahdibabaee 数据来源:互联网公开数据 标签:新闻,波斯语,数据集,自然语言处理,文本分析,机器学习,多语言,数据挖掘 数据概述: 该数据集包含来自波斯语新闻媒体的文章数据,记录了波斯语新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 新闻偏见分析数据集-subhankarpanda56

    2025年5月28日   

    新闻偏见分析数据集-subhankarpanda56 数据来源:互联网公开数据 标签:新闻,偏见,文本分析,自然语言处理,情感分析,机器学习,舆情分析,媒体研究 数据概述: 该数据集包含来自多个新闻网站和媒体平台的新闻文章数据,用于分析新闻报道中的偏见。主要特征如下: 时间跨度:数据记录的时间范围为2016年至2020年。...
    packageimg
  • 社交媒体评论毒性检测数据集ToxicCommentDetectionDataset-reppic

    2025年5月28日   

    社交媒体评论毒性检测数据集ToxicCommentDetectionDataset-reppic 数据来源:互联网公开数据 标签: 文本分析,自然语言处理,毒性检测,机器学习,评论数据,情感分析,文本分类,社交媒体 数据概述: 该数据集包含来自社交媒体平台的评论数据,主要用于毒性评论的检测与分析。主要特征如下: 时间跨度:...
    packageimg
  • 命名实体识别验证数据集NERCapstoneFinalValidationDataset-vibhagangolli

    2025年5月28日   

    命名实体识别验证数据集NERCapstoneFinalValidationDataset-vibhagangolli 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,机器学习,文本分析,人工智能,信息提取,深度学习 数据概述:...
    packageimg
  • 新闻处理数据集NewsProcessedDataset-alice6fox

    2025年5月28日   

    新闻处理数据集NewsProcessedDataset-alice6fox 数据来源:互联网公开数据 标签:新闻处理,数据集,文本分析,自然语言处理,机器学习,文本挖掘,数据分析,信息检索 数据概述:该数据集包含经过处理的新闻文章数据,记录了各类新闻报道的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。...
    packageimg