-
标题:客户服务聊天机器人数据集(Kundansingh08 Chat Bot Dataset)
标题:客户服务聊天机器人数据集(Kundansingh08 Chat Bot Dataset) 数据来源:互联网公开数据 标签:聊天机器人,客户服务,自然语言处理,文本分析,数据集,机器学习,对话系统,人工智能 数据概述: 该数据集包含由 Kundansingh08... -
TinyBERT文本相似度计算数据集-ktgiahieu
TinyBERT文本相似度计算数据集-ktgiahieu 数据来源:互联网公开数据 标签:文本相似度,自然语言处理,数据集,语义分析,机器翻译,深度学习,文本分析,语言模型 数据概述: 该数据集是用于训练和评估基于TinyBERT模型的文本相似度计算任务的数据集。主要特征如下: 时间跨度:数据涵盖了不同时间段的文本数据。... -
数据帧替换操作数据集-goldy222
数据帧替换操作数据集-goldy222 数据来源:互联网公开数据 标签:数据处理,数据清洗,数据转换,数据集,文本分析,机器学习,数据科学,Python 数据概述: 该数据集包含用于数据帧(DataFrame)替换操作的模拟数据,记录了在数据处理过程中,使用不同方法替换数据帧中特定值的情况。主要特征如下: 时间跨度: 数据记录的时间范围不限,模拟数据。... -
短信内容分类数据集SMSContentClassification-bobaaayoung
短信内容分类数据集SMSContentClassification-bobaaayoung 数据来源:互联网公开数据 标签:短信分类, 文本分析, 自然语言处理, 垃圾短信, 营销短信, 短信内容, 文本标注, 二分类 数据概述: 该数据集包含来自互联网的短信内容,记录了用于短信内容分类的文本示例。主要特征如下:... -
政府机构缩写及命名实体识别数据集GovernmentAcronymandNamedEntityRecognitionDataset-osciiart
政府机构缩写及命名实体识别数据集GovernmentAcronymandNamedEntityRecognitionDataset-osciiart 数据来源:互联网公开数据 标签:命名实体识别, 缩写识别, 文本分析, 自然语言处理, 机器学习, 政府机构, 数据标注, 语料库构建 数据概述:... -
Jigsaw毒性评论清洗数据集JigsawCleanedToxicCommentsDataset-monideepde
Jigsaw毒性评论清洗数据集JigsawCleanedToxicCommentsDataset-monideepde 数据来源:互联网公开数据 标签:文本分析,毒性检测,自然语言处理,数据集,机器学习,情感分析,评论清洗,社交媒体 数据概述: 该数据集包含了来自 Jigsaw... -
亚马逊商品评论数据集AmazonProductReviewsDataset-a2moosaei7
亚马逊商品评论数据集AmazonProductReviewsDataset-a2moosaei7 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,文本分析,自然语言处理,消费者行为,数据挖掘,机器学习 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了用户对不同商品的评价和反馈。主要特征如下:... -
书籍相关推文情感分析数据集2023书籍相关推文情感分析Dataset-carneyjp
书籍相关推文情感分析数据集2023书籍相关推文情感分析Dataset-carneyjp 数据来源:互联网公开数据 标签:推文,书籍,情感分析,社交媒体,自然语言处理,数据集,文本分析,社会研究 数据概述:该数据集包含来自社交媒体平台的233,360条与书籍相关的推文,并附带了情感分析结果。主要特征如下:... -
社交媒体推文分析数据集SocialMediaTweetAnalysisDataset-kokeyehya
社交媒体推文分析数据集SocialMediaTweetAnalysisDataset-kokeyehya 数据来源:互联网公开数据 标签:推文数据, 社交媒体, 文本分析, 自然语言处理, 用户画像, 话题分析, 情感分析, 数据挖掘 数据概述:... -
互联网热门表情包图像与元数据数据集InternetPopularMemesImage-MetadataDataset-schesa
互联网热门表情包图像与元数据数据集InternetPopularMemesImage-MetadataDataset-schesa 数据来源:互联网公开数据 标签:表情包, 图像识别, 文本分析, 社交媒体, 数据挖掘, 自然语言处理, 情感分析, 图像分类 数据概述:... -
华尔街赌注论坛股票讨论数据集WallStreetBetsData-StockDiscussionDataset-mathieucayssol
华尔街赌注论坛股票讨论数据集WallStreetBetsData-StockDiscussionDataset-mathieucayssol 数据来源:互联网公开数据 标签:股票,金融,社交媒体,数据集,文本分析,情感分析,自然语言处理,华尔街 数据概述: 该数据集包含来自 Reddit 社交平台华尔街赌注(WallStreetBets,简称... -
阿拉伯语新闻摘要数据集ArabicNewsArticlesSummaryDataset-aymanmohamed104
阿拉伯语新闻摘要数据集ArabicNewsArticlesSummaryDataset-aymanmohamed104 数据来源:互联网公开数据 标签:新闻摘要, 阿拉伯语, 文本摘要, 自然语言处理, 文本分析, 舆情分析, 语言模型, 摘要生成 数据概述:... -
美国密歇根大学学生行为数据集UMSIBotDataset-mohamedrashad102
美国密歇根大学学生行为数据集UMSIBotDataset-mohamedrashad102 数据来源:互联网公开数据 标签:学生行为,数据集,自然语言处理,文本分析,社交媒体,情感分析,机器学习,教育 数据概述: 该数据集包含来自密歇根大学信息学院(UMSI)学生在社交媒体上的公开互动数据,记录了学生在各种在线平台上的行为和内容。主要特征如下:... -
BKAI文档数据集BKAIDocumentDataset-phucnguyenlamp
BKAI文档数据集BKAIDocumentDataset-phucnguyenlamp 数据来源:互联网公开数据 标签:BKAI,文档处理,数据集,自然语言处理,机器学习,文本分析,信息检索,人工智能 数据概述:该数据集包含来自BKAI的文档数据,记录了多种类型的文档信息,适用于自然语言处理和机器学习任务。主要特征如下:... -
文档检索数据集Retrieval-DocumentDataset-hlv305
文档检索数据集Retrieval-DocumentDataset-hlv305 数据来源:互联网公开数据 标签:文档检索,数据集,信息检索,自然语言处理,机器学习,文本分析,人工智能,搜索引擎 数据概述: 该数据集包含来自多个来源的文档数据,记录了文档内容及其相关检索信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
波斯语新闻数据集PersianNewsDataset-fatemehmahdibabaee
波斯语新闻数据集PersianNewsDataset-fatemehmahdibabaee 数据来源:互联网公开数据 标签:新闻,波斯语,数据集,自然语言处理,文本分析,机器学习,多语言,数据挖掘 数据概述: 该数据集包含来自波斯语新闻媒体的文章数据,记录了波斯语新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
新闻偏见分析数据集-subhankarpanda56
新闻偏见分析数据集-subhankarpanda56 数据来源:互联网公开数据 标签:新闻,偏见,文本分析,自然语言处理,情感分析,机器学习,舆情分析,媒体研究 数据概述: 该数据集包含来自多个新闻网站和媒体平台的新闻文章数据,用于分析新闻报道中的偏见。主要特征如下: 时间跨度:数据记录的时间范围为2016年至2020年。... -
社交媒体评论毒性检测数据集ToxicCommentDetectionDataset-reppic
社交媒体评论毒性检测数据集ToxicCommentDetectionDataset-reppic 数据来源:互联网公开数据 标签: 文本分析,自然语言处理,毒性检测,机器学习,评论数据,情感分析,文本分类,社交媒体 数据概述: 该数据集包含来自社交媒体平台的评论数据,主要用于毒性评论的检测与分析。主要特征如下: 时间跨度:... -
命名实体识别验证数据集NERCapstoneFinalValidationDataset-vibhagangolli
命名实体识别验证数据集NERCapstoneFinalValidationDataset-vibhagangolli 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,机器学习,文本分析,人工智能,信息提取,深度学习 数据概述:... -
新闻处理数据集NewsProcessedDataset-alice6fox
新闻处理数据集NewsProcessedDataset-alice6fox 数据来源:互联网公开数据 标签:新闻处理,数据集,文本分析,自然语言处理,机器学习,文本挖掘,数据分析,信息检索 数据概述:该数据集包含经过处理的新闻文章数据,记录了各类新闻报道的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。...