-
星球大战剧本台词数据集StarWarsScriptsAllLinesDataset-dvidspais123
星球大战剧本台词数据集StarWarsScriptsAllLinesDataset-dvidspais123 数据来源:互联网公开数据 标签:星球大战,剧本,台词,数据集,文本分析,电影研究,自然语言处理,影视作品 数据概述: 该数据集包含了星球大战系列电影的所有台词数据,记录了电影中的对话内容和角色信息。主要特征如下:... -
网络平台仇恨言论数据集GNHateSpeechDataset-zohaibhasansiddiqui
网络平台仇恨言论数据集GNHateSpeechDataset-zohaibhasansiddiqui 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,社交媒体,自然语言处理,机器学习,数据分析,人工智能 数据概述: 该数据集包含来自网络平台的仇恨言论数据,记录了各类社交媒体平台上发布的内容。主要特征如下:... -
网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike3633
网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike3633 数据来源:互联网公开数据 标签:网络欺凌,数据集,文本分析,自然语言处理,机器学习,情感分析,社交媒体,欺凌检测 数据概述: 该数据集包含来自社交媒体平台的文本数据,主要用于识别和分析网络欺凌行为。主要特征如下:... -
越南假新闻检测数据集PhảnhồiBìnhLuận2017-goumanguyen
越南假新闻检测数据集PhảnhồiBìnhLuận2017-goumanguyen 数据来源:互联网公开数据 标签:假新闻,数据集,文本分析,自然语言处理,机器学习,信息诈骗,舆论监控,社会研究 数据概述: 该数据集包含来自越南“Phản hồi Bình Luận”平台的评论数据,记录了关于假新闻的文章及其评论。主要特征如下:... -
多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr
多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:... -
乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan
乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan 数据来源:互联网公开数据 标签:诗歌,乌尔都语,罗马体,文本分析,自然语言处理,语言学,数据集,文化研究 数据概述: 该数据集包含了用罗马字母转写的乌尔都语诗歌,旨在促进乌尔都语诗歌的文本分析和研究。主要特征如下: 时间跨度:... -
手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth
手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth 数据来源:互联网公开数据 标签:电子产品,手机,数据集,文本分析,自然语言处理,产品描述,市场研究,信息提取 数据概述: 该数据集包含来自多个电商平台和手机品牌官方网站的手机产品描述数据,记录了各类手机产品的详细信息。主要特征如下:... -
医疗转录数据集MedicalTranscriptionSamplesDataset-oyesaurav
医疗转录数据集MedicalTranscriptionSamplesDataset-oyesaurav 数据来源:互联网公开数据 标签:医疗,转录,临床,文本分析,自然语言处理,数据集,健康,医学 数据概述: 该数据集包含来自MT Samples的临床转录数据,记录了医疗领域的各种临床报告和病历。主要特征如下:... -
邮件分类数据集EmailCategoriesDataset-tobniislam
邮件分类数据集EmailCategoriesDataset-tobniislam 数据来源:互联网公开数据 标签:邮件分类,文本分析,自然语言处理,数据集,机器学习,情感分析,文本挖掘,信息检索 数据概述: 该数据集包含来自不同来源的电子邮件数据,旨在用于邮件分类和文本分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,取决于具体来源。... -
句子嵌入表示数据集SentenceEmbeddingDataset-dm4006
句子嵌入表示数据集SentenceEmbeddingDataset-dm4006 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,深度学习,语义检索,信息提取,人工智能 数据概述: 该数据集包含大量的句子及其对应的嵌入向量表示,记录了文本数据通过特定算法生成的向量特征。主要特征如下:... -
歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa
歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa 数据来源:互联网公开数据 标签:歌词,翻译,数据集,音乐,自然语言处理,文本分析,多语言,机器翻译 数据概述: 该数据集包含了大量歌曲的歌词及其对应的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年代的歌曲。... -
Alpaca新闻文章数据集2018-2023-prabhuanem
Alpaca新闻文章数据集2018-2023-prabhuanem 数据来源:互联网公开数据 标签:新闻文章,数据集,自然语言处理,文本分析,时间序列,机器学习,新闻媒体,金融 数据概述:该数据集包含来自 Alpaca 平台的新闻文章数据,记录了自2018年至2023年期间发布的新闻文章。主要特征如下:... -
古腾堡出版物订单数据集GutenbergPublicationsOrdersDataset-imumerfarooq
古腾堡出版物订单数据集GutenbergPublicationsOrdersDataset-imumerfarooq 数据来源:互联网公开数据 标签:出版物,订单数据,古腾堡项目,文本分析,自然语言处理,数据集,电子书,销售分析 数据概述: 该数据集包含来自古腾堡项目(Project... -
新闻分类数据集AgNewsClassificationDataset-jatinsareen
新闻分类数据集AgNewsClassificationDataset-jatinsareen 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,文本分析,机器学习,深度学习,文本挖掘,信息检索 数据概述:该数据集包含来自Ag News的数据,记录了各类新闻文章的标题和内容,适用于新闻分类和文本分析任务。主要特征如下:... -
亚马逊商品文本数据提取数据集AmazonProductTextDataExtractionDataset-sahilsasane
亚马逊商品文本数据提取数据集AmazonProductTextDataExtractionDataset-sahilsasane 数据来源:互联网公开数据 标签:电子商务,文本分析,数据集,自然语言处理,机器学习,商品信息,数据挖掘,商业智能 数据概述: 该数据集包含来自亚马逊平台的商品文本数据,记录了亚马逊网站上各类商品的详细信息。主要特征如下:... -
数据17k酒店评论数据集17kHotelReviewsDataset-adityadatta1234
17k酒店评论数据集17kHotelReviewsDataset-adityadatta1234 数据来源:互联网公开数据 标签:酒店评论,数据集,文本分析,情感分析,自然语言处理,旅游行业,机器学习,消费者行为 数据概述: 该数据集包含来自17,000多条酒店评论的数据,记录了消费者对酒店服务的评价和反馈。主要特征如下:... -
社交媒体评论净化数据集CommentsCleaningDataset-banbeipi
社交媒体评论净化数据集CommentsCleaningDataset-banbeipi 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,情感分析,文本清洗,机器学习,社交媒体,评论 数据概述: 该数据集包含来自社交媒体平台的评论数据,主要用于文本清洗和情感分析研究。主要特征如下:... -
翻译数据数据集TranslatedDataDataset-krsna540
翻译数据数据集TranslatedDataDataset-krsna540 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,机器学习,自然语言处理,多语言,文本分析,数据转换 数据概述: 该数据集包含来自互联网的翻译数据,记录了不同语言之间的文本翻译结果。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
俄罗斯虚假信息翻译数据集RO-FACleanTranslateDataset-ilikehaskell
俄罗斯虚假信息翻译数据集RO-FACleanTranslateDataset-ilikehaskell 数据来源:互联网公开数据 标签:虚假信息,翻译,数据集,俄语,英语,文本分析,自然语言处理,机器翻译 数据概述: 该数据集包含了从俄罗斯来源获取的虚假信息文本,并提供了对应的英语翻译。主要特征如下:... -
VADER情感分析平衡数据集BalancedSentimentVADERCSVDataset-ahmadseloabadi
VADER情感分析平衡数据集BalancedSentimentVADERCSVDataset-ahmadseloabadi 数据来源:互联网公开数据 标签:情感分析,文本分析,数据集,自然语言处理,机器学习,情感分类,VADER,平衡数据集 数据概述: 该数据集包含经过VADER(Valence Aware Dictionary and...