-
乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan
乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,乌尔都语,罗马转写,情感分析,机器学习,语言学,数据集 数据概述: 该数据集来自加州大学欧文分校(UCI),包含了乌尔都语的罗马转写文本数据,主要用于自然语言处理和文本分析研究。主要特征如下:... -
阿拉伯语车票文本数据集ArabicTweetsforTicketsTextsDataset-lamakhalilalhazmi
阿拉伯语车票文本数据集ArabicTweetsforTicketsTextsDataset-lamakhalilalhazmi 数据来源:互联网公开数据 标签:阿拉伯语,文本分析,数据集,社交媒体,机器学习,情感分析,自然语言处理,情感识别 数据概述:... -
大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen
大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,上下文理解,文本分析,机器学习,人工智能,语义分析 数据概述:... -
柏林LinkedIn数据科学与分析职位招聘信息数据集-2024年-wilomentena
柏林LinkedIn数据科学与分析职位招聘信息数据集-2024年-wilomentena 数据来源:互联网公开数据 标签:数据分析,数据科学,数据工程师,招聘,职位,柏林,LinkedIn,NLP,自然语言处理,市场分析,技能需求 数据概述:... -
英语测试数据集EnglishTestDataDataset-prateek3g
英语测试数据集EnglishTestDataDataset-prateek3g 数据来源:互联网公开数据 标签:英语测试,数据集,语言学习,教育技术,机器学习,自然语言处理,教育研究,标准化考试 数据概述: 该数据集包含来自英语测试领域的标准化考试数据,记录了英语学习者的测试成绩和相关信息。主要特征如下:... -
印度BERT微调数据集IndianDatasetforFinetuningofBERT-yashtiwari1906
印度BERT微调数据集IndianDatasetforFinetuningofBERT-yashtiwari1906 数据来源:互联网公开数据 标签:印度,BERT,微调,自然语言处理,机器学习,数据集,文本分析,人工智能 数据概述:该数据集包含来自印度的各种文本数据,适用于BERT模型的微调和自然语言处理任务。主要特征如下:... -
英语翻译数据集EnglishTranslatedDataset-tasnim34
英语翻译数据集EnglishTranslatedDataset-tasnim34 数据来源:互联网公开数据 标签:英语翻译,数据集,自然语言处理,机器学习,文本分析,语言学,学术研究,语言技术 数据概述:该数据集包含来自多个来源的英语翻译文本数据,记录了原文本及其翻译版本。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
电影评论分析数据集MovieReviewsAnalysisDataset-khushigupta1605
电影评论分析数据集MovieReviewsAnalysisDataset-khushigupta1605 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本分类,数据挖掘,人工智能 数据概述: 该数据集包含来自电影评论网站的数据,记录了用户对电影的评论内容及其情感倾向。主要特征如下:... -
越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh
越南快讯新闻文章数据集VnExpressNewsArticleDataset-trnnhtminh 数据来源:互联网公开数据 标签:新闻文章,越南,自然语言处理,文本分析,数据集,情感分析,主题分类,信息检索 数据概述: 该数据集包含了来自越南新闻网站VnExpress的文章数据,记录了该网站上发布的新闻文章的详细信息。主要特征如下:... -
阿萨姆语情感分析数据集AssameseSentimentsDataset-ritikjain00
阿萨姆语情感分析数据集AssameseSentimentsDataset-ritikjain00 数据来源:互联网公开数据 标签:情感分析,阿萨姆语,自然语言处理,数据集,文本分类,机器学习,语言学,印度 数据概述: 该数据集包含来自互联网的阿萨姆语文本数据,用于情感分析任务,记录了阿萨姆语文本的情感倾向。主要特征如下:... -
Kaggle文档合成数据集KaggleDocsSyntheticDataset-zohadev
Kaggle文档合成数据集KaggleDocsSyntheticDataset-zohadev 数据来源:互联网公开数据 标签:数据集,合成数据,文本分析,机器学习,自然语言处理,数据挖掘,文档处理,人工智能 数据概述: 该数据集包含来自Kaggle平台文档的合成数据,记录了文档内容的结构化信息。主要特征如下:... -
标注词语数据集AnnotatedWordsDataset-abdelhakch
标注词语数据集AnnotatedWordsDataset-abdelhakch 数据来源:互联网公开数据 标签:词语标注,自然语言处理,数据集,文本分析,机器学习,语言学,词性标注,学术研究 数据概述:该数据集包含来自互联网公开资源的词语标注数据,记录了词语的详细信息及其在文本中的作用。主要特征如下:... -
旅行预订应用用户评论数据集TravelokaPlayStoreReviewDataset-aditiyasaputra
旅行预订应用用户评论数据集TravelokaPlayStoreReviewDataset-aditiyasaputra 数据来源:互联网公开数据 标签:旅行预订,用户评论,数据集,情感分析,应用评价,用户体验,旅游行业,自然语言处理 数据概述: 该数据集包含来自Google... -
推特航空公司情感分析数据集TwitterAirlineSentimentDataset-saeedaslimanesh
推特航空公司情感分析数据集TwitterAirlineSentimentDataset-saeedaslimanesh 数据来源:互联网公开数据 标签:情感分析,推特数据,航空公司,自然语言处理,文本分析,机器学习,舆情分析,社交媒体 数据概述: 该数据集包含来自推特(Twitter)的推文数据,主要记录了用户对航空公司的情感反馈。主要特征如下:... -
南方公园剧本对话数据集-2001至2023年-mustafacicek
南方公园剧本对话数据集-2001至2023年-mustafacicek 数据来源:互联网公开数据 标签:南方公园,剧本,对话,自然语言处理,NLP,数据可视化,推荐系统,电视剧分析 数据概述: 本数据集包含南方公园(South Park)自2001年至2023年的剧本对话记录,涵盖超过300集,超过95000行对话。数据集分为两个文件:... -
文本转Pandas代码数据集-2021-zeyadusf
文本转Pandas代码数据集-2021-zeyadusf 数据来源:互联网公开数据 标签:文本转代码,数据预处理,机器学习,自然语言处理,数据集,编程,教育,科研 数据概述:... -
新闻追踪与分析数据集NewsTrailandAnalysisDataset-axword
新闻追踪与分析数据集NewsTrailandAnalysisDataset-axword 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,机器学习,自然语言处理,信息提取,舆情分析,媒体研究 数据概述: 该数据集包含来自各大新闻媒体和在线新闻平台的数据,记录了新闻文章,标题,发布时间,来源网站及关键词等信息。主要特征如下:... -
电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-hudairr
电子邮件垃圾邮件检测数据集EmailSpamDetectionDataset-hudairr 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分析,机器学习,自然语言处理,网络安全,信息过滤 数据概述: 该数据集包含来自多个来源的电子邮件数据,记录了大量标记为垃圾邮件和非垃圾邮件的电子邮件内容。主要特征如下:... -
汉字华语处理句对数据集-yuweiiizz
汉字华语处理句对数据集-yuweiiizz 数据来源:互联网公开数据 标签:汉字,华语,自然语言处理,机器翻译,语义分析,方言学,语料库,文本挖掘 数据概述: 本数据集包含传统中文与现代中文或台式中文之间的配对句子,旨在促进自然语言处理任务,特别是机器翻译和语义分析。每个数据对由一条传统中文句子及其等效的现代中文或台式中文句子组成。 数据用途概述:... -
情感分析140类数据集SentimentAnalysis140-classDataset-saswatarautray
情感分析140类数据集SentimentAnalysis140-classDataset-saswatarautray 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本分类,机器学习,情感计算,计算机科学,人工智能 数据概述: 该数据集包含来自互联网公开来源的情感分析数据,记录了140类不同情感标签的文本数据。主要特征如下:...