-
华尔街赌注论坛评论数据集WallStreetBetsCommentsDataset-adrienchaussabel
华尔街赌注论坛评论数据集WallStreetBetsCommentsDataset-adrienchaussabel 数据来源:互联网公开数据 标签:股票评论,社交媒体,金融市场,情绪分析,自然语言处理,文本挖掘,数据集,投资策略 数据概述: 该数据集包含了来自华尔街赌注(WallStreetBets,... -
文本相似度分析数据集TextSimilarityAnalysisDataset-hoorayyliu
文本相似度分析数据集TextSimilarityAnalysisDataset-hoorayyliu 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 语义分析, 数据标注, 机器学习, 对比分析, 语料库 数据概述:... -
维基文本嵌入数据集WikitextTextEmbeddingsDataset-hozaifazaki99
维基文本嵌入数据集WikitextTextEmbeddingsDataset-hozaifazaki99 数据来源:互联网公开数据 标签:文本嵌入,自然语言处理,数据集,机器学习,词向量,文本分析,语言模型,维基百科 数据概述:... -
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-bajajra
命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-bajajra 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 机器学习, 深度学习, 语料库, BERT 数据概述:... -
阿拉伯语推广数据集ArabicPromoteDataset-ibrahim2002
阿拉伯语推广数据集ArabicPromoteDataset-ibrahim2002 数据来源:互联网公开数据 标签:阿拉伯语,数据集,机器学习,自然语言处理,文本分类,语言技术,翻译研究,人工智能 数据概述: 该数据集包含阿拉伯语的推广文本数据,记录了不同类型的推广内容及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围未明确,推测为近年数据。... -
越南医疗新闻文本分析数据集VietnamMedicalNewsTextAnalysisDataset-linhmaikhnh
越南医疗新闻文本分析数据集VietnamMedicalNewsTextAnalysisDataset-linhmaikhnh 数据来源:互联网公开数据 标签:医疗新闻, 文本分析, 自然语言处理, 新闻摘要, 情感分析, 信息抽取, 越南语, 数据挖掘 数据概述:... -
中东地区虚假信息识别数据集MiddleEastMisinformationIdentificationDataset-reemaaljbreen
中东地区虚假信息识别数据集MiddleEastMisinformationIdentificationDataset-reemaaljbreen 数据来源:互联网公开数据 标签:虚假信息, 事实核查, 文本分析, 社交媒体, 阿拉伯语, 谣言检测, 内容审核, 自然语言处理 数据概述:... -
大规模推特社交媒体数据分析数据集BigTwitterDataset-fardeenmohammad
大规模推特社交媒体数据分析数据集BigTwitterDataset-fardeenmohammad 数据来源:互联网公开数据 标签:社交媒体,推特,数据集,文本分析,自然语言处理,情感分析,用户行为,大数据 数据概述: 该数据集包含来自推特(Twitter)的公开数据,记录了推特用户的推文、用户资料、互动信息等。主要特征如下:... -
机器学习训练视频库数据集ML-TrainingVLibDataset-zoupet
机器学习训练视频库数据集ML-TrainingVLibDataset-zoupet 数据来源:互联网公开数据 标签:机器学习,视频,训练,数据集,计算机视觉,自然语言处理,深度学习,教学资源 数据概述: 该数据集包含来自互联网的机器学习教学视频资源,旨在为机器学习研究和教育提供支持。主要特征如下:... -
服装图片描述数据集ApparelImageCaptioning-whynamee
服装图片描述数据集ApparelImageCaptioning-whynamee 数据来源:互联网公开数据 标签:图像识别, 文本生成, 服装, 图像描述, 深度学习, 计算机视觉, 自然语言处理, 数据集 数据概述: 该数据集包含服装图片及其对应的描述文本,旨在促进图像描述、图像检索等任务的研究与应用。主要特征如下:... -
越南语问答意图识别数据集VietnameseQuestionAnsweringIntentRecognitionDataset-khanhdaom
越南语问答意图识别数据集VietnameseQuestionAnsweringIntentRecognitionDataset-khanhdaom 数据来源:互联网公开数据 标签:自然语言处理, 意图识别, 问答系统, 文本分类, 越南语, 机器学习, 对话系统, 语料库 数据概述:... -
药物名称数据集UCIDrugNameDataset-ahmedalghali
药物名称数据集UCIDrugNameDataset-ahmedalghali 数据来源:互联网公开数据 标签:药物名称,数据集,药理学,医学,数据清洗,信息检索,自然语言处理,健康科学 数据概述:该数据集来源于UCI机器学习库,记录了多种药物的相关信息,包括药物名称、品牌名称、药物类别、活性成分等。主要特征如下:... -
印度对话式语音识别数据集SAMVAAD-HIV1Dataset-harveenchadha
印度对话式语音识别数据集SAMVAAD-HIV1Dataset-harveenchadha 数据来源:互联网公开数据 标签:语音识别,对话系统,数据集,自然语言处理,机器学习,印度语,人工智能,多语言 数据概述: 该数据集包含来自印度地区的对话式语音数据,记录了印度语(印地语)的语音对话样本。主要特征如下:... -
公司治理结构文本分析数据集CorporateGovernanceTextAnalysisDataset-lemonlulu
公司治理结构文本分析数据集CorporateGovernanceTextAnalysisDataset-lemonlulu 数据来源:互联网公开数据 标签:公司治理, 文本分析, SEC文件, CDA文本, 财务报告, 董事会, 治理结构, 自然语言处理 数据概述:... -
阿拉伯语文本情感分析数据集-nanorfelixsam
阿拉伯语文本情感分析数据集-nanorfelixsam 数据来源:互联网公开数据 标签:阿拉伯语,情感分析,文本数据,自然语言处理,机器学习,NLP,语言学,情感分类 数据概述: 该数据集包含来自互联网的阿拉伯语文本数据,用于阿拉伯语文本情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期互联网上的阿拉伯语文本。... -
虚假新闻预测数据集-gauravpahwa143
虚假新闻预测数据集-gauravpahwa143 数据来源:互联网公开数据 标签:虚假新闻,新闻分析,自然语言处理,机器学习,文本分类,信息真实性,数据挖掘,社会学 数据概述:该数据集包含来自多个来源的关于虚假新闻和真实新闻的数据,旨在用于虚假新闻的识别和分析。主要特征如下:... -
亚马逊用户商品评价数据集AmazonReviewsDataset-amitghatelwal
亚马逊用户商品评价数据集AmazonReviewsDataset-amitghatelwal 数据来源:互联网公开数据 标签:电商,用户评价,文本分析,情感分析,自然语言处理,机器学习,推荐系统,消费者行为 数据概述: 该数据集包含来自亚马逊的用户商品评价数据,记录了用户对商品的详细评价和相关信息。主要特征如下:... -
社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-rahuldshetty
社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-rahuldshetty 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本挖掘, 自然语言处理, 机器学习, 推文, 情绪分类, 情感极性 数据概述: 该数据集包含来自社交媒体平台推文数据,主要用于情感分析和文本挖掘任务。主要特征如下:... -
医学文献文本分类数据集MedicalLiteratureTextClassification-lunanana1999
医学文献文本分类数据集MedicalLiteratureTextClassification-lunanana1999 数据来源:互联网公开数据 标签:医学文本, 文本分类, 疾病诊断, 医疗研究, 自然语言处理, 机器学习, 语料库, 临床医学 数据概述: 该数据集包含来自医学文献的文本数据,记录了用于疾病诊断和医学研究的文本片段。主要特征如下:... -
虚假新闻检测真实与虚假数据集FakeNewsDetection-RealorFakeDataset-unarinemukwevho
虚假新闻检测真实与虚假数据集FakeNewsDetection-RealorFakeDataset-unarinemukwevho 数据来源:互联网公开数据 标签:新闻分析,数据集,虚假信息,自然语言处理,机器学习,文本分类,信息传播,网络安全 数据概述: 该数据集包含来自网络公开渠道的新闻文章数据,记录了新闻文本及其标签(真实或虚假)。主要特征如下:...