-
多语言机器阅读理解与印地语问答数据集MLQAXQUADHindiDataset-aashitadutta
多语言机器阅读理解与印地语问答数据集MLQAXQUADHindiDataset-aashitadutta 数据来源:互联网公开数据 标签:机器学习,自然语言处理,阅读理解,多语言,印地语,问答系统,数据集,人工智能 数据概述:... -
书籍嵌入数据集EmbeddingBookData-jojoyin
书籍嵌入数据集EmbeddingBookData-jojoyin 数据来源:互联网公开数据 标签:书籍,嵌入,自然语言处理,文本分析,机器学习,推荐系统,语义相似度,数据集 数据概述: 该数据集包含书籍的嵌入表示,旨在捕捉书籍在语义空间中的关系。主要特征如下: 时间跨度:数据记录无明确时间范围,主要基于书籍内容构建嵌入。... -
词嵌入训练数据集-akalyasubramanian
词嵌入训练数据集-akalyasubramanian 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,文本分析,机器学习,语义分析,文本挖掘,语言模型 数据概述: 该数据集包含用于训练词嵌入模型的大量文本数据,主要用于学习词语的语义表示。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同历史时期的文本数据。 地理范围:... -
视频嵌入数据集GetVideoEmbeddingsData-garvk123
视频嵌入数据集GetVideoEmbeddingsData-garvk123 数据来源:互联网公开数据 标签:视频分析,数据集,嵌入,机器学习,计算机视觉,视频检索,自然语言处理,多模态 数据概述: 该数据集包含视频及其对应的嵌入向量,旨在用于视频分析,理解和检索任务。主要特征如下:... -
土耳其2020年5月推特账户数据集TwitterTürkiyeMayıs20207340HesaplarDataseti-okayakca
土耳其2020年5月推特账户数据集TwitterTürkiyeMayıs20207340HesaplarDataseti-okayakca 数据来源:互联网公开数据 标签:推特,社交媒体,数据集,用户分析,文本分析,机器学习,自然语言处理,社会学 数据概述:... -
航空公司推特评论数据集TwitterTweetDatasetforAirlineReviews-divyanshnautiyal
航空公司推特评论数据集TwitterTweetDatasetforAirlineReviews-divyanshnautiyal 数据来源:互联网公开数据 标签:航空公司,社交媒体,数据集,情感分析,文本挖掘,自然语言处理,客户评论,机器学习 数据概述: 该数据集包含来自推特平台的航空公司评论数据,记录了用户对航空公司的评论和反馈。主要特征如下:... -
社交媒体用户情绪分析数据集SentimentAnalysisFinalProjectDataset-mandalaandika
社交媒体用户情绪分析数据集SentimentAnalysisFinalProjectDataset-mandalaandika 数据来源:互联网公开数据 标签:社交媒体,情绪分析,自然语言处理,数据集,情感分析,文本挖掘,机器学习,用户行为 数据概述: 该数据集来源于一项最终项目,旨在分析社交媒体平台上的用户情绪。主要特征如下:... -
自然语言处理多分类XLM-R数据集NLPMulticlassXLM-RDataset-aeryss
自然语言处理多分类XLM-R数据集NLPMulticlassXLM-RDataset-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类,数据集,XLM-R,文本分类,深度学习,机器学习,语言模型 数据概述: 该数据集专注于自然语言处理中的多分类任务,采用了XLM-R(跨语言语言模型)进行文本分类。主要特征如下:... -
客户评论数据集CustomerReviewsDataset-floflo222
客户评论数据集CustomerReviewsDataset-floflo222 数据来源:互联网公开数据 标签:客户评论,数据集,情感分析,自然语言处理,机器学习,文本挖掘,商业智能,用户体验 数据概述: 该数据集包含来自各类商业平台和网站的客户评论数据,记录了消费者对产品或服务的评价信息。主要特征如下:... -
安然公司行动项检测数据集EnronActionItemDetectionDataset-scottisaacson
安然公司行动项检测数据集EnronActionItemDetectionDataset-scottisaacson 数据来源:互联网公开数据 标签:企业邮件,文本分析,数据集,自然语言处理,机器学习,信息提取,商业智能,法律合规 数据概述: 该数据集包含来自安然公司(Enron... -
英语高频词汇统计数据集-sudosharma
英语高频词汇统计数据集-sudosharma 数据来源:互联网公开数据 标签:英语,词汇,数据集,语言学,频率分析,自然语言处理,文本分析,词频统计 数据概述:该数据集包含了英语中出现频率最高的一批词汇,记录了这些词汇及其对应的出现频率。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于语料库的更新。 地理范围:数据覆盖范围为英语通用语料库。... -
语音识别输出数据集KS0721V3-01WhisperOutDataset-liumail511
语音识别输出数据集KS0721V3-01WhisperOutDataset-liumail511 数据来源:互联网公开数据 标签:语音识别,数据集,语音转文本,人工智能,自然语言处理,机器学习,音频处理,科技研究 数据概述: 该数据集由KS0721V3项目提供,主要记录了Whisper模型的语音转文本输出结果。主要特征如下:... -
文本分类数据集TextClassificationData-nbviet
文本分类数据集TextClassificationData-nbviet 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,主题建模,信息检索,文本挖掘 数据概述: 该数据集包含来自多个来源的文本数据,用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于具体来源。... -
情感识别数据集GoEmotionsDataset-enesztrk
情感识别数据集GoEmotionsDataset-enesztrk 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本分类,机器学习,情感识别,社交媒体,情绪分析 数据概述: 该数据集是GoEmotions项目的一部分,旨在促进情感分析和情绪识别研究。主要特征如下:... -
医生与患者对话数据集Doctor-PatientConversationDataset-azmayensabil
医生与患者对话数据集Doctor-PatientConversationDataset-azmayensabil 数据来源:互联网公开数据 标签:医疗健康,对话分析,数据集,自然语言处理,医疗文本,人机交互,临床研究,人工智能 数据概述: 该数据集包含来自医疗场景的医生与患者对话记录,记录了临床诊疗过程中的交流内容。主要特征如下:... -
股票市场情感分析数据集StockSentimentVNDataset-ngtrnhhong
股票市场情感分析数据集StockSentimentVNDataset-ngtrnhhong 数据来源:互联网公开数据 标签:股票市场,情感分析,数据集,自然语言处理,金融科技,机器学习,数据挖掘,市场研究 数据概述: 该数据集包含来自股票市场的情感分析数据,记录了与股票相关的新闻文章,社交媒体帖子,评论等文本内容及其情感倾向。主要特征如下:... -
印地语语流中断数据集HindiDisfluencyDataset-daspinaki
印地语语流中断数据集HindiDisfluencyDataset-daspinaki 数据来源:互联网公开数据 标签:语言处理,语料库,数据分析,语音识别,自然语言处理,机器学习,语言学,印地语 数据概述: 该数据集包含来自印地语的语流中断语音和文本数据,记录了印地语语音中的中断,重复,修正等非流畅现象。主要特征如下:... -
提示注入变异数据集
提示注入变异数据集 数据来源:互联网公开数据 标签:提示注入,变异数据,安全分析,自然语言处理,机器学习,文本生成,对抗攻击,数据增强,模型鲁棒性 数据概述:... -
比特币情绪分析数据集BitcoinRedditSentimentDataset-paulsero
比特币情绪分析数据集BitcoinRedditSentimentDataset-paulsero 数据来源:互联网公开数据 标签:比特币,情绪分析,社交媒体,Reddit,情感分析,自然语言处理,金融,区块链 数据概述: 该数据集包含来自Reddit平台的比特币相关讨论数据,记录了用户对加密货币比特币的情绪表达。主要特征如下:... -
单词批处理与梯度提升决策树模型WordBatchLGBMSeed1Dataset-sihaodi
单词批处理与梯度提升决策树模型WordBatchLGBMSeed1Dataset-sihaodi 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,梯度提升决策树,文本处理,模型训练,数据挖掘,算法研究 数据概述:...