-
拼字检查与验证数据集NP-65k-Spell-ExamplesDataset-amardura
拼字检查与验证数据集NP-65k-Spell-ExamplesDataset-amardura 数据来源:互联网公开数据 标签:拼字检查,数据集,自然语言处理,文本分析,机器学习,语言技术,教育辅助,拼写验证 数据概述: 该数据集包含来自公开资源的大量拼字检查示例,主要用于验证和训练拼字检查模型。主要特征如下:... -
IMDB2023电影预告片评论数据集IMDBTopMovies2023TrailerCommentsDataset-jaseelck
IMDB2023电影预告片评论数据集IMDBTopMovies2023TrailerCommentsDataset-jaseelck 数据来源:互联网公开数据 标签:电影评论,数据集,情感分析,自然语言处理,机器学习,多媒体分析,用户行为,内容分析... -
微调数据集Fine-tuningDataset-inductiveanks
微调数据集Fine-tuningDataset-inductiveanks 数据来源:互联网公开数据 标签:微调,机器学习,数据集,自然语言处理,深度学习,文本分析,人工智能 数据概述:该数据集包含来自多个来源的文本数据,主要用于机器学习模型的微调任务。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
巴以冲突社交媒体情绪分析数据集SentimentFreePalestinein-appXSVMDataset-isranurrahayu
巴以冲突社交媒体情绪分析数据集SentimentFreePalestinein-appXSVMDataset-isranurrahayu 数据来源:互联网公开数据 标签:社交媒体,情绪分析,数据集,机器学习,巴以冲突,文本分析,自然语言处理,社会研究... -
阿拉伯语文本摘要数据集ArabicTextSummarizationDataset-fadyelkbeer
阿拉伯语文本摘要数据集ArabicTextSummarizationDataset-fadyelkbeer 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,阿拉伯语,深度学习,数据集,机器翻译,语言模型,NLP 数据概述: 该数据集包含大量阿拉伯语文本及其对应的摘要,旨在用于阿拉伯语文本摘要任务的研究与开发。主要特征如下:... -
微博社交媒体内容分析数据集WeiboPostsDataset-adelaideliu1999
微博社交媒体内容分析数据集WeiboPostsDataset-adelaideliu1999 数据来源:互联网公开数据 标签:社交媒体,微博,文本分析,情感分析,舆情监测,机器学习,自然语言处理,数据挖掘 数据概述: 该数据集包含来自微博平台的大量用户发布的内容,记录了微博用户发布的文本,图片,视频等多媒体信息。主要特征如下:... -
TFIGF问答综合数据集TGIF-QACombinedDataset-vishnu82
TFIGF问答综合数据集TGIF-QACombinedDataset-vishnu82 数据来源:互联网公开数据 标签:问答系统,视频理解,数据集,自然语言处理,计算机视觉,机器学习,多媒体分析,人工智能 数据概述:该数据集包含来自TGIF(Talk to GIF)项目的问答数据,记录了用户对GIF图像的自然语言问答记录。主要特征如下:... -
Tiki电商平台评论数据集TikiCommentDataset-lhhhhl
Tiki电商平台评论数据集TikiCommentDataset-lhhhhl 数据来源:互联网公开数据 标签:电商,评论数据,文本分析,情感分析,自然语言处理,用户行为,产品评价,机器学习 数据概述: 该数据集包含来自越南电商平台Tiki的商品评论数据,记录了用户对商品的使用评价。主要特征如下: 时间跨度: 数据记录的时间范围为2017年至2022年。... -
新冠疫情推特文本数据集COVID-19TwitterTextDataset-kinggeogt
新冠疫情推特文本数据集COVID-19TwitterTextDataset-kinggeogt 数据来源:互联网公开数据 标签:新冠疫情,推特,社交媒体,文本分析,自然语言处理,情感分析,公共卫生,数据集 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,记录了与新冠疫情相关的大量文本信息。主要特征如下:... -
可口可乐产品问答数据集Coca-ColaProductQuestionAnsweringDataset-vedantpalit
可口可乐产品问答数据集Coca-ColaProductQuestionAnsweringDataset-vedantpalit 数据来源:互联网公开数据 标签:可口可乐,问答,自然语言处理,数据集,文本分析,情感分析,机器学习,产品信息 数据概述: 该数据集包含可口可乐产品的相关问答数据,旨在为自然语言处理任务提供训练和测试资源。主要特征如下:... -
新冠疫情虚假新闻数据集COVID-19FakeNewsDataset-invalizare
新冠疫情虚假新闻数据集COVID-19FakeNewsDataset-invalizare 数据来源:互联网公开数据 标签:新冠疫情,虚假新闻,数据集,文本分析,自然语言处理,谣言检测,舆情分析,社交媒体 数据概述: 该数据集收录了关于新冠疫情的虚假新闻和真实新闻,旨在用于虚假信息检测和分析。主要特征如下:... -
推特情感分析伪标签数据集TwitterSentimentAnalysisPseudo-labelledDataset-thanatoz
推特情感分析伪标签数据集TwitterSentimentAnalysisPseudo-labelledDataset-thanatoz 数据来源:互联网公开数据 标签:情感分析,数据集,社交媒体,机器学习,自然语言处理,文本分类,伪标签,情感识别 数据概述: 该数据集包含来自推特的文本数据,记录了推文内容及其相应的情感标签。主要特征如下:... -
词汇意义消歧WordSenseDisambiguation数据集Word-Sense-Disambiguation-WSD-Dataset-with-Se...
词汇意义消歧WordSenseDisambiguation数据集Word-Sense-Disambiguation-WSD-Dataset-with-Senses-shreyswan 数据来源:互联网公开数据 标签:自然语言处理,词汇意义消歧,数据集,语言建模,文本分析,语义理解,机器学习,语言学 数据概述:... -
Llama1模型生成第一步数据集Generation1Step1Dataset-thaonguen
Llama1模型生成第一步数据集Generation1Step1Dataset-thaonguen 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器学习,Llama,Transformer,语言模型,预训练 数据概述: 该数据集包含用于 Llama 1 模型第一步训练的数据,主要用于构建基础的语言模型。主要特征如下:... -
大型语言模型生成器数据集LLMS生成器数据集-ranimmhisham
大型语言模型生成器数据集LLMS生成器数据集-ranimmhisham 数据来源:互联网公开数据 标签:语言模型,生成器,数据集,自然语言处理,机器学习,文本生成,人工智能,深度学习 数据概述:该数据集包含来自多个来源的文本数据,用于训练大型语言模型生成器,记录了各种类型的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
摩洛哥新闻文章数据集MorrocanNewsArticlesDataset-sihamemouanid
摩洛哥新闻文章数据集MorrocanNewsArticlesDataset-sihamemouanid 数据来源:互联网公开数据 标签:新闻,摩洛哥,文本分析,自然语言处理,数据集,阿拉伯语,法语,情感分析,舆情分析 数据概述: 该数据集包含来自摩洛哥新闻网站的文章数据,记录了摩洛哥新闻媒体发布的文章内容。主要特征如下:... -
攻击实验与情感分析数据集AttackResultsSST-2Dataset-churubo
攻击实验与情感分析数据集AttackResultsSST-2Dataset-churubo 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,攻击检测,文本分类,网络安全,人工智能 数据概述: 该数据集包含来自斯坦福情感树库(SST-2)的攻击实验结果数据,记录了对情感分析模型的攻击行为及其影响。主要特征如下:... -
基于ChatTTS的语音嵌入数据集-xzj19013742
基于ChatTTS的语音嵌入数据集-xzj19013742 数据来源:互联网公开数据 标签:语音识别,语音合成,数据集,深度学习,自然语言处理,嵌入学习,语音分析,机器学习 数据概述: 该数据集包含基于ChatTTS生成的语音嵌入数据,旨在用于语音合成和语音识别任务。主要特征如下: 时间跨度:数据生成时间为近期。 地理范围:数据不涉及特定地理位置。... -
微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves
微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,机器学习,自然语言处理,数据分析,信息提取,时间序列 数据概述: 该数据集包含来自微软公司官方新闻发布的数据,记录了微软公司自1999年至2023年间的新闻内容。主要特征如下:... -
亚马逊Top20畅销书评论数据集2021年-ahmedalielmokhtar
亚马逊Top20畅销书评论数据集2021年-ahmedalielmokhtar 数据来源:互联网公开数据 标签:亚马逊,畅销书,书籍评论,数据分析,市场研究,消费者行为,自然语言处理,阅读偏好 数据概述: 该数据集包含来自亚马逊网站的畅销书评论数据,记录了2021年亚马逊平台上销量排名前20的书籍的用户评论。主要特征如下: 时间跨度:...