数据集 - 海数据

新冠疫情推特文本数据集COVID-19TwitterTextDataset-kinggeogt

2025年4月25日

新冠疫情推特文本数据集COVID-19TwitterTextDataset-kinggeogt 数据来源：互联网公开数据标签：新冠疫情，推特，社交媒体，文本分析，自然语言处理，情感分析，公共卫生，数据集数据概述：该数据集包含来自推特（Twitter）的公开推文数据，记录了与新冠疫情相关的大量文本信息。主要特征如下：...

ZIP

可口可乐产品问答数据集Coca-ColaProductQuestionAnsweringDataset-vedantpalit

2025年4月25日

可口可乐产品问答数据集Coca-ColaProductQuestionAnsweringDataset-vedantpalit 数据来源：互联网公开数据标签：可口可乐，问答，自然语言处理，数据集，文本分析，情感分析，机器学习，产品信息数据概述：该数据集包含可口可乐产品的相关问答数据，旨在为自然语言处理任务提供训练和测试资源。主要特征如下：...

ZIP

新冠疫情虚假新闻数据集COVID-19FakeNewsDataset-invalizare

2025年4月25日

新冠疫情虚假新闻数据集COVID-19FakeNewsDataset-invalizare 数据来源：互联网公开数据标签：新冠疫情，虚假新闻，数据集，文本分析，自然语言处理，谣言检测，舆情分析，社交媒体数据概述：该数据集收录了关于新冠疫情的虚假新闻和真实新闻，旨在用于虚假信息检测和分析。主要特征如下：...

ZIP

推特情感分析伪标签数据集TwitterSentimentAnalysisPseudo-labelledDataset-thanatoz

2025年4月25日

推特情感分析伪标签数据集TwitterSentimentAnalysisPseudo-labelledDataset-thanatoz 数据来源：互联网公开数据标签：情感分析，数据集，社交媒体，机器学习，自然语言处理，文本分类，伪标签，情感识别数据概述：该数据集包含来自推特的文本数据，记录了推文内容及其相应的情感标签。主要特征如下：...

ZIP

词汇意义消歧WordSenseDisambiguation数据集Word-Sense-Disambiguation-WSD-Dataset-with-Se...

2025年4月25日

词汇意义消歧WordSenseDisambiguation数据集Word-Sense-Disambiguation-WSD-Dataset-with-Senses-shreyswan 数据来源：互联网公开数据标签：自然语言处理，词汇意义消歧，数据集，语言建模，文本分析，语义理解，机器学习，语言学数据概述：...

ZIP

Llama1模型生成第一步数据集Generation1Step1Dataset-thaonguen

2025年4月25日

Llama1模型生成第一步数据集Generation1Step1Dataset-thaonguen 数据来源：互联网公开数据标签：自然语言处理，数据集，文本生成，机器学习，Llama，Transformer，语言模型，预训练数据概述：该数据集包含用于 Llama 1 模型第一步训练的数据，主要用于构建基础的语言模型。主要特征如下：...

ZIP

大型语言模型生成器数据集LLMS生成器数据集-ranimmhisham

2025年4月25日

大型语言模型生成器数据集LLMS生成器数据集-ranimmhisham 数据来源：互联网公开数据标签：语言模型，生成器，数据集，自然语言处理，机器学习，文本生成，人工智能，深度学习数据概述：该数据集包含来自多个来源的文本数据，用于训练大型语言模型生成器，记录了各种类型的文本内容。主要特征如下：时间跨度：数据记录的时间范围从2010年到2022年。...

ZIP

摩洛哥新闻文章数据集MorrocanNewsArticlesDataset-sihamemouanid

2025年4月25日

摩洛哥新闻文章数据集MorrocanNewsArticlesDataset-sihamemouanid 数据来源：互联网公开数据标签：新闻，摩洛哥，文本分析，自然语言处理，数据集，阿拉伯语，法语，情感分析，舆情分析数据概述：该数据集包含来自摩洛哥新闻网站的文章数据，记录了摩洛哥新闻媒体发布的文章内容。主要特征如下：...

ZIP

攻击实验与情感分析数据集AttackResultsSST-2Dataset-churubo

2025年4月25日

攻击实验与情感分析数据集AttackResultsSST-2Dataset-churubo 数据来源：互联网公开数据标签：情感分析，数据集，自然语言处理，机器学习，攻击检测，文本分类，网络安全，人工智能数据概述：该数据集包含来自斯坦福情感树库（SST-2）的攻击实验结果数据，记录了对情感分析模型的攻击行为及其影响。主要特征如下：...

ZIP

基于ChatTTS的语音嵌入数据集-xzj19013742

2025年4月25日

基于ChatTTS的语音嵌入数据集-xzj19013742 数据来源：互联网公开数据标签：语音识别，语音合成，数据集，深度学习，自然语言处理，嵌入学习，语音分析，机器学习数据概述：该数据集包含基于ChatTTS生成的语音嵌入数据，旨在用于语音合成和语音识别任务。主要特征如下：时间跨度：数据生成时间为近期。地理范围：数据不涉及特定地理位置。...

ZIP

微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves

2025年4月25日

微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves 数据来源：互联网公开数据标签：新闻数据，数据集，文本分析，机器学习，自然语言处理，数据分析，信息提取，时间序列数据概述：该数据集包含来自微软公司官方新闻发布的数据，记录了微软公司自1999年至2023年间的新闻内容。主要特征如下：...

ZIP

亚马逊Top20畅销书评论数据集2021年-ahmedalielmokhtar

2025年4月25日

亚马逊Top20畅销书评论数据集2021年-ahmedalielmokhtar 数据来源：互联网公开数据标签：亚马逊，畅销书，书籍评论，数据分析，市场研究，消费者行为，自然语言处理，阅读偏好数据概述：该数据集包含来自亚马逊网站的畅销书评论数据，记录了2021年亚马逊平台上销量排名前20的书籍的用户评论。主要特征如下：时间跨度：...

ZIP

YouTube评论阿塞拜疆数据集YouTubeCommentsAzerbaijanDataset-farhadzeynalli

2025年4月25日

YouTube评论阿塞拜疆数据集YouTubeCommentsAzerbaijanDataset-farhadzeynalli 数据来源：互联网公开数据标签：YouTube，评论，数据集，社交媒体，自然语言处理，情感分析，跨文化研究，阿塞拜疆...

ZIP

Quora重复问题数据集QuoraDuplicateQuestionsDataset-gyanbardhan

2025年4月25日

Quora重复问题数据集QuoraDuplicateQuestionsDataset-gyanbardhan 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，机器学习，问答系统，信息检索，数据挖掘，人工智能数据概述：该数据集源自Quora平台，记录了平台上用户提出的重复问题及其相关信息。主要特征如下：...

ZIP

问答系统Python微调数据集Question-AnswerPythonLoraFine-tuningDataset-ashish32700

2025年4月25日

问答系统Python微调数据集Question-AnswerPythonLoraFine-tuningDataset-ashish32700 数据来源：互联网公开数据标签：问答系统，Python，微调，数据集，自然语言处理，机器学习，深度学习，人工智能数据概述：...

ZIP

自然语言处理作业2-3数据集NLPAssignment2-3Dataset-dheerajkr1a1a

2025年4月25日

自然语言处理作业2-3数据集NLPAssignment2-3Dataset-dheerajkr1a1a 数据来源：互联网公开数据标签：自然语言处理，数据集，文本分析，机器学习，情感分析，语言模型，学术资源，文本分类数据概述：该数据集来自自然语言处理课程作业2-3，记录了用于文本分类和情感分析任务的文本数据。主要特征如下：...

ZIP

大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda

2025年4月25日

大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda 数据来源：互联网公开数据标签：文本摘要，自然语言处理，大型语言模型，评估数据集，模型测评，文本生成，人工智能，学术研究数据概述：该数据集包含用于评估大型语言模型（LLM）总结能力的文本数据。主要特征如下：时间跨度：数据收集时间跨度不限，持续更新。...

ZIP

推特灾难事件文本数据集PreprocessedDisasterTweetsDataset-priyanagda

2025年4月25日

推特灾难事件文本数据集PreprocessedDisasterTweetsDataset-priyanagda 数据来源：互联网公开数据标签：推特，灾难事件，文本分析，自然语言处理，机器学习，情感分析，数据挖掘，社会科学数据概述：该数据集包含来自推特平台的公开数据，记录了与灾难事件相关的推文信息。主要特征如下：...

ZIP

多领域数据集Multi-domainDataset-amanrajput27

2025年4月25日

多领域数据集Multi-domainDataset-amanrajput27 数据来源：互联网公开数据标签：多领域，数据集，文本分类，自然语言处理，机器学习，情感分析，主题建模，信息检索数据概述：该数据集整合了来自多个领域和主题的文本数据，旨在为多领域文本分析和机器学习任务提供支持。主要特征如下：...

ZIP

用户评论情感分析数据集DevotionReviewsDataset-j457zhan

2025年4月25日

用户评论情感分析数据集DevotionReviewsDataset-j457zhan 数据来源：互联网公开数据标签：情感分析，用户评论，数据集，自然语言处理，文本挖掘，机器学习，数据分析，商业智能数据概述：该数据集包含来自互联网平台的用户评论数据，记录了用户对不同产品或服务的评价内容。主要特征如下：时间跨度：...

ZIP

找到11,995个数据集

注册成功！