数据集 - 海数据

谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530

2025年4月24日

谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530 数据来源：互联网公开数据标签：问答系统，自然语言处理，数据集，机器学习，文本分析，人工智能，语义理解，信息检索数据概述：该数据集是谷歌问答数据集的扩展版本，包含来自谷歌问答社区的问答数据，记录了用户提交的问题及其对应的回答内容。主要特征如下：...

ZIP

聊天机器人对话数据集ChatbotDialogueDataset-vinitrajputt

2025年4月24日

聊天机器人对话数据集ChatbotDialogueDataset-vinitrajputt 数据来源：互联网公开数据标签：自然语言处理，对话系统，机器学习，数据集，人工智能，语义理解，文本分析，智能客服数据概述：该数据集包含来自公开聊天机器人平台的对话数据，记录了用户与聊天机器人之间的交互内容。主要特征如下：...

ZIP

反论证数据集Counter-ArgumentsDataset-utsavdhanuka

2025年4月24日

反论证数据集Counter-ArgumentsDataset-utsavdhanuka 数据来源：互联网公开数据标签：自然语言处理，文本挖掘，论证分析，数据集，机器学习，语义理解，辩论研究，逻辑分析数据概述：该数据集包含来自公开辩论，学术讨论及社交媒体的反论证数据，记录了不同领域中的反论证文本及其相关特征。主要特征如下：...

ZIP

常识问答数据集CommonsenseQADataset-dschettler8845

2025年4月24日

常识问答数据集CommonsenseQADataset-dschettler8845 数据来源：互联网公开数据标签：常识推理，问答，自然语言处理，机器学习，人工智能，知识图谱，语义理解，数据集数据概述：该数据集包含来自常识问答任务的数据，旨在评估模型对常识知识的理解和推理能力。主要特征如下：...

ZIP

多语言自然语言推理数据集MultilingualNaturalLanguageInferenceDataset-sanjusrivatsa9

2025年4月24日

多语言自然语言推理数据集MultilingualNaturalLanguageInferenceDataset-sanjusrivatsa9 数据来源：互联网公开数据标签：自然语言处理，多语言，推理，数据集，语义理解，机器学习，文本分析，人工智能数据概述：...

ZIP

反讽文本嵌入数据集IronyEmbedsDataset-yanivramuk

2025年4月24日

反讽文本嵌入数据集IronyEmbedsDataset-yanivramuk 数据来源：互联网公开数据标签：自然语言处理，文本分析，情感分析，机器学习，数据集，语义理解，情感识别，深度学习数据概述：该数据集包含来自社交媒体和在线评论的反讽文本数据，记录了包含反讽表达的文本及其对应的嵌入表示。主要特征如下：...

ZIP

问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk

2025年4月24日

问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk 数据来源：互联网公开数据标签：自然语言处理，文本分析，数据集，机器学习，语义理解，语言模型，教育技术，数据挖掘数据概述：该数据集包含来自多个来源的问题重述和表达优化数据，记录了不同领域问题的原始表述及其优化后的重述。主要特征如下：...

ZIP

命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin

2025年4月24日

命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin 数据来源：互联网公开数据标签：命名实体识别，数据集，自然语言处理，机器学习， Keras，人工智能，文本分析，语义理解数据概述：...

ZIP

中央研究院多样化数学应用题数据集AcademiaSinicaDiverseMWPDataset-NLUASDiv-dschettler8845

2025年4月24日

中央研究院多样化数学应用题数据集AcademiaSinicaDiverseMWPDataset-NLUASDiv-dschettler8845 数据来源：互联网公开数据标签：自然语言处理，数学应用题，数据集，语义理解，机器阅读理解，人工智能，教育，文本分析数据概述：该数据集由台湾中央研究院（Academia...

ZIP

意图分类数据集IntentClassifierDataset-interviewturabit

2025年4月24日

意图分类数据集IntentClassifierDataset-interviewturabit 数据来源：互联网公开数据标签：自然语言处理，意图识别，数据集，文本分类，机器学习，人工智能，对话系统，语义理解数据概述：该数据集包含用于意图分类任务的文本数据，旨在训练和评估文本分类模型，以识别用户输入文本的意图。主要特征如下：...

ZIP

数据2020天池NLP中文文本分类竞赛数据集-jt120lz

2025年4月24日

2020天池NLP中文文本分类竞赛数据集-jt120lz 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，机器学习，中文，NLP竞赛，情感分析，语义理解数据概述：该数据集来自2020年天池平台举办的NLP（自然语言处理）中文文本分类竞赛，记录了中文文本数据及其对应的类别标签。主要特征如下：...

ZIP

Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane

2025年4月23日

Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane 数据来源：互联网公开数据标签：自然语言处理，词嵌入，数据集，机器学习，文本分析，深度学习，语义理解，人工智能数据概述：该数据集包含Solon词嵌入模型生成的词向量数据，记录了大量词汇在多维空间中的表示。主要特征如下：...

ZIP

康奈尔电影评论数据集CornellMovieReviewDataset-mercyfausty

2025年4月23日

康奈尔电影评论数据集CornellMovieReviewDataset-mercyfausty 数据来源：互联网公开数据标签：电影评论，情感分析，数据集，自然语言处理，文本挖掘，语义理解，机器学习，情感计算数据概述：该数据集包含来自康奈尔大学收集的电影评论文本数据，记录了用户对电影的评价和情感倾向。主要特征如下：...

ZIP

语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak

2025年4月23日

语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak 数据来源：互联网公开数据标签：文本分析，语义理解，自然语言处理，机器学习，信息检索，人工智能，语言模型，数据挖掘数据概述：该数据集包含来自公开资源的数据，记录了用于衡量文本间语义相关性的文本对。主要特征如下：...

ZIP

概念嵌入数据集ConceptsEmbeddingDataset-wakeuptoreality

2025年4月23日

概念嵌入数据集ConceptsEmbeddingDataset-wakeuptoreality 数据来源：互联网公开数据标签：概念嵌入，自然语言处理，数据集，语义理解，词向量，知识表示，机器学习，文本分析数据概述：该数据集包含了各种概念的嵌入表示，旨在捕捉词汇和概念之间的语义关系。主要特征如下：时间跨度：...

ZIP

生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko

2025年4月23日

生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko 数据来源：互联网公开数据标签：自然语言处理，实体识别，数据集，机器学习，文本分析，地理信息，人工智能，语义理解数据概述：该数据集包含通过生成式模型创建的文本数据，专注于山脉相关实体的识别任务。主要特征如下：...

ZIP

问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82

2025年4月23日

问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82 数据来源：互联网公开数据标签：问答系统，数据集，自然语言处理，机器学习，语义理解，信息检索，知识图谱，人工智能数据概述：该数据集包含来自tgif问答系统项目的大量问答对数据，记录了用户提问与系统回答的详细信息。主要特征如下：...

ZIP

跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers

2025年4月23日

跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers 数据来源：互联网公开数据标签：自然语言处理，文本数据，数据集，跨编码器，语义理解，机器学习，深度学习，文本匹配数据概述：该数据集包含用于训练跨编码器模型的大量文本数据，旨在提升模型在语义理解和文本匹配方面的性能。主要特征如下：...

ZIP

孟加拉语指令数据集-多样化和高质量-shanto8

2025年4月22日

孟加拉语指令数据集-多样化和高质量-shanto8 数据来源：互联网公开数据标签：孟加拉语,指令,自然语言处理,教育,翻译,语义理解,文本生成,文化传承,技术文档数据概述：...

ZIP

语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99

2025年4月22日

语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99 数据来源：互联网公开数据标签：语言模型，文本生成，数据集，自然语言处理，机器学习，文本分析，语义理解，人工智能数据概述：该数据集包含用于语言模型训练和评估的文本数据，记录了多种文本的语义变换和生成任务。主要特征如下：...

ZIP

找到168个数据集

注册成功！