-
问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk
问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语义理解,语言模型,教育技术,数据挖掘 数据概述: 该数据集包含来自多个来源的问题重述和表达优化数据,记录了不同领域问题的原始表述及其优化后的重述。主要特征如下:... -
命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin
命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin 数据来源:互联网公开数据 标签:命名实体识别, 数据集, 自然语言处理, 机器学习, Keras, 人工智能, 文本分析, 语义理解 数据概述:... -
中央研究院多样化数学应用题数据集AcademiaSinicaDiverseMWPDataset-NLUASDiv-dschettler8845
中央研究院多样化数学应用题数据集AcademiaSinicaDiverseMWPDataset-NLUASDiv-dschettler8845 数据来源:互联网公开数据 标签:自然语言处理,数学应用题,数据集,语义理解,机器阅读理解,人工智能,教育,文本分析 数据概述: 该数据集由台湾中央研究院(Academia... -
意图分类数据集IntentClassifierDataset-interviewturabit
意图分类数据集IntentClassifierDataset-interviewturabit 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,文本分类,机器学习,人工智能,对话系统,语义理解 数据概述: 该数据集包含用于意图分类任务的文本数据,旨在训练和评估文本分类模型,以识别用户输入文本的意图。主要特征如下:... -
数据2020天池NLP中文文本分类竞赛数据集-jt120lz
2020天池NLP中文文本分类竞赛数据集-jt120lz 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,中文,NLP竞赛,情感分析,语义理解 数据概述: 该数据集来自2020年天池平台举办的NLP(自然语言处理)中文文本分类竞赛,记录了中文文本数据及其对应的类别标签。主要特征如下:... -
Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane
Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,机器学习,文本分析,深度学习,语义理解,人工智能 数据概述: 该数据集包含Solon词嵌入模型生成的词向量数据,记录了大量词汇在多维空间中的表示。主要特征如下:... -
康奈尔电影评论数据集CornellMovieReviewDataset-mercyfausty
康奈尔电影评论数据集CornellMovieReviewDataset-mercyfausty 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,文本挖掘,语义理解,机器学习,情感计算 数据概述: 该数据集包含来自康奈尔大学收集的电影评论文本数据,记录了用户对电影的评价和情感倾向。主要特征如下:... -
语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak
语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak 数据来源:互联网公开数据 标签:文本分析,语义理解,自然语言处理,机器学习,信息检索,人工智能,语言模型,数据挖掘 数据概述: 该数据集包含来自公开资源的数据,记录了用于衡量文本间语义相关性的文本对。主要特征如下:... -
概念嵌入数据集ConceptsEmbeddingDataset-wakeuptoreality
概念嵌入数据集ConceptsEmbeddingDataset-wakeuptoreality 数据来源:互联网公开数据 标签:概念嵌入,自然语言处理,数据集,语义理解,词向量,知识表示,机器学习,文本分析 数据概述: 该数据集包含了各种概念的嵌入表示,旨在捕捉词汇和概念之间的语义关系。主要特征如下: 时间跨度:... -
生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko
生成式山脉实体识别数据集GeneratedMountainEntityRecognitionDataset-artemzysko 数据来源:互联网公开数据 标签:自然语言处理,实体识别,数据集,机器学习,文本分析,地理信息,人工智能,语义理解 数据概述: 该数据集包含通过生成式模型创建的文本数据,专注于山脉相关实体的识别任务。主要特征如下:... -
问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82
问答系统训练与评估数据集tgif-qna-descriptions-38kDataset-vishnu82 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,语义理解,信息检索,知识图谱,人工智能 数据概述: 该数据集包含来自tgif问答系统项目的大量问答对数据,记录了用户提问与系统回答的详细信息。主要特征如下:... -
跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers
跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,跨编码器,语义理解,机器学习,深度学习,文本匹配 数据概述: 该数据集包含用于训练跨编码器模型的大量文本数据,旨在提升模型在语义理解和文本匹配方面的性能。主要特征如下:... -
孟加拉语指令数据集-多样化和高质量-shanto8
孟加拉语指令数据集-多样化和高质量-shanto8 数据来源:互联网公开数据 标签:孟加拉语,指令,自然语言处理,教育,翻译,语义理解,文本生成,文化传承,技术文档 数据概述:... -
语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99
语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99 数据来源:互联网公开数据 标签:语言模型,文本生成,数据集,自然语言处理,机器学习,文本分析,语义理解,人工智能 数据概述: 该数据集包含用于语言模型训练和评估的文本数据,记录了多种文本的语义变换和生成任务。主要特征如下:... -
细分类食品评论与嵌入数据集
细分类食品评论与嵌入数据集 数据来源:互联网公开数据 标签:评论,嵌入,亚马逊,食品,情感分析,NLP,语义理解,文本挖掘,文本分析,机器学习 数据概述: 本数据集基于亚马逊细分类食品商品的10,000条客户评论数据构建,每条评论均经过处理并生成相应的文本嵌入。嵌入通过Azure OpenAI的text-embedding-... -
SentEval句子嵌入评估工具包数据集
SentEval句子嵌入评估工具包数据集 数据来源:互联网公开数据 标签:自然语言处理, 句子嵌入, 评估, 文本相似度, 情感分析, 语义理解, 迁移学习, 语言学探针 数据概述:... -
经典电影和电视剧台词数据集
经典电影和电视剧台词数据集 数据来源:互联网公开数据 标签:经典台词,电影,电视剧,好莱坞,对话,情感分析,语义理解,人工智能训练 数据概述: 本数据集包含了一些在好莱坞电影、情景喜剧和电视剧中流行的对话台词。数据集涵盖了多个知名影视作品中的经典对话,为训练能够生成或识别电影台词的模型提供了丰富的素材。 数据用途概述:... -
阿拉伯语古兰经经文及其注释数据集
阿拉伯语古兰经经文及其注释数据集 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,阿拉伯语,经文,注释,宗教研究,文本分析,语义理解 数据概述:... -
讽刺语句分析数据集
讽刺语句分析数据集 数据来源:互联网公开数据 标签:讽刺识别,自然语言处理,文本分析,情感分析,机器学习,语义理解 数据概述: 本数据集包含1950条评论,每条评论由人工标注为讽刺性(1)或非讽刺性(-1)。数据集旨在提供一个用于讽刺语句识别的基准集合,帮助研究人员和开发者训练和评估文本分析模型。 数据用途概述:... -