-
文本改写平行语料库数据集TextParaphraseCorpus-zahraasn
文本改写平行语料库数据集TextParaphraseCorpus-zahraasn 数据来源:互联网公开数据 标签:文本生成, 语义相似度, 句子改写, 自然语言处理, 机器翻译, 数据集构建, 文本多样性, 对比学习 数据概述: 该数据集包含用于文本改写的平行语料库,记录了原始句子及其对应的改写版本。主要特征如下:... -
学生作答质量评估数据集StudentAnswerQualityAssessmentDataset-amrrsheta
学生作答质量评估数据集StudentAnswerQualityAssessmentDataset-amrrsheta 数据来源:互联网公开数据 标签:学生答题, 文本分析, 自动评分, 教育评估, 语义相似度, 机器学习, 问答系统, 答题质量 数据概述:... -
专利文本相关性分析数据集PatentTextRelevanceAnalysis-datafan07
专利文本相关性分析数据集PatentTextRelevanceAnalysis-datafan07 数据来源:互联网公开数据 标签:专利, 文本分析, 语义相似度, 信息检索, 机器学习, 专利分类, 文本匹配, 知识产权 数据概述:... -
新冠病毒研究相关论文相似句对数据集COVID-19ResearchSimilarSentencePairs-mobassir
新冠病毒研究相关论文相似句对数据集COVID-19ResearchSimilarSentencePairs-mobassir 数据来源:互联网公开数据 标签:新冠病毒, 论文, 相似性, 自然语言处理, 文本分析, 生物医学, 语义相似度, 机器学习 数据概述: 该数据集包含来自生物医学领域的研究论文,记录了用于评估句子相似性的句对。主要特征如下:... -
文本语义改写对比数据集TextSemanticParaphraseComparison-lehoangminhha
文本语义改写对比数据集TextSemanticParaphraseComparison-lehoangminhha 数据来源:互联网公开数据 标签:文本改写, 语义相似度, 自然语言处理, 文本匹配, 数据标注, 机器翻译, 语言模型, 文本生成 数据概述:... -
文本语义相关性分析训练数据集TextSemanticRelevanceAnalysisTrainingDataset-sidhaarth2110035
文本语义相关性分析训练数据集TextSemanticRelevanceAnalysisTrainingDataset-sidhaarth2110035 数据来源:互联网公开数据 标签:文本匹配, 语义相似度, 问答系统, 信息检索, 自然语言处理, 机器阅读理解, 训练数据, 英语 数据概述:... -
学生答案评估与语义相似度分析数据集StudentAnswerEvaluationandSemanticAnalysisDataset-uppulurimadhuri
学生答案评估与语义相似度分析数据集StudentAnswerEvaluationandSemanticAnalysisDataset-uppulurimadhuri 数据来源:互联网公开数据 标签:语义相似度, 学生答案, 答案评估, 文本分析, 机器学习, 教育, 自然语言处理, 问答系统 数据概述: 该数据集包含来自 SemEval 2013... -
大模型评估指标对比分析数据集LargeLanguageModelEvaluationMetricsComparison-gyanbardhan
大模型评估指标对比分析数据集LargeLanguageModelEvaluationMetricsComparison-gyanbardhan 数据来源:互联网公开数据 标签:大模型, 语言模型, 评估, 指标, BLEU, ROUGE_L, 语义相似度, 对比分析 数据概述:... -
文本语义相似度分析数据集TextSemanticSimilarityAnalysisDataset-datafan07
文本语义相似度分析数据集TextSemanticSimilarityAnalysisDataset-datafan07 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 信息检索, 深度学习, 自然语言处理, 对比分析, 文本理解, 机器阅读 数据概述:... -
Quora语句改写数据集QuoraParaphrasingDataset-fbgame123
Quora语句改写数据集QuoraParaphrasingDataset-fbgame123 数据来源:互联网公开数据 标签:自然语言处理,文本改写,数据集,机器学习,语义相似度,语言模型,文本生成,人工智能 数据概述: 该数据集来源于Quora平台,包含了用户提问的原始语句及对应的改写版本,用于研究语句改写和语义相似度分析。主要特征如下:... -
书籍嵌入数据集EmbeddingBookData-jojoyin
书籍嵌入数据集EmbeddingBookData-jojoyin 数据来源:互联网公开数据 标签:书籍,嵌入,自然语言处理,文本分析,机器学习,推荐系统,语义相似度,数据集 数据概述: 该数据集包含书籍的嵌入表示,旨在捕捉书籍在语义空间中的关系。主要特征如下: 时间跨度:数据记录无明确时间范围,主要基于书籍内容构建嵌入。... -
句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513
句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,语义分析,语言模型,NLP,数据集,语义相似度 数据概述:该数据集包含来自PAWS项目(Paraphrase Adversarial... -
Quora问答对语义相似度预测数据集
Quora问答对语义相似度预测数据集 数据来源:互联网公开数据 标签:自然语言处理,语义相似度,问答对,文本匹配,机器学习,Quora,Kaggle,文本分析 数据概述: 本数据集源自Kaggle竞赛Quora问答对,用于预测给定的问答对中,哪一对问题具有相同的含义。 数据集包含了大量Quora平台上的问题对,每个问题对都标注了它们是否语义相似。... -
英语句子语义相似度测试数据集EN-STS-TestDataset-dangthai
英语句子语义相似度测试数据集EN-STS-TestDataset-dangthai 数据来源:互联网公开数据 标签:自然语言处理,语义相似度,数据集,文本分析,机器学习,NLP,语言学,评估 数据概述: 该数据集包含用于评估英语句子语义相似度的测试数据。主要特征如下: 时间跨度: 数据记录的时间范围为数据集发布时间。 地理范围:...