数据集

文本蕴含数据集1963-2021

文本蕴含数据集1963-2021 数据来源：互联网公开数据标签：文本蕴含,自然语言理解,机器学习,数据标注,训练数据,测试数据,验证数据

数据概述：本数据集来自Huggingface的SetFit项目，是一个全面的文本蕴含数据集，适用于自然语言理解任务的开发和评估。数据集包含三个文件：validation.csv、train.csv和test.csv，每个文件都提供了训练和评估文本蕴含模型所需的重要信息。数据集中的每一对文本包括text1和text2，以及表示两者关系的label和label_text，后者提供了一个易于理解的文本形式标签。

数据用途概述：该数据集适用于自然语言理解任务，包括文本分类、语义相似性和文本蕴含等。研究人员可以利用该数据集来训练和评估模型，也可以将其用于迁移学习，为其他NLP任务提供预训练模型。此外，数据集还适合用于比较不同模型或算法在文本蕴含任务中的性能，从而推动NLP领域的技术进步。

举例：数据集中的一组示例如下： text1: 他今天去了图书馆。 text2: 他去了公共场所。 label: 2 label_text: neutral

在这组示例中，text1描述了一个人去图书馆的行为，text2则是一个更广泛的描述，表示他去了一个公共场所。label和label_text共同表示了这两个文本之间中立的关系。

数据与资源

文本蕴含数据集1963-2021.zipZIP
28.79 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	28.79 MiB
最后更新	2025年4月16日
创建于	2025年4月16日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

文本蕴含数据集1963-2021

数据与资源

附加信息

注册成功！