-
多语言恶意文本检测数据集
2025年9月14日 30 33 26
多语言恶意文本检测数据集_Multilingual_Toxic_Text_Detection_Dataset 数据来源:互联网公开数据 标签:文本分类, 恶意文本, 多语言, 自然语言处理, 机器翻译, 情感分析, 毒性检测, 语言模型 数据概述: 该数据集包含来自多个语种的文本数据,旨在用于恶意文本的检测与分析。主要特征如下:... -
文本相关性预测模型预测结果数据集
2025年9月12日 30 101 30
文本相关性预测模型预测结果数据集_Text_Relevance_Prediction_Model_Prediction_Results 数据来源:互联网公开数据 标签:文本匹配, 自然语言处理, 机器翻译, 语义理解, 深度学习, 模型预测结果, 跨语言, 数据分析 数据概述:... -
文本检索模型评估结果数据集
2025年9月3日 30 25 12
文本检索模型评估结果数据集_Text_Retrieval_Model_Evaluation_Results 数据来源:互联网公开数据 标签:文本检索, 信息检索, 模型评估, 语义相似度, 深度学习, 机器翻译, 知识图谱, 性能分析 数据概述:... -
尼泊尔语视频字幕匹配数据集
2025年8月30日 30 181 98
尼泊尔语视频字幕匹配数据集_Nepali_Video_Subtitle_Matching 数据来源:互联网公开数据 标签:尼泊尔语, 视频字幕, 文本匹配, 多模态, 语音识别, 机器翻译, 语言学, 数据标注 数据概述: 该数据集包含来自互联网的尼泊尔语视频片段及其对应的字幕文本,旨在用于研究视频内容与字幕文本之间的关联。主要特征如下:... -
中文文本生成评估数据集
2025年8月26日 30 80 57
中文文本生成评估数据集_Chinese_Text_Generation_Evaluation_Dataset 数据来源:互联网公开数据 标签:文本生成, 中文, 自然语言处理, 评估, 语言模型, 数据集, 文本质量, 机器翻译 数据概述: 该数据集包含用于评估中文文本生成模型性能的数据,记录了生成的中文文本及其相应的评估指标。主要特征如下:... -
自然语言处理预训练模型评估数据集
2025年8月21日 30 98 37
自然语言处理预训练模型评估数据集_Natural_Language_Processing_Pre_training_Model_Evaluation_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 预训练模型, 文本评估, 语言建模, 文本分类, 模型训练, 机器翻译, 情感分析 数据概述:... -
新闻摘要文本生成数据集
2025年8月19日 30 7 0
新闻摘要文本生成数据集_News_Summary_Text_Generation_Dataset 数据来源:互联网公开数据 标签:新闻摘要, 文本生成, 自然语言处理, 深度学习, 机器翻译, 文本摘要, 数据集, CNN 数据概述: 该数据集包含来自CNN和Daily... -
越南语文本翻译质量评估数据集
2025年8月18日 30 77 65
越南语文本翻译质量评估数据集_Vietnamese_Text_Translation_Quality_Assessment 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 越南语, 质量评估, 自然语言处理, 对比分析, 深度学习, 文本生成 数据概述: 该数据集包含越南语翻译文本及其参考译文,用于评估机器翻译模型的性能。主要特征如下:... -
新闻摘要生成数据集
2025年8月12日 30 75 21
新闻摘要生成数据集_News_Summary_Generation_Dataset 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 自然语言处理, 机器翻译, 文本生成, 深度学习, 语料库, 信息检索 数据概述: 该数据集包含来自新闻文章的数据,记录了新闻文章原文及其对应的摘要。主要特征如下:... -
多语言维基百科文章翻译质量评估数据集
2025年8月11日 30 172 95
多语言维基百科文章翻译质量评估数据集_Multilingual_Wikipedia_Article_Translation_Quality_Assessment 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言模型, 文本质量评估, 多语言, 维基百科, 数据标注, 自然语言处理 数据概述:... -
孟加拉语文本生成警局电话信息数据集
2025年8月10日 30 117 29
孟加拉语文本生成警局电话信息数据集_Bengali_Text_Generation_Police_Station_Phone_Information 数据来源:互联网公开数据 标签:文本生成, 孟加拉语, 自然语言处理, 问答系统, 信息检索, 数据集, 对话生成, 机器翻译 数据概述:... -
文本质量评估模型预测结果数据集
2025年8月10日 30 102 36
文本质量评估模型预测结果数据集_Text_Quality_Assessment_Model_Prediction_Results 数据来源:互联网公开数据 标签:文本质量, 语言模型, 评估指标, 预测结果, 机器翻译, 自然语言处理, 数据分析, 模型训练 数据概述: 该数据集包含文本质量评估模型的预测结果以及相关参数。主要特征如下:... -
多语言视觉问答图像数据集
2025年8月8日 30 57 23
多语言视觉问答图像数据集_Multilingual_Visual_Question_Answering_Image_Dataset 数据来源:互联网公开数据 标签:视觉问答, 多语言, 图像识别, 图像分类, 自然语言处理, 机器翻译, 数据标注, 计算机视觉 数据概述:... -
文本摘要模型预测与评估数据集
2025年8月6日 30 62 3
文本摘要模型预测与评估数据集_Text_Summarization_Model_Prediction_and_Evaluation 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 模型评估, 深度学习, 摘要生成, 预测结果, 文本分析 数据概述:... -
机器翻译模型生成文本质量评估数据集
2025年8月3日 30 26 0
机器翻译模型生成文本质量评估数据集_Machine_Translation_Model_Text_Generation_Quality_Evaluation 数据来源:互联网公开数据 标签:机器翻译, 文本生成, 文本评估, 对比分析, 自然语言处理, 语言模型, 文本质量, 评估指标 数据概述:... -
语音识别与自然语言处理NeMo模型数据集
2025年8月1日 30 16 0
语音识别与自然语言处理NeMo模型数据集_Speech_Recognition_and_Natural_Language_Processing_NeMo_Models_Dataset 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, NeMo, 深度学习, 语音合成, 机器翻译, 文本处理, 模型评估 数据概述: 该数据集包含NVIDIA... -
图像描述生成模型训练数据集
2025年7月31日 30 190 84
图像描述生成模型训练数据集_Image_Captioning_Model_Training_Dataset 数据来源:互联网公开数据 标签:图像描述, 自然语言处理, 机器翻译, 深度学习, T5模型, 数据集, 文本生成, 图像理解 数据概述: 该数据集包含用于训练图像描述生成模型的语料,记录了图像的文本描述及其对应的输入提示。主要特征如下:... -
深度学习模型训练评估指标数据集
2025年7月21日 30 199 47
深度学习模型训练评估指标数据集_Deep_Learning_Model_Training_Evaluation_Metrics 数据来源:互联网公开数据 标签:深度学习, 模型评估, 文本识别, 机器翻译, 训练日志, 性能分析, 交叉熵, 字符错误率 数据概述:... -
机器翻译文本对数据集
2025年7月21日 30 145 93
机器翻译文本对数据集_Machine_Translation_Text_Pairs 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言学, 文本翻译, 英语, 葡萄牙语, 自然语言处理, 双语语料库 数据概述: 该数据集包含来自互联网的翻译文本对,记录了英语与葡萄牙语之间的句子翻译实例,适用于机器翻译模型的训练与评估。主要特征如下:...