-
文本语义相似度评估数据集
2025年7月17日 30 15 3
文本语义相似度评估数据集_Text_Semantic_Similarity_Evaluation 数据来源:互联网公开数据 标签:文本相似度, 语义分析, 信息检索, 模型评估, 深度学习, 自然语言处理, 评估指标, 对比分析 数据概述: 该数据集包含用于评估文本语义相似度模型的训练与评估数据,主要聚焦于信息检索场景下的模型性能分析。主要特征如下:... -
学术论文标题摘要分析数据集
2025年7月12日 30 30 3
学术论文标题摘要分析数据集_Academic_Paper_Title_Abstract_Analysis 数据来源:互联网公开数据 标签:学术论文, 文本分析, 自然语言处理, 摘要分析, 标题关键词, 文本挖掘, 学术研究, 信息检索 数据概述: 该数据集包含来自学术论文的数据,记录了论文的标题和摘要信息,用于文本分析和信息检索任务。主要特征如下:... -
考试题目文本分析数据集
2025年7月2日 30 30 3
考试题目文本分析数据集_Examination_Questions_Text_Analysis 数据来源:互联网公开数据 标签:考试题目, 文本分析, 自然语言处理, 问答系统, 文本分类, 语义理解, 数据挖掘, 信息检索 数据概述: 该数据集包含考试题目文本数据,记录了用于学术研究和应用开发的考试题目内容。主要特征如下:... -
文本片段索引信息数据集
2025年6月30日 30 20 1
文本片段索引信息数据集_Text_Segment_Index_Information 数据来源:互联网公开数据 标签:文本处理, 信息检索, 索引构建, 数据结构, 文本分析, 机器学习, 自然语言处理, 数据集 数据概述: 该数据集包含文本片段的索引信息,记录了文本被分割成片段后的关键索引数据。主要特征如下:... -
冬奥会问答数据集_Winter_Olympics_Question_Answering_Dataset
2025年6月25日 30 16 6
冬奥会问答数据集_Winter_Olympics_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 事件抽取, 冬奥会, 信息检索, 机器学习, 数据集 数据概述: 该数据集包含从新闻报道和相关资料中提取的问答对,记录了关于冬季奥运会的相关信息。主要特征如下:... -
孟加拉语新闻分类数据集1963-2021
2025年4月14日 60 29 4
孟加拉语新闻分类数据集1963-2021 数据来源:互联网公开数据 标签:孟加拉语,新闻分类,NLP,机器学习,文本分析,情感分析,信息检索,语言建模 数据概述: 本数据集收录了来自Jamuna... -
俄罗斯StackExchange数据集
2025年6月4日 30 13 10
俄罗斯StackExchange数据集 数据来源:互联网公开数据 标签:用户贡献的帖子,问答社区,自然语言处理,信息检索,文本分析,数据挖掘,网络数据 数据概述: 本数据集是匿名化的俄罗斯Stack Exchange用户贡献帖子集合,包含了该平台所有用户生成的内容,涵盖问答、讨论、问题解答等多方面信息。 数据用途概述:... -
多语言歌词音乐流派分类数据集-mateibejan
2025年6月1日 30 17 5
多语言歌词音乐流派分类数据集-mateibejan 数据来源:互联网公开数据 标签:多语言,歌词,音乐流派,文本挖掘,信息检索,语言检测,音乐分类 数据概述:... -
维基百科-事物-主题相关页面数据分析数据集
2025年6月1日 30 19 8
维基百科-事物-主题相关页面数据分析数据集 数据来源:互联网公开数据 标签:维基百科,事物,知识图谱,文本分析,自然语言处理,主题分类,信息检索 数据概述:... -
摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100
2025年5月31日 30 28 10
摩洛哥阿拉伯语新闻文章数据集MNAD-jmourad100 数据来源:互联网公开数据 标签:阿拉伯语,新闻文章,文本分类,自然语言处理,数据挖掘,信息检索,摩洛哥,文本分析 数据概述: MNAD(Moroccan News Articles... -
雅虎问答主题分类数据集-2011至2021年
2025年5月31日 30 29 9
雅虎问答主题分类数据集-2011至2021年 数据来源:互联网公开数据 标签:雅虎问答,主题分类,自然语言处理,信息检索,推荐系统,机器学习,文本分析 数据概述: 本数据集包含从雅虎问答平台收集的有关多个主题的问题及其最佳答案。数据集包括以下几个字段: - topic:问题所属的主题或类别。 - question_title:问题的标题或简短描述。 -... -
土耳其主要新闻网站站点地图信息数据集-2020年5月-eliasdabbas
2025年5月31日 30 14 9
土耳其主要新闻网站站点地图信息数据集-2020年5月-eliasdabbas 数据来源:互联网公开数据 标签:新闻网站,土耳其,站点地图,网页链接,新闻媒体,网络数据,内容聚合,信息检索 数据概述:... -
法律文本问答数据集LegalDocumentQuestionAnswering-ictworld
2025年5月31日 30 17 7
法律文本问答数据集LegalDocumentQuestionAnswering-ictworld 数据来源:互联网公开数据 标签:法律文本, 问答系统, 自然语言处理, 信息检索, 知识库, 文本理解, 越南语, 数据集 数据概述: 该数据集包含来自法律文本的问答对,记录了越南语环境下与法律文件相关的问答内容。主要特征如下:... -
金融文本信息相关性分析数据集FinancialTextInformationRelevanceAnalysis-nguynthlong4912
2025年5月31日 30 18 9
金融文本信息相关性分析数据集FinancialTextInformationRelevanceAnalysis-nguynthlong4912 数据来源:互联网公开数据 标签:金融文本, 文本相关性, 数据挖掘, 机器学习, 自然语言处理, 文本分析, 信息检索, 财务分析 数据概述:... -
印度法院判决书文本摘要数据集IndianCourtJudgmentsTextSummarizationDataset-omsinghchandel
2025年5月31日 30 25 8
印度法院判决书文本摘要数据集IndianCourtJudgmentsTextSummarizationDataset-omsinghchandel 数据来源:互联网公开数据 标签:法律文本, 判决书, 文本摘要, 自然语言处理, 法律分析, 文本分析, 机器学习, 信息检索 数据概述:... -
俄罗斯新闻文本数据分析数据集RussianNewsTextDataAnalysis-asdasdsadasdsasdasd
2025年5月30日 30 24 10
俄罗斯新闻文本数据分析数据集RussianNewsTextDataAnalysis-asdasdsadasdsasdasd 数据来源:互联网公开数据 标签:新闻文本, 俄罗斯, 文本分析, 自然语言处理, 新闻内容, 文本分类, 信息检索, 舆情分析 数据概述:... -
安然公司邮件与财务报告数据集EnronEmailandFinancialReportsDataset-aaadag
2025年5月30日 30 13 7
安然公司邮件与财务报告数据集EnronEmailandFinancialReportsDataset-aaadag 数据来源:互联网公开数据 标签:安然公司, 邮件, 财务报告, 文本分析, 信息检索, 电子邮件, 商业, 数据挖掘 数据概述:... -
学术论文文本摘要分析数据集AcademicPaperTextAbstractAnalysis-ukjadoon
2025年5月30日 30 16 4
学术论文文本摘要分析数据集AcademicPaperTextAbstractAnalysis-ukjadoon 数据来源:互联网公开数据 标签:学术论文, 文本分析, 自然语言处理, 摘要生成, 文本挖掘, 信息检索, 学术研究, 机器学习 数据概述: 该数据集包含来自学术论文的数据,记录了论文的标题、摘要和正文内容。主要特征如下:... -
扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0
2025年5月30日 30 17 6
扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0 数据来源:互联网公开数据 标签:法律文本,检索,自然语言处理,数据集,信息检索,语义匹配,越南语,人工智能 数据概述: 该数据集由扎罗人工智能(Zalo... -
芬兰文本语料库2010-2020数据集-haaldrin
2025年5月30日 30 21 3
芬兰文本语料库2010-2020数据集-haaldrin 数据来源:互联网公开数据 标签:文本语料库,自然语言处理,数据集,芬兰语,学术研究,语言学,机器学习,信息检索 数据概述:该数据集包含来自芬兰的文本数据,记录了2010年至2020年期间的多种类型的芬兰语文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...