-
电商商品问答生成数据集E-commerceQuestionAnsweringGenerationDataset-cosmicrayer
电商商品问答生成数据集E-commerceQuestionAnsweringGenerationDataset-cosmicrayer 数据来源:互联网公开数据 标签:电商,问答生成,自然语言处理,数据集,文本生成,机器学习,信息检索,商品信息 数据概述: 该数据集包含电商平台上的商品信息和对应的问答对,用于训练和评估问答生成模型。主要特征如下:... -
多语言新闻文章数据集Multi-NewsDataset-terrychanorg
多语言新闻文章数据集Multi-NewsDataset-terrychanorg 数据来源:互联网公开数据 标签:新闻,多语言,数据集,自然语言处理,文本摘要,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自不同语言的新闻文章,用于文本摘要和多语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于新闻来源的更新频率。... -
电影详情与评分推荐系统数据集MovieDetailsandRatingsforRecommenderSystemsDataset-reetamborgohain
电影详情与评分推荐系统数据集MovieDetailsandRatingsforRecommenderSystemsDataset-reetamborgohain 数据来源:互联网公开数据 标签:电影评分,推荐系统,数据集,用户行为,数据分析,机器学习,信息检索,娱乐产业 数据概述:... -
维基百科内容数据集WikiDataset-selcukcan
维基百科内容数据集WikiDataset-selcukcan 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,机器学习,信息检索,知识图谱,语义分析 数据概述: 该数据集包含来自维基百科的文本内容,记录了维基百科上的文章、条目及相关信息。主要特征如下: 时间跨度:数据记录的时间范围从维基百科创建至今(动态更新)。... -
天文学与地质学维基百科文章数据集AstronomyandGeologyWikipediaArticles-abdelrahmanghunemiii
天文学与地质学维基百科文章数据集AstronomyandGeologyWikipediaArticles-abdelrahmanghunemiii 数据来源:互联网公开数据 标签:维基百科, 天文学, 地质学, 文本分析, 网页抓取, 知识图谱, 信息检索, 自然语言处理 数据概述:... -
印地语和泰米尔语问答数据集HindiandTamilQuestionAnsweringDataset-urstrulysai
印地语和泰米尔语问答数据集HindiandTamilQuestionAnsweringDataset-urstrulysai 数据来源:互联网公开数据 标签:问答系统, 文本理解, 机器阅读, 印度语言, 印地语, 泰米尔语, 自然语言处理, 信息检索 数据概述:... -
维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus
维基百科文章文本数据集WikipediaArticleTextData-tolgaerdogmus 数据来源:互联网公开数据 标签:维基百科, 文本数据, 自然语言处理, 文本分析, 信息检索, 语料库, 文本挖掘, 数据集 数据概述: 该数据集包含来自维基百科的文章文本数据,记录了维基百科上收录的各种主题的文章内容。主要特征如下:... -
学术论文文本分析数据集AcademicPaperTextAnalysisDataset-rishiii20
学术论文文本分析数据集AcademicPaperTextAnalysisDataset-rishiii20 数据来源:互联网公开数据 标签:学术论文, 文本分析, 自然语言处理, 学术研究, 论文摘要, 文本挖掘, 信息检索, 机器学习 数据概述:... -
文本分类新闻数据集TextClassificationNewsDataset-balatmak
文本分类新闻数据集TextClassificationNewsDataset-balatmak 数据来源:互联网公开数据 标签:文本分类, 新闻, 自然语言处理, 语料库, 多分类, 机器学习, 文本挖掘, 信息检索 数据概述: 该数据集包含来自不同新闻来源的文本数据,记录了新闻文章的内容及其所属类别,适用于文本分类、信息检索等任务。主要特征如下:... -
阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextA...
阿拉伯语问答数据集-真伪判断与文本分析ArabicQuestionAnsweringDataset-TrueorFalseJudgmentandTextAnalysis-ibrahim2002 数据来源:互联网公开数据 标签:阿拉伯语, 问答系统, 文本分析, 信息检索, 事实判断, 自然语言处理, 机器阅读理解, 数据集 数据概述:... -
美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777
美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777 数据来源:互联网公开数据 标签:政府文件,数据集,数据清洗,文本分析,自然语言处理,档案管理,信息检索,历史研究 数据概述: 该数据集包含来自美国国家档案馆(GA)的政府文件数据,记录了已清理的政府文件文本内容。主要特征如下:... -
问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy
问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy 数据来源:互联网公开数据 标签:问题分类,数据集,自然语言处理,文本分析,机器学习,信息检索,人工智能,语义理解 数据概述: 该数据集包含来自多个领域的公开问题数据,记录了各类问题的文本内容及其对应的分类标签。主要特征如下:... -
安然公司电子邮件数据集EnronEmailDataset-napisarchuk
安然公司电子邮件数据集EnronEmailDataset-napisarchuk 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,金融,腐败,社交网络,信息检索 数据概述: 该数据集包含来自美国安然公司(Enron Corporation)员工的电子邮件,记录了该公司在破产前的大量内部通信。主要特征如下:... -
数据2021年最新新闻数据集LatestNewsDataset2021-newsdataio
2021年最新新闻数据集LatestNewsDataset2021-newsdataio 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,情感分析,信息检索,数据挖掘 数据概述:该数据集包含来自2021年全球各地的新闻数据,记录了各类新闻事件和报道内容。主要特征如下:... -
跨编码器数据集Cross-EncoderDataset-epsilon12345
跨编码器数据集Cross-EncoderDataset-epsilon12345 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本匹配,语义相似度,信息检索,深度学习,模型训练,语言模型 数据概述: 该数据集包含了用于训练和评估跨编码器模型的数据,主要用于提升文本匹配和语义理解的性能。主要特征如下:... -
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99
DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器翻译,深度学习,文本分析,语言模型,信息检索 数据概述: 该数据集包含来自DRCAT(Dynamic Relation-based Content Adaptation... -
强研实体链接数据集QiangyanEntityLinkingDataset-kejiewang
强研实体链接数据集QiangyanEntityLinkingDataset-kejiewang 数据来源:互联网公开数据 标签:实体链接,自然语言处理,数据集,知识图谱,机器学习,语义理解,信息检索,数据挖掘 数据概述: 该数据集由强研项目提供,专注于实体链接任务,记录了文本中的实体与知识图谱中实体的对应关系。主要特征如下:... -
知识图谱实体文本数据集KnowledgeGraphEntityTextDataset-chiritacatalinaelena
知识图谱实体文本数据集KnowledgeGraphEntityTextDataset-chiritacatalinaelena 数据来源:互联网公开数据 标签:知识图谱, 实体识别, 文本摘要, 自然语言处理, 数据清洗, 文本分析, 数据库, 信息检索 数据概述:... -
关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999
关键词提取算法YAKE数据集关键词提取算法YAKEDataset-lunanana1999 数据来源:互联网公开数据 标签:关键词提取,自然语言处理,文本挖掘,数据集,机器学习,信息检索,文本分析,学术研究 数据概述: 该数据集包含用于训练和评估YAKE(Yet Another Keyword... -
垃圾信息过滤与Quora问题分类数据集SpamFilterforQuoraQuestionsDataset-vijayadithyabk
垃圾信息过滤与Quora问题分类数据集SpamFilterforQuoraQuestionsDataset-vijayadithyabk 数据来源:互联网公开数据 标签:垃圾信息过滤,Quora问答,文本分类,自然语言处理,机器学习,数据挖掘,信息检索,网络安全 数据概述:...