-
泰语问答开发数据集ThaiQuestionAnsweringDevelopmentDataset-isamansangbumrung
泰语问答开发数据集ThaiQuestionAnsweringDevelopmentDataset-isamansangbumrung 数据来源:互联网公开数据 标签:问答系统, 泰语, NLP, 文本理解, 信息检索, 机器阅读, 数据标注, 语言模型 数据概述: 该数据集包含来自公开来源的泰语问答数据,旨在用于开发和评估泰语问答系统。主要特征如下:... -
问答模型训练与测试数据集
问答模型训练与测试数据集 数据来源:互联网公开数据 标签:问答模型,训练数据,测试数据,机器学习,自然语言处理,对话系统,教育材料,信息检索,客户支持,语言生成 数据概述: 本数据集用于训练和测试问答模型,包含多个列,为每个条目提供重要的信息。这些列包括: - instruction:模型生成响应的具体指令。 -... -
印度人工智能搜索数据集IndiaAISearchableDataset-sohammhatre112
印度人工智能搜索数据集IndiaAISearchableDataset-sohammhatre112 数据来源:互联网公开数据 标签:人工智能,印度,数据集,搜索技术,机器学习,数据挖掘,信息检索,技术分析 数据概述: 该数据集包含来自印度的公开数据,记录了与人工智能相关的搜索信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2022年。... -
-
新闻文章分类数据集NewsArticleClassificationDataset-oumaymaessarhi
新闻文章分类数据集NewsArticleClassificationDataset-oumaymaessarhi 数据来源:互联网公开数据 标签:新闻,文本分类,数据集,机器学习,自然语言处理,数据分析,信息检索,文本挖掘 数据概述: 该数据集包含来自多个新闻来源的文章数据,记录了不同主题和类别的新闻文章内容。主要特征如下:... -
论坛讨论数据集ForumDiscussionDataset-amiranasser20
论坛讨论数据集ForumDiscussionDataset-amiranasser20 数据来源:互联网公开数据 标签:数据集,论坛,讨论,文本分析,自然语言处理,社交媒体,数据挖掘,信息检索 数据概述: 该数据集包含来自多个在线论坛的讨论数据,记录了用户在论坛中的发帖,回复和互动内容。主要特征如下:... -
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26
英语语料库词频与逆文档频率数据集EnglishCorpusFrequencyandIDFDataset-nataltiger26 数据来源:互联网公开数据 标签:语料库,词频分析,逆文档频率,自然语言处理,数据集,文本挖掘,机器学习,信息检索 数据概述:... -
问答系统评估数据集Qwen-AnswersDataset-martintura
问答系统评估数据集Qwen-AnswersDataset-martintura 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,人工智能,知识图谱,信息检索,文本生成 数据概述: 该数据集包含来自问答系统Qwen的问答对数据,记录了用户提出的问题和系统生成的答案。主要特征如下:... -
维基百科知识图谱数据集Wiki-DataKnowledgeGraphDataset-berkayozturkx
维基百科知识图谱数据集Wiki-DataKnowledgeGraphDataset-berkayozturkx 数据来源:互联网公开数据 标签:知识图谱,维基百科,数据集,语义网络,数据挖掘,自然语言处理,人工智能,信息检索 数据概述: 该数据集包含来自维基百科的知识图谱数据,记录了维基百科中实体的属性和关系。主要特征如下:... -
计算机科学与人工智能领域学术作者数据集DBLPAuthorsDataset-daniyalshaiq
计算机科学与人工智能领域学术作者数据集DBLPAuthorsDataset-daniyalshaiq 数据来源:互联网公开数据 标签:计算机科学,人工智能,数据集,学术研究,作者分析,机器学习,信息检索,数据挖掘 数据概述:... -
电影推荐与评分数据集RecommendationMovieRatingDataset-samuelshanthanaraja
电影推荐与评分数据集RecommendationMovieRatingDataset-samuelshanthanaraja 数据来源:互联网公开数据 标签:电影推荐,评分数据,数据集,推荐系统,机器学习,数据挖掘,用户行为,信息检索 数据概述: 该数据集记录了用户对电影的评价和推荐行为,主要用于电影推荐系统和用户偏好分析的构建。主要特征如下:... -
自然语言处理与词向量训练数据集NLPNBCWord2VecDataset-duydung271
自然语言处理与词向量训练数据集NLPNBCWord2VecDataset-duydung271 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,文本分析,机器学习,深度学习,语义分析,信息检索 数据概述: 该数据集包含来自自然语言处理领域的NBC新闻文本数据,用于词向量训练和文本分析任务。主要特征如下:... -
新闻主题建模数据集NewsArticlesforTopicModellingDataset-aasthavashist
新闻主题建模数据集NewsArticlesforTopicModellingDataset-aasthavashist 数据来源:互联网公开数据 标签:新闻分析,主题建模,数据集,文本挖掘,自然语言处理,机器学习,数据分析,信息检索 数据概述: 该数据集包含来自多个新闻源的新闻文章数据,记录了各类新闻主题和内容。主要特征如下:... -
新闻文本分类数据集DraupNewsClassificationDataset-shadabhussain
新闻文本分类数据集DraupNewsClassificationDataset-shadabhussain 数据来源:互联网公开数据 标签:新闻分类,文本分析,数据集,自然语言处理,机器学习,信息检索,数据挖掘,人工智能 数据概述: 该数据集包含来自Draup平台的新闻文本数据,主要记录了各类新闻文章的文本内容及其分类标签。主要特征如下:... -
基于内容的推荐系统数据集Content-BasedFilteringDataset-pushpakgote
基于内容的推荐系统数据集Content-BasedFilteringDataset-pushpakgote 数据来源:互联网公开数据 标签:推荐系统,内容过滤,数据集,机器学习,用户偏好,信息检索,自然语言处理,电子商务... -
技能提取数据范围综述数据集ScopingReviewofSkillExtractionData-andruonciul
技能提取数据范围综述数据集ScopingReviewofSkillExtractionData-andruonciul 数据来源:互联网公开数据 标签:技能提取,数据集,自然语言处理,机器学习,教育技术,人力资源,文本分析,信息检索 数据概述: 该数据集包含来自多个来源的技能提取数据,记录了不同领域中技能信息的识别与提取。主要特征如下:... -
文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn
文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,信息检索,文本分析,知识图谱,学术研究 数据概述: 该数据集包含来自多个来源的文章主题分类数据,记录了各类文章的主题标签和内容。主要特征如下:... -
新闻分类清洗数据集NewsCategoryCleanedDataset-tamoghna96saha
新闻分类清洗数据集NewsCategoryCleanedDataset-tamoghna96saha 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,数据挖掘,信息检索,媒体研究 数据概述: 该数据集包含来自公开新闻来源的清洗后数据,记录了各类新闻文章的详细分类信息。主要特征如下:... -
IMDB电影剧情摘要数据集IMDBMoviePlotSummaryDataset-saugatkannojia
IMDB电影剧情摘要数据集IMDBMoviePlotSummaryDataset-saugatkannojia 数据来源:互联网公开数据 标签:电影,剧情分析,数据集,自然语言处理,文本挖掘,情感分析,机器学习,信息检索 数据概述:该数据集包含来自IMDB(互联网电影数据库)的电影剧情摘要数据,记录了数千部电影的剧情简介和相关信息。主要特征如下:... -
样本问答数据集SampledQADataDataset-hritik619916
样本问答数据集SampledQADataDataset-hritik619916 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,信息检索,文本分析,人工智能,数据挖掘 数据概述: 该数据集包含来自公开来源的问答对样本数据,记录了问题与对应答案的配对信息。主要特征如下:...