-
-
维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj
维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj 数据来源:互联网公开数据 标签:自然语言处理,文本分析,维基百科,数据集,语境理解,机器学习,文本挖掘,知识图谱 数据概述:该数据集包含来自维基百科的文章数据,旨在研究文章的上下文语境信息。主要特征如下:... -
维基电影分类与描述数据集2023
维基电影分类与描述数据集2023 数据来源:互联网公开数据 标签:电影,维基百科,分类,描述,电影数据,娱乐研究,文化分析 数据概述: 本数据集包含从维基百科获取的130,406部电影的详细描述和分类信息。数据集通过本地维基数据转储获取电影名称,并使用wikipediaapi库下载每部电影的描述及类别信息,提供了全面的电影数据资源。 数据用途概述:... -
维基百科数据集DCWikiDataCSV-jungwoonseok
维基百科数据集DCWikiDataCSV-jungwoonseok 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,机器学习,信息检索,学术资源,知识图谱 数据概述:该数据集包含来自维基百科的数据,记录了大量维基百科页面的内容和属性。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
维基百科字母顺序分类数据集WikiAZDataset-fidanmusazade
维基百科字母顺序分类数据集WikiAZDataset-fidanmusazade 数据来源:互联网公开数据 标签:维基百科,数据集,字母分类,文本挖掘,信息检索,自然语言处理,机器学习,知识图谱 数据概述: 该数据集包含来自维基百科的数据,记录了维基百科条目按照字母顺序分类的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从维基百科的创建至今。... -
维基百科文章向量文件数据集WikipediaArticlesVectorFileDataset-sachinsk
维基百科文章向量文件数据集WikipediaArticlesVectorFileDataset-sachinsk 数据来源:互联网公开数据 标签:维基百科,文章向量,自然语言处理,数据集,机器学习,文本分析,词嵌入,信息检索 数据概述: 该数据集包含来自维基百科的文章向量数据,记录了维基百科文章的词嵌入向量。主要特征如下: 时间跨度:... -
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira
维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,语言学,机器学习,信息检索 数据概述: 该数据集包含来自维基百科的法语语言内容,记录了多个领域的百科全书条目。主要特征如下:... -
维基百科矿物数据信息综合数据库-florianneukirchen
维基百科矿物数据信息综合数据库-florianneukirchen 数据来源:互联网公开数据 标签:矿物学,矿物,维基百科,化学成分,晶体结构,莫氏硬度,Strunz分类,地球科学 数据概述:... -
维基百科表格问答数据集-thedevastator
维基百科表格问答数据集-thedevastator 数据来源:互联网公开数据 标签:表格问答,自然语言处理,人工智能,数据科学,复杂问题,维基百科,半结构化数据 数据概述:... -
印度NIFTY50成分公司维基百科文章文本数据集-aakashsaroop
印度NIFTY50成分公司维基百科文章文本数据集-aakashsaroop 数据来源:互联网公开数据 标签:NIFTY50, 印度, 股票市场, 公司信息, 维基百科, 文本数据, 金融, 商业 数据概述: 本数据集包含了印度NIFTY... -
奔跑吧兄弟韩剧维基百科数据集RunningManKoreanShowWikipediaDataset-zeeniye
奔跑吧兄弟韩剧维基百科数据集RunningManKoreanShowWikipediaDataset-zeeniye 数据来源:互联网公开数据 标签:奔跑吧兄弟,韩剧,电视剧,维基百科,数据集,文化研究,媒体分析,娱乐产业 数据概述:该数据集包含来自维基百科的《奔跑吧兄弟》韩剧的相关数据,记录了这部韩国著名综艺节目从首播以来的详细信息。主要特征如下:... -
印地语维基百科数据集HindiWikipediaDataset-vjdwary
印地语维基百科数据集HindiWikipediaDataset-vjdwary 数据来源:互联网公开数据 标签:维基百科,印地语,数据集,自然语言处理,文本分析,机器学习,语言资源,多语言处理 数据概述: 该数据集包含来自印地语维基百科的文本数据,记录了维基百科上的文章内容。主要特征如下:... -
孟加拉语维基百科文本数据集
孟加拉语维基百科文本数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,文本数据,自然语言处理,机器学习,语言模型,文本挖掘 数据概述:... -
土耳其维基百科人物出生日期数据集1923-2010-rusiano
土耳其维基百科人物出生日期数据集1923-2010-rusiano 数据来源:互联网公开数据 标签:土耳其,维基百科,人物,出生日期,历史,数据分析,人口统计 数据概述:... -
印度历史数据维基百科数据集IndianHistoricalData-WikipediaDataset-sivangi116
印度历史数据维基百科数据集IndianHistoricalData-WikipediaDataset-sivangi116 数据来源:互联网公开数据 标签:历史研究,数据集,维基百科,印度历史,文化研究,数据分析,学术资源,教育材料 数据概述:... -
大型语言模型生成的维基百科多选题数据集-yalickj
大型语言模型生成的维基百科多选题数据集-yalickj 数据来源:互联网公开数据 标签:多选题,维基百科,人工智能,机器学习,自然语言处理,考试,教育,测评,生成式AI 数据概述: 本数据集包含由大型语言模型(LLMs, Large Language... -
乌克兰议员历史数据集1990至2020年-piterfm
乌克兰议员历史数据集1990至2020年-piterfm 数据来源:互联网公开数据 标签:乌克兰,议员,历史数据,议会,政治,数据集,维基百科 数据概述:... -
纽约时报虚构类畅销书榜单数据集1931-2022-aaddrick
纽约时报虚构类畅销书榜单数据集1931-2022-aaddrick 数据来源:互联网公开数据 标签:纽约时报,畅销书,虚构类,图书,作者,时间序列,数据集,维基百科 数据概述:... -
维基百科平衡性别共指数据集-thedevastator
维基百科平衡性别共指数据集-thedevastator 数据来源:互联网公开数据 标签:共指,性别平衡,数据集,维基百科,文本分析,自然语言处理,NLP,教育,研究 数据概述:... -
法语维基百科阅读理解挑战数据集-2023-thedevastator
法语维基百科阅读理解挑战数据集-2023-thedevastator 数据来源:互联网公开数据 标签:法语,维基百科,阅读理解,语言学习,教育,数据集,问答,文本分析 数据概述: 本数据集包含3835个关于法语维基百科的文章相关问题,旨在帮助学习者提升法语阅读理解能力。数据集由Huggingface...