-
维基百科商品价格数据集Wiki-PriceDataset-sazid28
维基百科商品价格数据集Wiki-PriceDataset-sazid28 数据来源:互联网公开数据 标签:商品价格,维基百科,数据集,网络爬虫,数据挖掘,电子商务,市场分析,价格趋势 数据概述: 该数据集包含了从维基百科上抓取的商品价格信息,记录了各种商品的详细价格数据。主要特征如下: 时间跨度:数据记录的时间范围从某个起始时间到最近的更新时间。... -
维基百科条目提取数据集Wiki-ExtractsDataset-davandenakker
维基百科条目提取数据集Wiki-ExtractsDataset-davandenakker 数据来源:互联网公开数据 标签:维基百科,文本数据,数据集,自然语言处理,机器学习,信息检索,知识图谱,数据挖掘 数据概述: 该数据集包含从维基百科提取的条目数据,记录了维基百科中各类主题的文本信息。主要特征如下:... -
维基百科随机采样句子数据集-jeffheaton
维基百科随机采样句子数据集-jeffheaton 数据来源:互联网公开数据 标签:维基百科,句子采样,句子对比,文本分析,自然语言处理,教育,研究 数据概述:... -
维基百科电影剧情描述去名数据集-abbrivia
维基百科电影剧情描述去名数据集-abbrivia 数据来源:互联网公开数据 标签:电影,剧情,自然语言处理,主题建模,停用词,名字识别,维基百科 数据概述: 本数据集包含从维基百科抓取的35,000部电影的剧情描述,并移除了其中的所有名字。数据集通过内置的命名实体识别(NER)技术生成,并经过hunspell... -
西班牙维基百科性别差距研究女性编辑及其编辑行为数据集-joebeachcapital
西班牙维基百科性别差距研究女性编辑及其编辑行为数据集-joebeachcapital 数据来源:互联网公开数据 标签:维基百科,性别差距,女性编辑,编辑行为,研究数据,西班牙,数据分析 数据概述: 本数据集用于估计西班牙维基百科中的女性编辑数量及其编辑实践,包含20k个观测事件,旨在探索西班牙维基百科中的性别差距。数据集由J.... -
全球洞穴分布与特征数据集-vislupus
全球洞穴分布与特征数据集-vislupus 数据来源:互联网公开数据 标签:洞穴,地理,地质,自然,维基百科,维基数据,全球分布,洞穴特征 数据概述: 本数据集收录了来自世界各地的洞穴数据,包含了洞穴的地理位置、地质特征、相关描述等信息。数据来源于维基百科和维基数据,覆盖了不同国家和地区的洞穴。 数据用途概述:... -
西班牙维基百科女性编辑性别差距研究数据集2011-2021-umairaslam
西班牙维基百科女性编辑性别差距研究数据集2011-2021-umairaslam 数据来源:互联网公开数据 标签:维基百科,性别差距,女性编辑,编辑行为,数据统计,西班牙 数据概述:... -
维基百科演员共现关系网络节点特征数据集-训练测试集-liamcooper0927
维基百科演员共现关系网络节点特征数据集-训练测试集-liamcooper0927 数据来源:互联网公开数据 标签:图数据,演员,共现,维基百科,节点特征,社交网络,机器学习,文本分析 数据概述:... -
越南维基百科条目分类数据集-khoahongg
越南维基百科条目分类数据集-khoahongg 数据来源:互联网公开数据 标签:维基百科,越南语,分类,自然科学,社会科学,工程技术,文化,其他 数据概述:... -
维基百科俄语电影剧情数据集-maksimpotorochin
维基百科俄语电影剧情数据集-maksimpotorochin 数据来源:互联网公开数据 标签:电影,剧情,维基百科,俄语,语义搜索,数据集,多媒体 数据概述: 本数据集包含在维基百科上用俄语描述的电影、电视剧、动画和卡通的剧情介绍。数据集涵盖了各种类型的影视作品,但并非所有条目都有完整的剧情描述。这些描述提供了作品的核心情节和背景信息。 数据用途概述:... -
电影信息百科数据集-维基百科-mahmoudissa01
电影信息百科数据集-维基百科-mahmoudissa01 数据来源:互联网公开数据 标签:电影,维基百科,电影列表,电影信息,电影数据,娱乐,影视 数据概述:... -
维基百科化学物质信息与分子属性数据集-joebeachcapital
维基百科化学物质信息与分子属性数据集-joebeachcapital 数据来源:互联网公开数据 标签:维基百科,化学物质,分子结构,分子属性,化学知识,化合物信息,数据集,科学教育 数据概述:... -
维基百科讨论页评论数据集个人攻击标签
维基百科讨论页评论数据集个人攻击标签 数据来源:互联网公开数据 标签:维基百科,讨论页,个人攻击,毒性评论,自然语言处理,机器学习,数据集 数据概述:... -
印度维基百科文章数据集
印度维基百科文章数据集 数据来源:互联网公开数据 标签:维基百科,印度,自然语言处理,文本挖掘,语言模型,文本数据,机器学习 数据概述: 本数据集包含172,000篇经过清洗的印度维基百科文章,已转换为CSV格式,便于直接作为Pandas... -
印度语维基百科文章问答对数据集-问答生成-36-6k
印度语维基百科文章问答对数据集-问答生成-36-6k 数据来源:互联网公开数据 标签:问答对,印度语,维基百科,自然语言处理,机器翻译,问答生成,文本数据,语言学习 数据概述:... -
美国电影维基百科数据-1970年代至2020年代
美国电影维基百科数据-1970年代至2020年代 数据来源:互联网公开数据 标签:电影,美国,维基百科,剧情,标题,图像,NLP,机器学习,推荐系统 数据概述:... -
伦巴第语命名实体识别与语言训练数据集
伦巴第语命名实体识别与语言训练数据集 数据来源:互联网公开数据 标签:伦巴第语,命名实体识别,NER,语言模型,文本处理,自然语言处理,维基百科,WikiANN,语言训练,文本标注 数据概述: 本数据集是基于WikiANN项目构建的伦巴第语(Lombard)文本数据集,用于命名实体识别(NER)和语言模型训练。... -
-
维基百科页面数据集
维基百科页面数据集 数据来源:互联网公开数据 标签:维基百科,文本内容,自然语言处理,嵌入模型,信息检索,知识图谱,数据挖掘 数据概述: 本数据集基于Wikipedia页面内容构建,包含从原始竞赛数据集中提取的问答数据。数据集主要字段包括问题ID、维基百科页面建议、页面内容等。此外,数据集中还包含了通过Sentence-... -
电子邮件通信网络数据集
电子邮件通信网络数据集 数据来源:互联网公开数据 标签:电子邮件网络,社交网络分析,信息传播,社区结构,网络科学,Enron,欧洲研究机构,维基百科,Resistance游戏,动态网络 数据概述: 本数据集包含多个电子邮件通信网络的数据,具体如下: email-...