找到5,827个数据集

标签: 文本分析

过滤结果
  • YALICKJ维基百科带上下文数据集

    2025年4月15日   

    YALICKJ维基百科带上下文数据集 数据来源:互联网公开数据 标签:维基百科,上下文,数据集,自然语言处理,机器学习,文本分析 数据概述: 本数据集基于YALICKJ在Kaggle上提供的维基百科数据集,并增加了由Chris Notebook生成的上下文列。数据集包含了维基百科页面的文本内容及其对应的上下文信息,适用于自然语言处理和机器学习任务。...
    packageimg
  • Reddit科技与科学领域缩略词数据集

    2025年4月15日   

    Reddit科技与科学领域缩略词数据集 数据来源:互联网公开数据 标签:缩略词,科技,科学,Reddit,社交媒体,文本分析,数据挖掘,自然语言处理 数据概述:...
    packageimg
  • DCS世界战役产品数据集

    2025年4月15日   

    DCS世界战役产品数据集 数据来源:互联网公开数据 标签:DCS世界,战役产品,文本分析,NLP,游戏数据,产品信息 数据概述: 本数据集包含DCS世界战役产品的原始文本数据,涵盖除价格外的所有公开信息,这些信息客户可以在DCS-...
    packageimg
  • Etsy电商平台商品评价星级数据集

    2025年4月15日   

    Etsy电商平台商品评价星级数据集 数据来源:互联网公开数据 标签:电商,评价,星级,用户反馈,文本分析,情感分析,Etsy,商品,评论 数据概述: 本数据集包含了Etsy电商平台上的1000条商品评论数据。每条数据包含两个字段:一是买家对商品的评价文本,二是买家给出的星级评分(1-5星)。数据来源于Etsy网站,涵盖了不同商品的评价内容和买家满意度。...
    packageimg
  • 数据2018-2020年GDPR罚款数据集更新至2021年1月23日

    2025年4月15日   

    数据2018-2020年GDPR罚款数据集更新至2021年1月23日 数据来源:互联网公开数据 标签:GDPR,罚款,隐私,数据保护,欧洲,法律,数据分析,文本分析 数据概述:...
    packageimg
  • 故事创作与评价数据集

    2025年4月15日   

    故事创作与评价数据集 数据来源:互联网公开数据 标签:故事创作,心理学,创造力评估,文本分析,用户画像,个性化推荐,情感分析 数据概述 本数据集来源于《StoriesInTheWild》论文,包含两部分数据,分别存储在 stories.csv 和 ratings.csv 两个 CSV...
    packageimg
  • 视频游戏综合评论数据集1963-2021

    2025年4月15日   

    视频游戏综合评论数据集1963-2021 数据来源:互联网公开数据 标签:视频游戏,评论,用户评价,文本分析,情感分析,游戏推荐,市场趋势 数据概述:...
    packageimg
  • 罗马尼亚语维基源文学语料库1963-2021

    2025年4月15日   

    罗马尼亚语维基源文学语料库1963-2021 数据来源:互联网公开数据 标签:罗马尼亚文学,维基源,语料库,自然语言处理,机器学习,古典文学,文本分析 数据概述:...
    packageimg
  • 新闻与道琼斯指数结合数据集

    2025年4月15日   

    新闻与道琼斯指数结合数据集 数据来源:互联网公开数据 标签:新闻,道琼斯指数,股票市场,金融分析,时间序列,文本分析 数据概述:...
    packageimg
  • 阅读理解自动生成问题竞赛数据集-儿童阅读理解测试-2024

    2025年4月15日   

    阅读理解自动生成问题竞赛数据集-儿童阅读理解测试-2024 数据来源:互联网公开数据 标签:阅读理解,问题生成,自然语言处理,教育科技,儿童教育,文本分析,机器学习,FairytaleQA 数据概述: 本数据集源自“The Quest for Quality Questions: Improving Reading Comprehension...
    packageimg
  • 世界各国国歌文本聚类分析数据集

    2025年4月15日   

    世界各国国歌文本聚类分析数据集 数据来源:互联网公开数据 标签:国歌,文本分析,聚类,文化,语言,音乐 数据概述: 本数据集包含研究世界各地国歌所需的所有文件,主要数据集为national_anthems.csv,该数据集来源于“lucasturtle/national-anthems-of-the-...
    packageimg
  • 办公室情景剧名言数据集

    2025年4月15日   

    办公室情景剧名言数据集 数据来源:互联网公开数据 标签:情景剧,办公室,名言,角色对话,人物分析,文本分析,文化研究 数据概述:...
    packageimg
  • 薄伽梵歌逐句数据集

    2025年4月15日   

    薄伽梵歌逐句数据集 数据来源:互联网公开数据 标签:薄伽梵歌,印度教经典,逐句翻译,宗教文本,推荐系统,文化研究,文本分析 数据概述: 本数据集包含了《薄伽梵歌》的逐句翻译,数据来源于https://www.holy-bhagavad-gita.org/。该数据集提供了《薄伽梵歌》的每一句的原文及对应的翻译,为研究印度教经典和文化提供了文本基础。...
    packageimg
  • 矛盾的-我的朋友沃森数据集

    2025年4月15日   

    矛盾的-我的朋友沃森数据集 数据来源:互联网公开数据 标签:逻辑推理,矛盾分析,英语翻译,竞争数据,文本分析,问题解决 数据概述: 本数据集包含了“矛盾的,我的朋友沃森”竞赛的翻译成英文的数据,仅有少量数据(约20-30条)存在异常或错误。数据集内容主要涉及逻辑推理、矛盾识别和问题解决等方面,为相关研究提供了可靠的基础数据支持。 数据用途概述:...
    packageimg
  • 莎士比亚戏剧亨利四世剧本数据分析集

    2025年4月15日   

    莎士比亚戏剧亨利四世剧本数据分析集 数据来源:互联网公开数据 标签:莎士比亚,戏剧,角色台词,文本分析,文学研究,幕场结构,对话内容 数据概述:...
    packageimg
  • G1新闻评论数据集2023

    2025年4月15日   

    G1新闻评论数据集2023 数据来源:互联网公开数据 标签:新闻评论,社交媒体,文本分析,情感分析,新闻聚合 数据概述:...
    packageimg
  • 好读网图书描述与分类数据集

    2025年4月15日   

    好读网图书描述与分类数据集 数据来源:互联网公开数据 标签:图书,描述,分类,好读网,教育项目,文本分析,自然语言处理 数据概述:...
    packageimg
  • WebMD避孕药用户评论数据集

    2025年4月15日   

    WebMD避孕药用户评论数据集 数据来源:互联网公开数据 标签:避孕药,用户评论,WebMD,医疗健康,药物评价,消费者反馈,文本分析 数据概述:...
    packageimg
  • 社交媒体灾害相关推文清洗数据集

    2025年4月15日   

    社交媒体灾害相关推文清洗数据集 数据来源:互联网公开数据 标签:社交媒体, 灾害, 自然语言处理, 文本清洗, 拼写纠正, 数据增强, 文本分析, 机器学习 数据概述: 本数据集基于“Natural Language Processing with Disaster...
    packageimg
  • 荷兰法律合同分析与翻译数据集

    2025年4月15日   

    荷兰法律合同分析与翻译数据集 数据来源:互联网公开数据 标签:荷兰法律,合同分析,翻译,法律文本,文本分析,机器学习,法律研究 数据概述: 本数据集专为荷兰法律合同的分析和翻译而设计,适用于对荷兰法律文本进行深入研究。数据集包含了多种类型的荷兰法律合同文本,旨在为研究人员和开发者提供一个基础数据集,用于训练和优化如Gemma等法律文本分析与翻译工具。...
    packageimg