找到5,684个数据集

标签: 文本分析

过滤结果
  • 社交媒体Twitter的反讽大师Dril用户推文数据集

    2025年4月14日   

    社交媒体Twitter的反讽大师Dril用户推文数据集 数据来源:互联网公开数据 标签:社交媒体, Twitter, 推文数据, 文本分析, 用户行为, 网络文化, 幽默, Dril 数据概述:...
    packageimg
  • 纽约市Airbnb用户评价数据集-2021年

    2025年4月14日   

    纽约市Airbnb用户评价数据集-2021年 数据来源:互联网公开数据 标签:Airbnb,用户评价,纽约市,文本分析,情感分析,住宿体验,旅游,评论数据 数据概述:...
    packageimg
  • 产品属性提取任务数据集

    2025年4月14日   

    产品属性提取任务数据集 数据来源:互联网公开数据 标签:产品属性提取,自然语言处理,机器学习,电子商务,产品推荐,属性值对,文本分析 数据概述:...
    packageimg
  • AMD股票社区讨论与情绪分析数据集-2017-2023

    2025年4月14日   

    AMD股票社区讨论与情绪分析数据集-2017-2023 数据来源:互联网公开数据 标签:AMD,股票,社交媒体,情绪分析,社区,Reddit,投资,市场趋势,文本分析 数据概述: 本数据集收录了2017年至2023年期间,Reddit社区r/AMD_Stock中约500条热门帖子的相关数据。该社区是关于AMD(Advanced Micro...
    packageimg
  • 古吉拉特语推文数据集

    2025年4月14日   

    古吉拉特语推文数据集 数据来源:互联网公开数据 标签:推文,古吉拉特语,情感分析,翻译,社交媒体,文本分析,自然语言处理 数据概述: 本数据集包含超过25000条英文推文及其对应的古吉拉特语翻译,并附带每条推文的情感评分。数据集内容丰富,涵盖了多种主题和情感类型,为研究社交媒体文本及其情感特征提供了宝贵的数据资源。 数据用途概述:...
    packageimg
  • 大型语言模型论文数据集

    2025年4月14日   

    大型语言模型论文数据集 数据来源:互联网公开数据 标签:大型语言模型,论文生成,GPT-3.5-turbo,GPT-4,提示ID,文本分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 新闻分享量预测数据集-Mashable新闻文章特征-2年

    2025年4月14日   

    新闻分享量预测数据集-Mashable新闻文章特征-2年 数据来源:互联网公开数据 标签:新闻,社交媒体,机器学习,文本分析,分享量预测,Mashable,特征工程 数据概述: 本数据集包含Mashable新闻网站上发布的文章的相关特征,旨在用于预测新闻文章在社交媒体上的分享量。数据来源于Machine...
    packageimg
  • 维多利亚文学数据集

    2025年4月14日   

    维多利亚文学数据集 数据来源:互联网公开数据 标签:维多利亚文学,情感分析,机器学习,文本分析,文学研究,数据集,自然语言处理 数据概述:...
    packageimg
  • 仇恨言论数据集-01

    2025年4月14日   

    仇恨言论数据集-01 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,推特,文本分析,机器学习,自然语言处理 数据概述: 本数据集包含用于识别仇恨言论的推特训练集和测试集,涵盖了2010年至2021年间推特平台上发布的大量文本数据。数据集经过标注,区分了包含仇恨言论和非仇恨言论的推文,适用于仇恨言论检测任务的研究和开发。 数据用途概述:...
    packageimg
  • 泰卢固语问答系统数据集

    2025年4月14日   

    泰卢固语问答系统数据集 数据来源:互联网公开数据 标签:泰卢固语,问答系统,自然语言处理,机器学习,文本分析 数据概述: 本数据集专为构建泰卢固语问答系统而设计,包含了大量的泰卢固语问题及其对应的答案。数据集涵盖了多个领域的问题,包括但不限于科学、技术、文化、历史等,为开发和优化泰卢固语的问答系统提供了丰富的语言和知识基础。 数据用途概述:...
    packageimg
  • Kaggle社区论坛讨论主题分析数据集

    2025年4月14日   

    Kaggle社区论坛讨论主题分析数据集 数据来源:互联网公开数据 标签:Kaggle,论坛,讨论,数据科学,社区,用户行为,文本分析,话题,互动 数据概述:...
    packageimg
  • 印度道路交通事故社交媒体推文数据集2023

    2025年4月14日   

    印度道路交通事故社交媒体推文数据集2023 数据来源:互联网公开数据 标签:道路交通事故,社交媒体推文,印度,文本分析,安全研究,社会感知,交通管理 数据概述:...
    packageimg
  • BBC新闻数据集用于提取摘要

    2025年4月14日   

    BBC新闻数据集用于提取摘要 数据来源:互联网公开数据 标签:BBC新闻,新闻摘要,自然语言处理,文本分析,机器学习,数据挖掘 数据概述: 本数据集来源于Kaggle平台,收录了BBC新闻的文章及其对应的摘要。数据集涵盖了五个不同的新闻类别:商业、科技、娱乐、体育和政治。每篇文章都配有一个简短的摘要,便于进行文本摘要技术的研究和应用。 数据用途概述:...
    packageimg
  • 泰米尔古语诗歌泰律罗卡数据集1963-2021

    2025年4月14日   

    泰米尔古语诗歌泰律罗卡数据集1963-2021 数据来源:互联网公开数据 标签:泰律罗卡,泰米尔语,文学,翻译,教育,文本分析,机器学习 数据概述: 本数据集包含了《泰律罗卡》这部经典泰米尔文献的所有章节,共计1330行,6列数据。数据集详细记录了每个章节的原文、英译文及其在泰米尔语和英语中的解释,并对每个章节进行了主题分类。 数据用途概述:...
    packageimg
  • IMDB电影评论情感分类数据集1963-2021

    2025年4月14日   

    IMDB电影评论情感分类数据集1963-2021 数据来源:互联网公开数据 标签:电影评论,情感分类,自然语言处理,机器学习,文本分析,训练数据,测试数据 数据概述:...
    packageimg
  • 金融领域术语可读性评估数据集-FinRAD-2022

    2025年4月14日   

    金融领域术语可读性评估数据集-FinRAD-2022 数据来源:互联网公开数据 标签:金融,可读性,自然语言处理,文本分析,术语,数据集,金融科技,语言学 数据概述: 本数据集,即FinRAD(Financial Readability Assessment...
    packageimg
  • 亚马逊食品产品评价数据集1963-2021

    2025年4月14日   

    亚马逊食品产品评价数据集1963-2021 数据来源:互联网公开数据 标签:亚马逊,食品,产品信息,用户评价,产品名称,评分,文本分析,市场研究 数据概述:...
    packageimg
  • 垃圾邮件检测数据集

    2025年4月14日   

    垃圾邮件检测数据集 数据来源:互联网公开数据 标签:垃圾邮件检测,电子邮件过滤,文本分析,机器学习,自然语言处理,数据挖掘 数据概述:...
    packageimg
  • 基于语言工具的AI生成文本错误分析数据集

    2025年4月14日   

    基于语言工具的AI生成文本错误分析数据集 数据来源:互联网公开数据 标签:AI检测,文本分析,语言工具,错误分析,生成文本,写作风格,自然语言处理,教育,评估 数据概述:...
    packageimg
  • 无政府主义书籍-PM出版社数据集

    2025年4月14日   

    无政府主义书籍-PM出版社数据集 数据来源:互联网公开数据 标签:无政府主义,书籍,左翼书店,PM出版社,文学分析,主题分类,文本分析 数据概述:...
    packageimg