-
Flipkart电商平台用户评论情感分析数据集
Flipkart电商平台用户评论情感分析数据集 数据来源:互联网公开数据 标签:电商,用户评论,情感分析,自然语言处理,机器学习,Flipkart,消费者行为,文本挖掘 数据概述:... -
洋葱新闻数据集
洋葱新闻数据集 数据来源:互联网公开数据 标签:洋葱新闻,真实新闻,文本分类,机器学习,自然语言处理,数据集,新闻真实性 数据概述: 本数据集包含《The Onion》发布的假新闻文章和来自Reddit论坛r/NotTheOnion的真实“洋葱式”新闻文章。《The... -
-
孟加拉语对话摘要数据集英文翻译
孟加拉语对话摘要数据集英文翻译 数据来源:互联网公开数据 标签:对话摘要, 孟加拉语, 自然语言处理, 机器翻译, 文本摘要, 语言数据, 翻译数据集 数据概述:... -
PII数据检测与生成数据集
PII数据检测与生成数据集 数据来源:互联网公开数据 标签:PII检测,数据生成,Gemini API,数据安全,机器学习,自然语言处理 数据概述: 本数据集通过Gemini... -
Reddit印度板块标签预测数据集
Reddit印度板块标签预测数据集 数据来源:互联网公开数据 标签:Reddit,印度,社交媒体,数据分析,自然语言处理,机器学习,内容分类 数据概述:... -
IBM辩论者和规则标记演讲中被强调的词语数据集
IBM辩论者和规则标记演讲中被强调的词语数据集 数据来源:互联网公开数据 标签:IBM,辩论,演讲,文本标注,强调词语,自然语言处理,语音分析 数据概述:... -
坏兔子BadBunny歌曲歌词文本情感分析数据集
坏兔子BadBunny歌曲歌词文本情感分析数据集 数据来源:互联网公开数据 标签:歌词,音乐,坏兔子,Bad Bunny,西班牙语,说唱,流行音乐,情感分析,自然语言处理 数据概述: 本数据集包含了艺术家Bad Bunny(坏兔子)的歌曲歌词,涵盖了专辑歌曲和单曲。数据来源于网络爬取,使用BeautifulSoup和Genius... -
药品描述数据集
药品描述数据集 数据来源:互联网公开数据 标签:药品描述,文本摘要,自然语言处理,产品介绍,数据压缩 数据概述: 本数据集包含某公司产品的详细介绍文本。这些描述通常较长且详细,涵盖了产品的各个方面。本数据集旨在为文本摘要系统的开发提供基础,帮助用户将长篇的产品描述转化为简短而保留核心信息的摘要。 数据用途概述:... -
WordNet词汇同义词典数据集
WordNet词汇同义词典数据集 数据来源:互联网公开数据 标签:词汇,同义词,语义,自然语言处理,词典,WordNet,语言学 数据概述: 本数据集收录了来自WordNet... -
恐怖主义与圣战言论检测数据集
恐怖主义与圣战言论检测数据集 数据来源:互联网公开数据 标签:恐怖主义,圣战,言论检测,在线仇恨言论,社交媒体分析,自然语言处理,机器学习 数据概述:... -
中东地区出行平台用户评论数据集
中东地区出行平台用户评论数据集 数据来源: 互联网公开数据 (Google Play Store & Apple App Store) 标签: 用户评论,评论数据,自然语言处理,NLP,情感分析,出行平台 数据概述:... -
印尼语PlayStore应用评论数据集
印尼语PlayStore应用评论数据集 数据来源:互联网公开数据 标签:Play Store, 应用评论, 情感分析, 自然语言处理, 印尼语, 用户评价, 软件开发, 数据挖掘 数据概述: 本数据集包含从Google Play Store收集的印尼语应用评论集合。 数据涵盖了各种应用的用户评论,包括评论的星级评分、评论日期以及用户撰写的评论文本。... -
古兰经阿拉伯语-印尼语平行语料库
古兰经阿拉伯语-印尼语平行语料库 数据来源:互联网公开数据 标签:古兰经,阿拉伯语,印尼语,平行语料库,宗教文本,语言翻译,自然语言处理,翻译研究 数据概述 本数据集包含古兰经的阿拉伯语原文及其印尼语官方翻译的平行文本。数据来源于印度尼西亚宗教事务部(Kementerian Agama Republik... -
词汇语义与修辞手法数据集-词汇同义词与词频统计
词汇语义与修辞手法数据集-词汇同义词与词频统计 数据来源:互联网公开数据 标签:词汇语义,同义词,修辞手法,词频统计,WordNet,自然语言处理,文本分析,语言学,语料库 数据概述:... -
开放LLM性能数据集
开放LLM性能数据集 数据来源:互联网公开数据 标签:开放语言模型,性能基准,Hugging Face,自然语言处理,机器学习,评估指标 数据概述: 本数据集是基于Hugging Face排行榜截至2023年10月16日的全面语言模型性能评估指标。数据集收录了多种开放语言模型的性能数据,涵盖多个评估维度,为研究和比较不同语言模型提供了可靠的数据基础。... -
多语言有毒言论检测数据集2023
多语言有毒言论检测数据集2023 数据来源:互联网公开数据 标签:有毒言论,社交媒体,自然语言处理,多语言,文本分类,情感分析,言论监测 数据概述: 本数据集收录了用法语、英语和阿拉伯语标注的推文,每条推文被标记为有毒或非有毒。数据集中,标签0表示非有毒推文,标签1表示有毒推文。该数据集为研究多语言环境下的有毒言论提供了丰富的资源。 数据用途概述:... -
纳斯达克新闻情感分析数据集
纳斯达克新闻情感分析数据集 数据来源:互联网公开数据 标签:纳斯达克,新闻,情感分析,金融,市场趋势,投资决策,自然语言处理 数据概述: 本数据集来源于雅虎财经和商业内幕网(市场内幕网),收录了纳斯达克市场上热门股票的新闻报道,并通过Hugging Face的FinBERT... -
亚马逊精选美食评论数据集
亚马逊精选美食评论数据集 数据来源:互联网公开数据 标签:电子商务,食品,用户评价,自然语言处理,NLP,推荐系统,评分数据,消费行为 数据概述 本数据集是经过精简和清洗的 Amazon Fine Foods... -
巴基斯坦用户对Threads推特应用评论情感分析数据集
巴基斯坦用户对Threads推特应用评论情感分析数据集 数据来源:互联网公开数据 标签:社交媒体,评论分析,用户反馈,情感分析,Threads,巴基斯坦,应用评估,自然语言处理 数据概述: 本数据集包含了来自巴基斯坦地区用户在Google...