-
伊斯兰教圣训集锦رياضالصالحين圣训数据集中英双语版
伊斯兰教圣训集锦رياضالصالحين圣训数据集中英双语版 数据来源:互联网公开数据 标签:圣训,伊斯兰教,宗教,经典,阿拉伯语,英语,文本数据,Hadith,Riyad as-Saliheen,GPT-3,GPT-4 数据概述: 本数据集收录了《 رياض الصالحين》(Riyad as-Saliheen)... -
英语-法语翻译数据集
英语-法语翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,英语,法语,文本数据,语言对,翻译模型 数据概述: 本数据集包含138,000对英语-法语翻译的句子对。每对数据由一个英语句子及其对应的法语翻译构成。数据集提供了丰富的翻译实例,涵盖了多种主题和语言风格。 数据用途概述:... -
Mixtral8x7B模型生成AI写作检测竞赛模拟论文数据集
Mixtral8x7B模型生成AI写作检测竞赛模拟论文数据集 数据来源:互联网公开数据 标签:人工智能,LLM,Mixtral,论文生成,写作风格模仿,AI检测,竞赛,文本数据 数据概述: 本数据集旨在用于大型语言模型(LLM)生成的文本检测,特别针对“AI写作检测”竞赛。数据集包含约4000篇由Mixtral... -
马拉雅拉姆电影评论情感分析数据集1963-2021
马拉雅拉姆电影评论情感分析数据集1963-2021 数据来源:互联网公开数据 标签:电影评论,马拉雅拉姆语言,情感分析,NLP,文本数据,电影产业,观众反馈 数据概述:... -
Reddit抑郁主题清理文本数据集-2021
Reddit抑郁主题清理文本数据集-2021 数据来源:互联网公开数据 标签:Reddit,抑郁,文本生成,数据清理,心理健康,社交媒体,文本数据 数据概述:... -
南方公园主要角色台词数据集
南方公园主要角色台词数据集 数据来源:互联网公开数据 标签:南方公园,台词,角色分析,文本数据,剧集台词,角色对话 数据概述: 本数据集包含了《南方公园》从首集到最新集数的所有剧集台词,共计收录了卡特曼、斯坦、克yle、肯尼、巴特曼斯、温蒂、克莱格和特维克这八个主要角色的所有台词。数据集为研究角色性格、剧情发展提供了详实的文本基础。 数据用途概述:... -
Reddit平台政治观点讨论分析数据集-自由派与保守派-13000条帖子
Reddit平台政治观点讨论分析数据集-自由派与保守派-13000条帖子 数据来源:互联网公开数据 标签:Reddit,政治,观点分析,自由派,保守派,文本数据,社交媒体,NLP,自然语言处理 数据概述:... -
推特情感分析情感分类数据集
推特情感分析情感分类数据集 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,文本数据,情感分类,情绪识别,CrowdFlower 数据概述:... -
伊斯兰圣训分享平台推特文本数据集-包含圣训-传播者-出处等信息-自2022年至今
伊斯兰圣训分享平台推特文本数据集-包含圣训-传播者-出处等信息-自2022年至今 数据来源:互联网公开数据 标签:圣训,伊斯兰,推特,社交媒体,文本数据,宗教,传播者,出处,经典 数据概述:... -
印度新闻文章数据集
印度新闻文章数据集 数据来源:互联网公开数据 标签:印度新闻,文章分析,文本数据,新闻作者,发布日期,社会研究,数据采集 数据概述: 本数据集包含了印度新闻网站Firstpost.com发布的新闻文章,数据范围涵盖了文章的主要内容,以及每篇文章的作者、链接、发布日期等关键信息。该数据集为研究印度新闻生态、社会动态提供了宝贵的数据资源。 数据用途概述:... -
全球多语言垃圾短信检测数据集1963-2021
全球多语言垃圾短信检测数据集1963-2021 数据来源:互联网公开数据 标签:垃圾短信检测,多语言NLP,文本分类,跨语言分析,文本数据 数据概述:... -
新冠疫苗新闻Reddit讨论评论数据集
新冠疫苗新闻Reddit讨论评论数据集 数据来源:互联网公开数据 标签:新冠疫苗, Reddit, 评论, 疫情, 社交媒体, 舆情分析, 文本数据, 疫苗接种 数据概述:... -
Reddit书籍讨论热度和情感分析数据集
Reddit书籍讨论热度和情感分析数据集 数据来源:互联网公开数据 标签:Reddit,书籍,社交媒体,情感分析,用户行为,流行度,文本数据,评论分析 数据概述:... -
社交媒体用户推文情感分析数据集-时间跨度2023年1月至2024年1月
社交媒体用户推文情感分析数据集-时间跨度2023年1月至2024年1月 数据来源:互联网公开数据 标签:推文,社交媒体,情感分析,文本数据,自然语言处理,用户行为,情绪识别,舆情分析 数据概述:... -
尼泊尔新闻文章文本分类与摘要数据集
尼泊尔新闻文章文本分类与摘要数据集 数据来源:互联网公开数据 标签:尼泊尔语,新闻文章,文本分类,文本摘要,自然语言处理,NLP,机器学习,文本数据 数据概述: 本数据集包含约7500篇尼泊尔语新闻文章,来源于多个尼泊尔新闻网站。数据集经过清洗,包含相对平衡的训练集和测试集,适用于训练和评估尼泊尔语文本分类模型和文本摘要模型。 数据用途概述:... -
孟加拉语YouTube评论情感与情绪分析数据集
孟加拉语YouTube评论情感与情绪分析数据集 数据来源:互联网公开数据 标签:孟加拉语,YouTube,情感分析,情绪识别,多标签,文本数据,社交媒体,自然语言处理 数据概述: 本数据集包含从YouTube上不同类型的孟加拉语视频中收集的评论,用于多标签情感分析和情绪检测。数据包含两个主要文件:Sentiment.csv 和... -
SST-2情感分类数据集
SST-2情感分类数据集 数据来源:互联网公开数据 标签:情感分析,二分类,自然语言处理,句子级分类,文本数据 数据概述: 本数据集用于全句子的情感分类实验,特别针对正面和负面情感的二分类任务。数据集中舍弃了标记为中性的句子,仅保留明显负面或正面的句子。数据集分为训练集和测试集,适用于自然语言处理和情感分析研究。 数据用途概述:... -
印度废钞行动社交媒体推文情感分析数据集-2016年11月
印度废钞行动社交媒体推文情感分析数据集-2016年11月 数据来源:互联网公开数据 标签:废钞,印度,推特,社交媒体,情感分析,经济,政策,舆情,文本数据 数据概述:... -
沙特阿拉伯电信公司客户服务推文情感分析数据集
沙特阿拉伯电信公司客户服务推文情感分析数据集 数据来源:互联网公开数据 标签:推特,社交媒体,客户服务,情感分析,阿拉伯语,沙特阿拉伯,电信,文本数据 数据概述:... -
异构数据集文本-数值-有序列
异构数据集文本-数值-有序列 数据来源:互联网公开数据 标签:NLP,文本数据,数值数据,有序数据,特征工程,列转换器,机器学习,产品决策,合成数据 数据概述:...