-
句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513
句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,语义分析,语言模型,NLP,数据集,语义相似度 数据概述:该数据集包含来自PAWS项目(Paraphrase Adversarial... -
Python自然语言处理实践数据集-ndrianahani
Python自然语言处理实践数据集-ndrianahani 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,数据集,Python,机器学习,语言模型,文本挖掘 数据概述: 该数据集包含用于Python自然语言处理实践的文本数据,涵盖了多种NLP任务和应用场景。主要特征如下: 时间跨度: 数据记录的时间范围不限,数据集内容持续更新。... -
简化虚假新闻数据集
简化虚假新闻数据集 数据来源:互联网公开数据 标签:虚假新闻,文本分类,NLP,二分类问题,数据清洗,特征提取,新闻真实性分析 数据概述: 本数据集是虚假新闻与真实新闻数据集的简化版本,旨在为文本分类任务提供训练集。数据集已标注,包含真实新闻与虚假新闻的文本内容,适合作为自然语言处理(NLP)任务的基础数据。数据集经过初步处理,确保数据质量与一致性。... -
阿拉伯语情感分析数据集-ouaraskhelilrafik
阿拉伯语情感分析数据集-ouaraskhelilrafik 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,自然语言处理,NLP,文本数据,机器学习,语言学,情感分类 数据概述: 该数据集包含阿拉伯语文本及其对应的情感标签,用于情感分析研究。主要特征如下: 时间跨度:数据的时间跨度取决于具体的数据来源,通常涵盖近年。... -
乌拉尔联邦大学UrFU自然语言处理NLP作业数据集2022年-vladimirkatin
乌拉尔联邦大学UrFU自然语言处理NLP作业数据集2022年-vladimirkatin 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,情感分析,数据集,俄语,机器学习,乌拉尔联邦大学 数据概述: 该数据集包含来自乌拉尔联邦大学(UrFU)自然语言处理课程的作业数据,记录了学生在自然语言处理相关任务中的文本数据和结果。主要特征如下:... -
欢乐朋友们对话数据集-jahysama
欢乐朋友们对话数据集-jahysama 数据来源:互联网公开数据 标签:欢乐朋友们,对话,剧本,自然语言处理,NLP,电视剧,娱乐,文本数据 数据概述: 本数据集包含电视剧《欢乐朋友们》(Smiling... -
中文分词数据集Word-SegmentedDatasetfrom01Janto03-ictunivers
中文分词数据集Word-SegmentedDatasetfrom01Janto03-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,中文分词,数据集,文本分析,机器学习,语言处理,NLP,中文处理 数据概述: 该数据集包含中文文本的分词数据,记录了从01月01日到03月31日之间的中文文本的分词结果。主要特征如下:... -
EMPOLITICON政治演说情感与背景分类数据集-2010年-efatazher
EMPOLITICON政治演说情感与背景分类数据集-2010年-efatazher 数据来源:互联网公开数据 标签:EMPOLITICON,政治演说,情感分析,背景分类,NLP,机器学习,美国总统,英国首相,中国总理,俄罗斯总统 数据概述:... -
斯坦福问答数据集SQuAD-donutkashvi
斯坦福问答数据集SQuAD-donutkashvi 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器阅读理解,文本理解,深度学习,人工智能,NLP 数据概述: 该数据集包含了斯坦福大学开发的问答数据集,用于评估机器阅读理解能力。主要特征如下:... -
LinkedIn用户评论情感分析数据集-社交互动与情感洞察-preeti0806
LinkedIn用户评论情感分析数据集-社交互动与情感洞察-preeti0806 数据来源:互联网公开数据 标签:LinkedIn,用户评论,情感分析,NLP,社交媒体,用户行为,文本挖掘,情感识别 数据概述:... -
自然语言处理作业三测试数据集-hangman1998
自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。... -
孟加拉语社交媒体新闻操控识别数据集2023-mozaman36
孟加拉语社交媒体新闻操控识别数据集2023-mozaman36 数据来源:互联网公开数据 标签:孟加拉语,社交媒体,新闻操控,数据集,NLP,信息识别,假新闻检测,计算术语 数据概述:... -
MBTI人格类型与恋爱主题文本数据集-yamaerenay
MBTI人格类型与恋爱主题文本数据集-yamaerenay 数据来源:互联网公开数据 标签:MBTI,人格类型,恋爱,文本分析,NLP,分类,关键词提取,Enneagram,心理学 数据概述:... -
AlpacaGPT-4指令跟随推理数据集-2023-thedevastator
AlpacaGPT-4指令跟随推理数据集-2023-thedevastator 数据来源:互联网公开数据 标签:NLP,指令跟随,自然语言处理,机器学习,研究,教育,人工智能,科学,推理 数据概述:... -
美国事实核查网站Politifact言论真实性评估数据集-shivkumarganesh
美国事实核查网站Politifact言论真实性评估数据集-shivkumarganesh 数据来源:互联网公开数据 标签:事实核查,言论真实性,美国,政治,新闻,数据,分析,NLP 数据概述:... -
WordNet超义词数据集-2006-duketemon
WordNet超义词数据集-2006-duketemon 数据来源:互联网公开数据 标签:WordNet,超义词,语义关系,自然语言处理,NLP,语言学,数据集 数据概述:... -
英-马尔地语双语翻译数据集-mayakaripel
英-马尔地语双语翻译数据集-mayakaripel 数据来源:互联网公开数据 标签:英-马尔地语,双语翻译,机器翻译,NLP,语言学习,数据集,信息检索,情感分析,知识转移 数据概述: 本数据集包含成对的英-马尔地语翻译句子,为机器翻译和其他跨语言自然语言处理(NLP)任务提供了宝贵的资源。数据集中的每一对句子都是彼此的翻译,适用于开发和评估英-... -
动漫名言数据集-2023-thegame
动漫名言数据集-2023-thegame 数据来源:互联网公开数据 标签:动漫,名言,角色,情感分析,NLP,生成式AI,对话系统 数据概述: 本数据集包含来自822部不同动漫作品的约8500条独特名言,涉及2,391个不同的角色。每条记录包括动漫名称、角色姓名以及该角色所说的话语。数据集涵盖了广泛的主题和风格,为自然语言处理任务提供了丰富的素材。... -
PDF文档摘要提取数据集DrivePDFDataset-atif10
PDF文档摘要提取数据集DrivePDFDataset-atif10 数据来源:互联网公开数据 标签:PDF文档,文本摘要,数据集,自然语言处理,机器学习,信息检索,文档分析,NLP 数据概述: 该数据集包含来自Google Drive的PDF文档及其对应的摘要文本。主要特征如下: 时间跨度: 数据记录的时间跨度不明确,取决于文档的创建和上传时间。... -
英法翻译数据集English-FrenchTranslationDataset-endofnight17j03
英法翻译数据集English-FrenchTranslationDataset-endofnight17j03 数据来源:互联网公开数据 标签:机器翻译,翻译,自然语言处理,数据集,语言模型,文本数据,双语语料库,NLP 数据概述: 该数据集包含英法双语翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:...