-
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,机器学习,模型评估,语言模型,Llama 70B, Falcon 180B,文本检测,DAIGT,对抗样本 数据概述:... -
动物评论情感分析数据集-victoromole
动物评论情感分析数据集-victoromole 数据来源:互联网公开数据 标签:动物,评论,情感分析,自然语言处理,文本挖掘,数据集,机器学习,舆情分析 数据概述: 该数据集包含了关于动物的评论数据,旨在用于情感分析研究。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但包含了大量最新的评论数据。 地理范围:... -
案例分析文本数据集AnliDataset-lkyande
案例分析文本数据集AnliDataset-lkyande 数据来源:互联网公开数据 标签:案例分析,文本数据,自然语言处理,法律文本,数据分析,机器学习,法律研究,文本挖掘 数据概述:该数据集包含来自多个法律案例的文本数据,记录了详细的案例信息,适用于案例分析,文本挖掘和自然语言处理等任务。主要特征如下:... -
专利摘要数据集PatentAbstractsDataset-somnath796
专利摘要数据集PatentAbstractsDataset-somnath796 数据来源:互联网公开数据 标签:专利,摘要,数据集,知识产权,技术分析,机器学习,自然语言处理,科学研究 数据概述:该数据集包含来自专利机构的专利摘要数据,记录了全球各地专利申请的详细摘要信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
推特过滤数据集TwitterFilteredDataset-kaggledatasettbd
推特过滤数据集TwitterFilteredDataset-kaggledatasettbd 数据来源:互联网公开数据 标签:社交媒体,推特,数据集,文本分析,自然语言处理,情感分析,机器学习,舆情分析 数据概述: 该数据集包含经过过滤的推特(Twitter)数据,旨在为文本分析和自然语言处理任务提供支持。主要特征如下:... -
维基百科表格问答数据集-thedevastator
维基百科表格问答数据集-thedevastator 数据来源:互联网公开数据 标签:表格问答,自然语言处理,人工智能,数据科学,复杂问题,维基百科,半结构化数据 数据概述:... -
多选题数据集-肖恩MCQ-Shaun-shaunshibu
多选题数据集-肖恩MCQ-Shaun-shaunshibu 数据来源:互联网公开数据 标签:多选题,数据集,教育,考试,机器学习,自然语言处理,文本分析,认知科学 数据概述: 该数据集包含来自肖恩(Shaun)的多选题数据,主要用于评估和分析多选题的生成,解答和评估过程。主要特征如下: 时间跨度: 数据记录的时间范围不明确,取决于原始数据的收集时间。... -
推特机器人检测数据集TwitterBotsDetectionDataset-alyalsayed
推特机器人检测数据集TwitterBotsDetectionDataset-alyalsayed 数据来源:互联网公开数据 标签:社交媒体,机器人检测,数据集,自然语言处理,机器学习,文本分析,人工智能,舆情分析 数据概述: 该数据集包含了来自推特平台的用户数据,旨在用于推特机器人(Twitter Bots)的检测与分析。主要特征如下:... -
机器学习与问答系统MLQA印地语预处理数据集MLQAHindiProcessedDataset-rhtsingh
机器学习与问答系统MLQA印地语预处理数据集MLQAHindiProcessedDataset-rhtsingh 数据来源:互联网公开数据 标签:机器学习,问答系统,印地语,数据集,自然语言处理,文本预处理,多语言处理,语言模型 数据概述: 该数据集包含来自机器学习与问答系统(MLQA)项目的印地语数据,记录了经过预处理的印地语文本内容。主要特征如下:... -
AlpacaGPT-4指令跟随推理数据集-2023-thedevastator
AlpacaGPT-4指令跟随推理数据集-2023-thedevastator 数据来源:互联网公开数据 标签:NLP,指令跟随,自然语言处理,机器学习,研究,教育,人工智能,科学,推理 数据概述:... -
中国互联网新闻文本情感分析数据集-2019年-asd336655
中国互联网新闻文本情感分析数据集-2019年-asd336655 数据来源:互联网公开数据 标签:新闻,情感分析,文本挖掘,自然语言处理,舆情分析,中文,社会,媒体 数据概述:... -
数据2020天池NLP中文文本分类竞赛数据集-jt120lz
2020天池NLP中文文本分类竞赛数据集-jt120lz 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,中文,NLP竞赛,情感分析,语义理解 数据概述: 该数据集来自2020年天池平台举办的NLP(自然语言处理)中文文本分类竞赛,记录了中文文本数据及其对应的类别标签。主要特征如下:... -
美国国家公共电台新闻数据集NPRNewsDataset-gauravduttakiit
美国国家公共电台新闻数据集NPRNewsDataset-gauravduttakiit 数据来源:互联网公开数据 标签:新闻数据,数据集,自然语言处理,文本分析,机器学习,新闻学,媒体研究,社会研究 数据概述:该数据集包含来自美国国家公共电台(NPR)的新闻数据,记录了NPR发布的新闻文章和广播节目的详细信息。主要特征如下:... -
Goodreads书籍信息数据集-ashishjangra27
Goodreads书籍信息数据集-ashishjangra27 数据来源:互联网公开数据 标签:书籍,阅读,数据集,文学,评论,评分,推荐系统,自然语言处理 数据概述: 该数据集包含来自Goodreads网站的书籍信息,记录了书籍的详细描述,用户评论,评分等数据。主要特征如下:... -
西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd
西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd 数据来源:互联网公开数据 标签:音乐,歌词,数据集,语言分析,自然语言处理,文化研究,机器学习,多语言 数据概述: 该数据集包含来自互联网公开渠道的西班牙语歌曲歌词数据,记录了多种西班牙语歌曲的歌词文本。主要特征如下:... -
电影评论情感分析数据集-英语电影评论-32万条-多维度标注
电影评论情感分析数据集-英语电影评论-32万条-多维度标注 数据来源:互联网公开数据 标签:电影评论,情感分析,文本数据,电影,评论,情感,自然语言处理,机器学习,英语,电影数据 数据概述:... -
电影问答与对话系统数据集RAGMovieContextDataset-vantanle71
电影问答与对话系统数据集RAGMovieContextDataset-vantanle71 数据来源:互联网公开数据 标签:电影,问答系统,数据集,自然语言处理,对话系统,信息检索,人工智能,机器学习 数据概述: 该数据集包含来自电影领域的对话和问答数据,记录了电影相关信息和用户提问的回答。主要特征如下:... -
印地语-英语截断语料库数据集Hindi-EnglishTruncatedCorpusDataset-kalyanitewari
印地语-英语截断语料库数据集Hindi-EnglishTruncatedCorpusDataset-kalyanitewari 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,双语语料,文本分析,计算机科学,多语言处理 数据概述:... -
欺诈邮件内容数据集FraudulentEmailBodiesDataset-azunre
欺诈邮件内容数据集FraudulentEmailBodiesDataset-azunre 数据来源:互联网公开数据 标签:网络安全,欺诈检测,数据集,文本分析,机器学习,自然语言处理,邮件安全,异常检测 数据概述: 该数据集包含来自公开来源的欺诈邮件内容数据,记录了各类欺诈邮件的文本信息。主要特征如下:... -
科技论文引用关系数据集TEC-Paper2-markgoadrich
科技论文引用关系数据集TEC-Paper2-markgoadrich 数据来源:互联网公开数据 标签:科技论文,引用关系,数据集,文献计量学,学术研究,自然语言处理,机器学习,知识图谱 数据概述: 该数据集包含来自TEC-Paper2项目的科技论文引用关系数据,记录了论文之间的引用和被引用关系。主要特征如下:...