-
语言检测数据集2010-2020年文本语言识别数据集-mogazeyalmogazey
语言检测数据集2010-2020年文本语言识别数据集-mogazeyalmogazey 数据来源:互联网公开数据 标签:语言检测,文本分析,数据集,自然语言处理,机器学习,多语言识别,文本分类,人工智能 数据概述: 该数据集包含来自不同来源的文本数据,记录了多种语言的文本样本,适用于语言检测和识别任务。主要特征如下:... -
Kaggle写作数据集KaggleWrite-upDataDataset-ehsaasdhand
Kaggle写作数据集KaggleWrite-upDataDataset-ehsaasdhand 数据来源:互联网公开数据 标签:文本数据,写作分析,数据集,自然语言处理,机器学习,教育技术,语言研究,数据挖掘 数据概述: 该数据集包含来自Kaggle平台的用户写作数据,记录了用户在平台上提交的写作内容。主要特征如下:... -
主题模型反馈数据集-hirohigashi
主题模型反馈数据集-hirohigashi 数据来源:互联网公开数据 标签:主题模型,文本分析,数据集,自然语言处理,情感分析,用户反馈,机器学习,数据挖掘 数据概述:该数据集包含了用户对产品的反馈信息,旨在用于主题模型的研究和应用。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于具体的数据来源。... -
推特情绪分析数据集TweetEmotionDataset-rakshitkhobragade
推特情绪分析数据集TweetEmotionDataset-rakshitkhobragade 数据来源:互联网公开数据 标签:情绪分析,社交媒体,数据集,文本挖掘,自然语言处理,机器学习,社会研究,情感识别 数据概述:该数据集包含来自推特的文本数据,记录了用户发布的推文及其对应的情绪标签。主要特征如下:... -
黑客新闻数据集HackerNewsDataset-keplaxo
黑客新闻数据集HackerNewsDataset-keplaxo 数据来源:互联网公开数据 标签:黑客新闻,数据集,技术社区,内容分析,机器学习,自然语言处理,社会网络分析,互联网研究 数据概述: 该数据集来自 Hacker News,记录了网站上的用户活动,文章,评论和其他相关信息。主要特征如下:... -
图像描述生成数据集ImageDescriptionGenerationDataset-shredharsssss
图像描述生成数据集ImageDescriptionGenerationDataset-shredharsssss 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像标注,人工智能,文本生成 数据概述: 该数据集包含图像及其对应的文本描述,旨在促进图像描述生成任务的研究和应用。主要特征如下:... -
客户评论分析数据集-saivigneshmn
客户评论分析数据集-saivigneshmn 数据来源:互联网公开数据 标签:客户评论,文本分析,情感分析,自然语言处理,市场调研,用户反馈,产品评价,社交媒体 数据概述: 该数据集包含了客户对产品或服务的评论数据。主要特征如下: 时间跨度:数据记录的时间范围不明确。 地理范围:数据来源于多个地区,具体来源不明确。... -
大型语言模型科学考试与推理过程数据集LLMScienceExamandRationaleDataset-serjhenrique
大型语言模型科学考试与推理过程数据集LLMScienceExamandRationaleDataset-serjhenrique 数据来源:互联网公开数据 标签:人工智能,语言模型,科学考试,推理过程,数据集,机器学习,教育技术,自然语言处理 数据概述:... -
名字分类与增强数据集2023-ivancanepa
名字分类与增强数据集2023-ivancanepa 数据来源:互联网公开数据 标签:名字分类, 数据集, 增强学习, 机器学习, 自然语言处理, 人工智能, 数据增强, 人名识别 数据概述: 该数据集包含了一系列用于名字分类和增强的任务相关数据,主要记录了不同类别名字的信息,适用于名字分类,数据增强等任务。主要特征如下:... -
虚假新闻检测数据集FakeNewsDetectionDataset-wbq030607
虚假新闻检测数据集FakeNewsDetectionDataset-wbq030607 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,文本分类,机器学习,信息传播,媒体研究,自然语言处理 数据概述: 该数据集包含来自互联网公开渠道的虚假新闻数据,记录了新闻标题,内容,发布时间,来源等信息。主要特征如下:... -
新冠疫情问答数据集CovidSQUAD-lachonman2
新冠疫情问答数据集CovidSQUAD-lachonman2 数据来源:互联网公开数据 标签:新冠疫情,问答数据,自然语言处理,信息检索,机器学习,健康科学,公众健康,数据集 数据概述:该数据集包含来自多个来源的新冠疫情相关问答数据,记录了与新冠疫情相关的常见问题及其详细解答。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
机器学习论文语义分析数据集MachineLearningPapersSemanticScholarDataset-patrickgomes
机器学习论文语义分析数据集MachineLearningPapersSemanticScholarDataset-patrickgomes 数据来源:互联网公开数据 标签:机器学习,论文分析,数据集,语义分析,学术研究,自然语言处理,文献挖掘,知识图谱 数据概述: 该数据集包含来自语义学者(Semantic... -
命名实体识别自定义数据集NamedEntityRecognitionCustomDataset-pranjan02
命名实体识别自定义数据集NamedEntityRecognitionCustomDataset-pranjan02 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本分析,机器学习,深度学习,文本挖掘,人工智能 数据概述:该数据集包含来自多个来源的自定义文本数据,用于训练和评估命名实体识别(NER)模型。主要特征如下:... -
高质量提示词数据集PolishedPromptsDataset-dmitriyab
高质量提示词数据集PolishedPromptsDataset-dmitriyab 数据来源:互联网公开数据 标签:自然语言处理,提示词工程,数据集,机器学习,文本生成,人工智能,语言模型,提示优化 数据概述: 该数据集包含经过精心设计和优化的提示词(prompts),用于自然语言处理任务,特别是大语言模型的文本生成。主要特征如下:... -
HuggingFaceGGUF模型数据集-igalbronshtein
HuggingFaceGGUF模型数据集-igalbronshtein 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,GGUF,量化,推理,模型优化,Hugging Face,AI 数据概述: 该数据集包含了Hugging Face社区提供的GGUF模型文件,这些模型文件是经过量化处理的,旨在优化模型在不同硬件上的推理性能。主要特征如下:... -
华为Mate60Pro京东用户评论数据集-haoxuanzhong
华为Mate60Pro京东用户评论数据集-haoxuanzhong 数据来源:互联网公开数据 标签:华为手机,Mate 60 Pro,用户评论,京东,产品评价,情感分析,自然语言处理,市场调研 数据概述: 该数据集包含了来自京东平台的用户对华为Mate 60 Pro手机的评论数据,记录了用户对该手机的各种评价和反馈。主要特征如下:... -
奥斯曼土耳其语通用依存关系数据集OttomanTurkishUniversalDependenciesDataset-emirkaanozdemr
奥斯曼土耳其语通用依存关系数据集OttomanTurkishUniversalDependenciesDataset-emirkaanozdemr 数据来源:互联网公开数据 标签:自然语言处理,土耳其语,依存分析,数据集,语言学,NLP,文本分析,历史语言 数据概述: 该数据集包含奥斯曼土耳其语的文本数据,并标注了通用依存关系。主要特征如下:... -
代码混合情感分析数据集CodeMixedSentimentAnalysisDataset-aswin037
代码混合情感分析数据集CodeMixedSentimentAnalysisDataset-aswin037 数据来源:互联网公开数据 标签:情感分析,代码混合,自然语言处理,社交媒体,数据集,机器学习,文本分析,跨语言研究 数据概述: 该数据集包含来自社交媒体平台的代码混合文本数据,记录了不同语言和代码混合的文本及其对应的情感标签。主要特征如下:... -
电影类型分类数据集MovieGenreClassificationDataset-lamiasaiyara
电影类型分类数据集MovieGenreClassificationDataset-lamiasaiyara 数据来源:互联网公开数据 标签:电影,类型分类,自然语言处理,文本分析,机器学习,情感分析,电影推荐,数据集 数据概述: 该数据集包含电影的相关信息,用于电影类型的自动分类任务。主要特征如下: 时间跨度:数据记录的时间范围覆盖了不同年代的电影。... -
电话通话记录全文本数据集TranscriptsAllCallsDataset-prathamagarwal1302
电话通话记录全文本数据集TranscriptsAllCallsDataset-prathamagarwal1302 数据来源:互联网公开数据 标签:通信记录,数据集,文本分析,自然语言处理,机器学习,语音识别,客服分析,数据挖掘 数据概述: 该数据集包含来自多个电话通信记录的文本转录内容,记录了电话通话的详细对话信息。主要特征如下:...