-
问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy
问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy 数据来源:互联网公开数据 标签:问题分类,数据集,自然语言处理,文本分析,机器学习,信息检索,人工智能,语义理解 数据概述: 该数据集包含来自多个领域的公开问题数据,记录了各类问题的文本内容及其对应的分类标签。主要特征如下:... -
知识问答上下文数据集KnowledgeQuestionAnsweringContextDataset-defdet
知识问答上下文数据集KnowledgeQuestionAnsweringContextDataset-defdet 数据来源:互联网公开数据 标签:知识问答, 自然语言处理, 上下文理解, 文本分析, 多选题, 机器学习, 数据集, 语料库 数据概述:... -
政治新闻文本分析数据集PoliticalNewsTextAnalysis-ammarthabet
政治新闻文本分析数据集PoliticalNewsTextAnalysis-ammarthabet 数据来源:互联网公开数据 标签:政治新闻, 文本分析, 新闻分类, 舆情分析, 自然语言处理, 文本挖掘, 时事评论, 机器学习 数据概述: 该数据集包含来自互联网的政治新闻文章,记录了标题、正文、主题和日期等信息。主要特征如下:... -
语言工具Python2-8数据集LanguageTool-Python2-8Dataset-mbrosseau
语言工具Python2-8数据集LanguageTool-Python2-8Dataset-mbrosseau 数据来源:互联网公开数据 标签:自然语言处理,Python,语言工具,数据集,语法检查,文本分析,机器学习,软件开发 数据概述: 该数据集包含LanguageTool Python... -
印度新闻头条数据集IndiaNewsHeadlinesDataset-khairullahhamsafar
印度新闻头条数据集IndiaNewsHeadlinesDataset-khairullahhamsafar 数据来源:互联网公开数据 标签:新闻,头条,印度,自然语言处理,文本分析,情感分析,时事,数据集 数据概述: 该数据集包含了来自印度新闻网站的头条新闻标题,记录了印度新闻媒体报道的时事新闻。主要特征如下:... -
学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal
学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal 数据来源:互联网公开数据 标签:论文作文,数据集,自然语言处理,机器学习,文本分析,教育研究,学术写作,语言模型 数据概述:该数据集包含来自不同学生和大型语言模型(LLM)生成的论文作文,记录了作文的文本内容和评估分数。主要特征如下:... -
客户服务会话风险评估数据集CustomerServiceSessionRiskAssessmentDataset-dengmx
客户服务会话风险评估数据集CustomerServiceSessionRiskAssessmentDataset-dengmx 数据来源:互联网公开数据 标签:客户服务, 风险评估, 文本分析, 对话分析, 机器学习, 情感分析, 风险预测, 数据标注 数据概述:... -
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-szmao777
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-szmao777 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分析, 自然语言处理, 情感分类, 用户行为, 数据挖掘, 情绪识别 数据概述: 该数据集包含来自社交媒体平台的用户文本数据,记录了用户发布的内容及其对应的情感极性。主要特征如下:... -
乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa
乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,机器学习,内容挖掘,新闻研究,语言技术 数据概述: 该数据集包含来自乌克兰的新闻文章数据,记录了乌克兰新闻媒体发布的各类新闻内容。主要特征如下:... -
英国经济战略政策文件词频数据集-adammuhtar
英国经济战略政策文件词频数据集-adammuhtar 数据来源:互联网公开数据 标签:经济政策,文本分析,词频统计,英国,政策文件,自然语言处理,文本挖掘,经济学,数据集 数据概述: 该数据集包含来自英国政府经济战略政策文件的词频统计数据,旨在分析和研究英国经济政策的语言特征和主题分布。主要特征如下:... -
光学字符识别OCR图像文本提取数据集OpticalCharacterRecognitionTextExtractionDataset-anexperiencedidiot
光学字符识别OCR图像文本提取数据集OpticalCharacterRecognitionTextExtractionDataset-anexperiencedidiot 数据来源:互联网公开数据 标签:OCR, 图像识别, 文本提取, 计算机视觉, 深度学习, 数据标注, 文本分析, 多角度文本 数据概述:... -
澳大利亚新闻标题文本分析数据集AustralianNewsHeadlinesTextAnalysis-navidkhezrian
澳大利亚新闻标题文本分析数据集AustralianNewsHeadlinesTextAnalysis-navidkhezrian 数据来源:互联网公开数据 标签:新闻标题, 文本分析, 自然语言处理, 时间序列分析, 舆情分析, 澳大利亚, 数据挖掘, 情感分析 数据概述: 该数据集包含来自澳大利亚广播公司(ABC... -
安然公司电子邮件数据集EnronEmailDataset-napisarchuk
安然公司电子邮件数据集EnronEmailDataset-napisarchuk 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,金融,腐败,社交网络,信息检索 数据概述: 该数据集包含来自美国安然公司(Enron Corporation)员工的电子邮件,记录了该公司在破产前的大量内部通信。主要特征如下:... -
洋葱新闻与真实新闻分类数据集Onion-NotOnionNewsClassificationDataset-liberoliber
洋葱新闻与真实新闻分类数据集Onion-NotOnionNewsClassificationDataset-liberoliber 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,新闻媒体,虚假信息,信息传播 数据概述: 该数据集包含来自“洋葱新闻”(The... -
文本数据统计与向量化数据集TrainDataCountVectorDataset-omagrawal
文本数据统计与向量化数据集TrainDataCountVectorDataset-omagrawal 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,词频统计,向量化,机器学习,数据挖掘,文本分类 数据概述: 该数据集包含经过预处理的文本数据,用于文本数据的统计分析和向量化表示。主要特征如下: 时间跨度:... -
提交转换数据集SubmissionTransformerDataset-godgod3
提交转换数据集SubmissionTransformerDataset-godgod3 数据来源:互联网公开数据 标签:提交数据,数据转换,数据集,自然语言处理,机器学习,文本分析,编程,软件开发 数据概述:该数据集来自开源项目,记录了代码提交信息及其转换后的文本描述,适用于自然语言处理和机器学习任务。主要特征如下:... -
俄罗斯1985年至2023年4万首歌曲数据集-anastasiadrozhzhina
俄罗斯1985年至2023年4万首歌曲数据集-anastasiadrozhzhina 数据来源:互联网公开数据 标签:音乐,歌词,数据集,文本分析,自然语言处理,文化研究,音乐历史,社会学 数据概述: 该数据集包含来自俄罗斯的1985年至2023年的4万首歌曲的歌词数据,记录了这些歌曲的详细信息。主要特征如下:... -
高精度文本分类测试数据集HiBETestTextDataset-siddharthyadavv
高精度文本分类测试数据集HiBETestTextDataset-siddharthyadavv 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,数据挖掘,人工智能,文本分析,机器阅读 数据概述: 该数据集包含来自多个领域的文本数据,专注于高精度文本分类和机器学习模型的评估。主要特征如下:... -
垃圾文本与有意义指令数据集Gibberishvs-MeaningfulPromptwithLabelsDataset-circuitovertime
垃圾文本与有意义指令数据集Gibberishvs-MeaningfulPromptwithLabelsDataset-circuitovertime 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,文本分析,人工智能,语言模型,数据标注 数据概述:... -
文本嵌入向量相似度分析数据集TextEmbeddingVectorSimilarityAnalysis-erkhatkalkabay
文本嵌入向量相似度分析数据集TextEmbeddingVectorSimilarityAnalysis-erkhatkalkabay 数据来源:互联网公开数据 标签:文本分析, 语义相似度, 嵌入向量, 机器学习, 自然语言处理, 向量空间, 数据挖掘, 预训练模型 数据概述:...