-
MBTI人格类型作者特征数据集MBTI作者特征数据集-arlene025
MBTI人格类型作者特征数据集MBTI作者特征数据集-arlene025 数据来源:互联网公开数据 标签:MBTI人格类型,作者特征,数据集,心理学研究,文本分析,自然语言处理,机器学习,数据分析 数据概述: 该数据集包含来自互联网公开资源的文本数据,记录了不同MBTI人格类型的作者特征,适用于心理学研究、文本分析和机器学习等任务。主要特征如下:... -
印度新闻摘要文章数据集IndiaNewsSummaryArticleDataset-umangjjw
印度新闻摘要文章数据集IndiaNewsSummaryArticleDataset-umangjjw 数据来源:互联网公开数据 标签:新闻摘要, 印度新闻, 文本摘要, 自然语言处理, 文本分析, 机器翻译, 语料库, 印度文化 数据概述: 该数据集包含来自印度新闻网站的文章及其摘要,旨在为自然语言处理和文本分析任务提供支持。主要特征如下:... -
招聘信息薪资预测数据集JobPostingSalaryPrediction-annatrofy
招聘信息薪资预测数据集JobPostingSalaryPrediction-annatrofy 数据来源:互联网公开数据 标签:招聘信息, 薪资预测, 文本分析, 机器学习, 自然语言处理, 职位描述, 地理位置, 合同类型 数据概述:... -
美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777
美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777 数据来源:互联网公开数据 标签:政府文件,数据集,数据清洗,文本分析,自然语言处理,档案管理,信息检索,历史研究 数据概述: 该数据集包含来自美国国家档案馆(GA)的政府文件数据,记录了已清理的政府文件文本内容。主要特征如下:... -
新冠疫情新闻主题分析数据集COVID-19NewsTopicAnalysis-tirikford
新冠疫情新闻主题分析数据集COVID-19NewsTopicAnalysis-tirikford 数据来源:互联网公开数据 标签:新冠疫情, 文本分析, 主题模型, LDA, 新闻文章, 疫情传播, 舆情分析, 数据可视化 数据概述: 该数据集包含来自新闻媒体关于新冠疫情的报道文章,记录了文章内容及其主题分布。主要特征如下:... -
社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab
社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab 数据来源:互联网公开数据 标签:文本分析,有害言论,社交媒体,自然语言处理,机器学习,情感分析,文本分类,数据挖掘 数据概述: 该数据集包含了来自社交媒体平台的文本数据,用于有害言论检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,具体取决于原始数据来源。... -
问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy
问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy 数据来源:互联网公开数据 标签:问题分类,数据集,自然语言处理,文本分析,机器学习,信息检索,人工智能,语义理解 数据概述: 该数据集包含来自多个领域的公开问题数据,记录了各类问题的文本内容及其对应的分类标签。主要特征如下:... -
知识问答上下文数据集KnowledgeQuestionAnsweringContextDataset-defdet
知识问答上下文数据集KnowledgeQuestionAnsweringContextDataset-defdet 数据来源:互联网公开数据 标签:知识问答, 自然语言处理, 上下文理解, 文本分析, 多选题, 机器学习, 数据集, 语料库 数据概述:... -
政治新闻文本分析数据集PoliticalNewsTextAnalysis-ammarthabet
政治新闻文本分析数据集PoliticalNewsTextAnalysis-ammarthabet 数据来源:互联网公开数据 标签:政治新闻, 文本分析, 新闻分类, 舆情分析, 自然语言处理, 文本挖掘, 时事评论, 机器学习 数据概述: 该数据集包含来自互联网的政治新闻文章,记录了标题、正文、主题和日期等信息。主要特征如下:... -
语言工具Python2-8数据集LanguageTool-Python2-8Dataset-mbrosseau
语言工具Python2-8数据集LanguageTool-Python2-8Dataset-mbrosseau 数据来源:互联网公开数据 标签:自然语言处理,Python,语言工具,数据集,语法检查,文本分析,机器学习,软件开发 数据概述: 该数据集包含LanguageTool Python... -
印度新闻头条数据集IndiaNewsHeadlinesDataset-khairullahhamsafar
印度新闻头条数据集IndiaNewsHeadlinesDataset-khairullahhamsafar 数据来源:互联网公开数据 标签:新闻,头条,印度,自然语言处理,文本分析,情感分析,时事,数据集 数据概述: 该数据集包含了来自印度新闻网站的头条新闻标题,记录了印度新闻媒体报道的时事新闻。主要特征如下:... -
学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal
学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal 数据来源:互联网公开数据 标签:论文作文,数据集,自然语言处理,机器学习,文本分析,教育研究,学术写作,语言模型 数据概述:该数据集包含来自不同学生和大型语言模型(LLM)生成的论文作文,记录了作文的文本内容和评估分数。主要特征如下:... -
客户服务会话风险评估数据集CustomerServiceSessionRiskAssessmentDataset-dengmx
客户服务会话风险评估数据集CustomerServiceSessionRiskAssessmentDataset-dengmx 数据来源:互联网公开数据 标签:客户服务, 风险评估, 文本分析, 对话分析, 机器学习, 情感分析, 风险预测, 数据标注 数据概述:... -
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-szmao777
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-szmao777 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分析, 自然语言处理, 情感分类, 用户行为, 数据挖掘, 情绪识别 数据概述: 该数据集包含来自社交媒体平台的用户文本数据,记录了用户发布的内容及其对应的情感极性。主要特征如下:... -
乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa
乌克兰新闻文章数据集UkrainianNewsArticlesDataset-nikitakirpa 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,机器学习,内容挖掘,新闻研究,语言技术 数据概述: 该数据集包含来自乌克兰的新闻文章数据,记录了乌克兰新闻媒体发布的各类新闻内容。主要特征如下:... -
英国经济战略政策文件词频数据集-adammuhtar
英国经济战略政策文件词频数据集-adammuhtar 数据来源:互联网公开数据 标签:经济政策,文本分析,词频统计,英国,政策文件,自然语言处理,文本挖掘,经济学,数据集 数据概述: 该数据集包含来自英国政府经济战略政策文件的词频统计数据,旨在分析和研究英国经济政策的语言特征和主题分布。主要特征如下:... -
光学字符识别OCR图像文本提取数据集OpticalCharacterRecognitionTextExtractionDataset-anexperiencedidiot
光学字符识别OCR图像文本提取数据集OpticalCharacterRecognitionTextExtractionDataset-anexperiencedidiot 数据来源:互联网公开数据 标签:OCR, 图像识别, 文本提取, 计算机视觉, 深度学习, 数据标注, 文本分析, 多角度文本 数据概述:... -
澳大利亚新闻标题文本分析数据集AustralianNewsHeadlinesTextAnalysis-navidkhezrian
澳大利亚新闻标题文本分析数据集AustralianNewsHeadlinesTextAnalysis-navidkhezrian 数据来源:互联网公开数据 标签:新闻标题, 文本分析, 自然语言处理, 时间序列分析, 舆情分析, 澳大利亚, 数据挖掘, 情感分析 数据概述: 该数据集包含来自澳大利亚广播公司(ABC... -
安然公司电子邮件数据集EnronEmailDataset-napisarchuk
安然公司电子邮件数据集EnronEmailDataset-napisarchuk 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,金融,腐败,社交网络,信息检索 数据概述: 该数据集包含来自美国安然公司(Enron Corporation)员工的电子邮件,记录了该公司在破产前的大量内部通信。主要特征如下:... -
洋葱新闻与真实新闻分类数据集Onion-NotOnionNewsClassificationDataset-liberoliber
洋葱新闻与真实新闻分类数据集Onion-NotOnionNewsClassificationDataset-liberoliber 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,新闻媒体,虚假信息,信息传播 数据概述: 该数据集包含来自“洋葱新闻”(The...