-
美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777
美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777 数据来源:互联网公开数据 标签:政府文件,数据集,数据清洗,文本分析,自然语言处理,档案管理,信息检索,历史研究 数据概述: 该数据集包含来自美国国家档案馆(GA)的政府文件数据,记录了已清理的政府文件文本内容。主要特征如下:... -
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 社交媒体, 语言学, 情感分析, 语料库 数据概述:... -
社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab
社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab 数据来源:互联网公开数据 标签:文本分析,有害言论,社交媒体,自然语言处理,机器学习,情感分析,文本分类,数据挖掘 数据概述: 该数据集包含了来自社交媒体平台的文本数据,用于有害言论检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,具体取决于原始数据来源。... -
社交媒体情绪分析推文数据集SocialMediaSentimentAnalysisTweets-atharvpatawar
社交媒体情绪分析推文数据集SocialMediaSentimentAnalysisTweets-atharvpatawar 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 社交媒体, 推文, 自然语言处理, 情绪识别, 数据标注, 机器学习 数据概述: 该数据集包含来自Twitter的推文数据,记录了推文内容及其对应的情感极性。主要特征如下:... -
嵌入向量数据集EmbeddingsVectorsDataset-ahmedembedded
嵌入向量数据集EmbeddingsVectorsDataset-ahmedembedded 数据来源:互联网公开数据 标签:嵌入向量, 机器学习, 深度学习, 自然语言处理, 模型训练, 特征工程, 数据分析, 向量空间 数据概述: 该数据集包含预计算的嵌入向量,用于表示数据中的特征。主要特征如下: 时间跨度:数据未明确时间戳,可视为静态嵌入向量集合。... -
新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064
新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064 数据来源:互联网公开数据 标签:文本摘要, 新闻摘要, 自然语言处理, 文本生成, 机器翻译, 深度学习, 语料库, 摘要模型 数据概述:... -
内容优化平台用户行为数据集-terrychanorg
内容优化平台用户行为数据集-terrychanorg 数据来源:互联网公开数据 标签:用户行为,内容推荐,点击率预测,机器学习,自然语言处理,数据分析,广告推荐,个性化 数据概述: 该数据集包含来自内容优化平台的用户行为数据,记录了用户与平台内容的交互情况。主要特征如下: 时间跨度:数据记录的时间范围为2023年至今。... -
问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy
问题映射与分类数据集QuestionMappingandClassificationDataset-ammarmasselhy 数据来源:互联网公开数据 标签:问题分类,数据集,自然语言处理,文本分析,机器学习,信息检索,人工智能,语义理解 数据概述: 该数据集包含来自多个领域的公开问题数据,记录了各类问题的文本内容及其对应的分类标签。主要特征如下:... -
教育领域学生写作文本分类数据集EducationStudentWritingTextClassificationDataset-rjraac2018
教育领域学生写作文本分类数据集EducationStudentWritingTextClassificationDataset-rjraac2018 数据来源:互联网公开数据 标签:文本分类, 学生写作, 教育, 自然语言处理, 情感分析, 写作质量, 语料库, 机器学习 数据概述:... -
新闻文本分类数据集NewsTextClassificationDataset-aryanverma07
新闻文本分类数据集NewsTextClassificationDataset-aryanverma07 数据来源:互联网公开数据 标签:文本分类, 新闻摘要, 机器学习, 自然语言处理, 深度学习, 情感分析, 语料库, 预训练模型 数据概述: 该数据集包含来自新闻报道的文本摘要,记录了不同类别的新闻内容,用于文本分类任务。主要特征如下:... -
知识问答上下文数据集KnowledgeQuestionAnsweringContextDataset-defdet
知识问答上下文数据集KnowledgeQuestionAnsweringContextDataset-defdet 数据来源:互联网公开数据 标签:知识问答, 自然语言处理, 上下文理解, 文本分析, 多选题, 机器学习, 数据集, 语料库 数据概述:... -
政治新闻文本分析数据集PoliticalNewsTextAnalysis-ammarthabet
政治新闻文本分析数据集PoliticalNewsTextAnalysis-ammarthabet 数据来源:互联网公开数据 标签:政治新闻, 文本分析, 新闻分类, 舆情分析, 自然语言处理, 文本挖掘, 时事评论, 机器学习 数据概述: 该数据集包含来自互联网的政治新闻文章,记录了标题、正文、主题和日期等信息。主要特征如下:... -
语言工具Python2-8数据集LanguageTool-Python2-8Dataset-mbrosseau
语言工具Python2-8数据集LanguageTool-Python2-8Dataset-mbrosseau 数据来源:互联网公开数据 标签:自然语言处理,Python,语言工具,数据集,语法检查,文本分析,机器学习,软件开发 数据概述: 该数据集包含LanguageTool Python... -
亚马逊电器产品评论数据集AmazonProductReviews-AppliancesDataset-rexhark
亚马逊电器产品评论数据集AmazonProductReviews-AppliancesDataset-rexhark 数据来源:互联网公开数据 标签:电子商务,产品评论,数据集,自然语言处理,机器学习,消费者行为,情感分析,零售业 数据概述:该数据集包含来自亚马逊平台的电器类产品用户评论数据,记录了消费者对电器产品的评价内容和相关评分。主要特征如下:... -
印度新闻头条数据集IndiaNewsHeadlinesDataset-khairullahhamsafar
印度新闻头条数据集IndiaNewsHeadlinesDataset-khairullahhamsafar 数据来源:互联网公开数据 标签:新闻,头条,印度,自然语言处理,文本分析,情感分析,时事,数据集 数据概述: 该数据集包含了来自印度新闻网站的头条新闻标题,记录了印度新闻媒体报道的时事新闻。主要特征如下:... -
情感识别与语音增强数据集CREMA-DOpenSmileAllEmo16kHz20dBTrimThenNRDataset-ehteshamashraf
情感识别与语音增强数据集CREMA-DOpenSmileAllEmo16kHz20dBTrimThenNRDataset-ehteshamashraf 数据来源:互联网公开数据 标签:情感识别,语音处理,数据集,语音增强,机器学习,情感分析,音频处理,自然语言处理 数据概述: 该数据集包含来自CREMA-... -
学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal
学生和LLM论文作文数据集StudentandLLMEssaysDataset-alvaromendizabal 数据来源:互联网公开数据 标签:论文作文,数据集,自然语言处理,机器学习,文本分析,教育研究,学术写作,语言模型 数据概述:该数据集包含来自不同学生和大型语言模型(LLM)生成的论文作文,记录了作文的文本内容和评估分数。主要特征如下:... -
新冠疫情社交媒体情感分析数据集COVID-19SocialMediaSentimentAnalysisDataset-wangbiao92
新冠疫情社交媒体情感分析数据集COVID-19SocialMediaSentimentAnalysisDataset-wangbiao92 数据来源:互联网公开数据 标签:新冠疫情, 情感分析, 社交媒体, 微博, 文本分类, 情感标注, 自然语言处理, 疫情传播 数据概述:... -
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-szmao777
社交媒体用户情感分析数据集SocialMediaUserSentimentAnalysis-szmao777 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分析, 自然语言处理, 情感分类, 用户行为, 数据挖掘, 情绪识别 数据概述: 该数据集包含来自社交媒体平台的用户文本数据,记录了用户发布的内容及其对应的情感极性。主要特征如下:... -
文本转述数据集TextParaphrasingDataset-soumyasangamjha
文本转述数据集TextParaphrasingDataset-soumyasangamjha 数据来源:互联网公开数据 标签:文本转述, 自然语言处理, 机器翻译, 文本生成, 语义理解, 数据增强, 深度学习, 语料库 数据概述: 该数据集包含来自多个来源的文本转述对,记录了原始文本及其对应的转述版本,旨在用于训练和评估文本转述模型。主要特征如下:...