-
国家橄榄球联盟NFL测试脚本数据集-narender129
国家橄榄球联盟NFL测试脚本数据集-narender129 数据来源:互联网公开数据 标签:橄榄球,NFL,测试脚本,数据分析,运动,机器学习,自然语言处理,体育 数据概述:该数据集包含来自国家橄榄球联盟(NFL)的测试脚本数据,记录了橄榄球比赛中的各种测试脚本和相关信息。主要特征如下: 时间跨度:数据记录的时间范围为未知。... -
电商评论数据集电商评论数据集140000条-zeuss2k3
电商评论数据集电商评论数据集140000条-zeuss2k3 数据来源:互联网公开数据 标签:电商评论,数据集,自然语言处理,文本分析,情感分析,消费者行为,市场研究,用户反馈 数据概述: 该数据集包含140,000条来自电商平台的商品评论数据,记录了消费者对商品的评价和反馈信息。主要特征如下: 时间跨度: 数据记录的时间范围从2018年到2022年。... -
印度语文件数据集HindiLanguageFilesDataset-sherinkk
印度语文件数据集HindiLanguageFilesDataset-sherinkk 数据来源:互联网公开数据 标签:印度语,文本数据,数据集,自然语言处理,机器学习,语言研究,文本分析,多语言 数据概述: 该数据集包含来自印度语(Hindi)环境下的各类文本文件,记录了印度语在不同场景下的使用情况。主要特征如下:... -
MBTI人格类型作者特征数据集MBTI作者特征数据集-arlene025
MBTI人格类型作者特征数据集MBTI作者特征数据集-arlene025 数据来源:互联网公开数据 标签:MBTI人格类型,作者特征,数据集,心理学研究,文本分析,自然语言处理,机器学习,数据分析 数据概述: 该数据集包含来自互联网公开资源的文本数据,记录了不同MBTI人格类型的作者特征,适用于心理学研究、文本分析和机器学习等任务。主要特征如下:... -
LSTM模型预训练数据文件数据集-cristianozhuo
LSTM模型预训练数据文件数据集-cristianozhuo 数据来源:互联网公开数据 标签:深度学习,自然语言处理,LSTM,预训练,文本数据,数据集,序列建模,机器学习 数据概述: 该数据集包含用于LSTM(长短期记忆网络)模型预训练的文本数据,旨在为深度学习模型提供基础的语言知识。主要特征如下:... -
代码单元排序预测数据集CodeCellOrderingPredictionDataset-dragonzhang
代码单元排序预测数据集CodeCellOrderingPredictionDataset-dragonzhang 数据来源:互联网公开数据 标签:代码单元, 排序预测, 机器学习, 自然语言处理, 代码分析, 数据集, Kaggle, Python 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-dhruva786
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-dhruva786 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 电影评论, 情感极性, 机器学习, 数据标注, 情感识别 数据概述: 该数据集包含来自互联网的电影评论数据,记录了电影评论文本及其对应的情感极性标签。主要特征如下:... -
开放助手对话数据集OASST1-SL-valterh
开放助手对话数据集OASST1-SL-valterh 数据来源:互联网公开数据 标签:对话数据,自然语言处理,机器学习,情感分析,文本生成,对话系统,开源,多语言 数据概述: 该数据集包含来自开放助手(Open Assistant)项目的对话数据,主要记录了用户与AI助手的多轮对话内容。主要特征如下:... -
印度新闻摘要文章数据集IndiaNewsSummaryArticleDataset-umangjjw
印度新闻摘要文章数据集IndiaNewsSummaryArticleDataset-umangjjw 数据来源:互联网公开数据 标签:新闻摘要, 印度新闻, 文本摘要, 自然语言处理, 文本分析, 机器翻译, 语料库, 印度文化 数据概述: 该数据集包含来自印度新闻网站的文章及其摘要,旨在为自然语言处理和文本分析任务提供支持。主要特征如下:... -
深度学习实践教学案例数据集DeepLearningPracticeTeachingCaseDatasets-shi520chao
深度学习实践教学案例数据集DeepLearningPracticeTeachingCaseDatasets-shi520chao 数据来源:互联网公开数据 标签:深度学习, 教学案例, 计算机视觉, 自然语言处理, 机器学习, 模型训练, 实践项目, MXNet, PaddlePaddle 数据概述:... -
文本摘要生成训练数据集TextSummarizationTrainingData-mridul3301
文本摘要生成训练数据集TextSummarizationTrainingData-mridul3301 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 摘要生成, 数据集, 文本处理, 语料库 数据概述: 该数据集包含用于文本摘要生成的训练数据,记录了原文与其对应的摘要文本。主要特征如下:... -
招聘信息薪资预测数据集JobPostingSalaryPrediction-annatrofy
招聘信息薪资预测数据集JobPostingSalaryPrediction-annatrofy 数据来源:互联网公开数据 标签:招聘信息, 薪资预测, 文本分析, 机器学习, 自然语言处理, 职位描述, 地理位置, 合同类型 数据概述:... -
英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn
英国标点符号光学字符识别数据集PunctuationUKOCRDataset-thnhhunhtn 数据来源:互联网公开数据 标签:光学字符识别,文本处理,数据集,自然语言处理,机器学习,英语语言,标点符号,计算机视觉 数据概述: 该数据集专注于英国英语中的标点符号光学字符识别(OCR),记录了各种文档中的标点符号及其识别结果。主要特征如下:... -
餐饮评论分析数据集Yelp本地生活服务Dataset-tisage
餐饮评论分析数据集Yelp本地生活服务Dataset-tisage 数据来源:互联网公开数据 标签:餐饮评论,数据集,自然语言处理,用户反馈,机器学习,商业分析,市场研究,用户体验 数据概述: 该数据集来自 Yelp 网站,主要记录了餐饮行业的用户评论数据,适用于评论分析、情感分析等任务。主要特征如下:... -
美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777
美国国家档案馆政府文件清理数据集GADatasetClean-zhihaozhao777 数据来源:互联网公开数据 标签:政府文件,数据集,数据清洗,文本分析,自然语言处理,档案管理,信息检索,历史研究 数据概述: 该数据集包含来自美国国家档案馆(GA)的政府文件数据,记录了已清理的政府文件文本内容。主要特征如下:... -
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 社交媒体, 语言学, 情感分析, 语料库 数据概述:... -
社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab
社交媒体有害言论检测数据集ToxicMoreBlendDataset-teksab 数据来源:互联网公开数据 标签:文本分析,有害言论,社交媒体,自然语言处理,机器学习,情感分析,文本分类,数据挖掘 数据概述: 该数据集包含了来自社交媒体平台的文本数据,用于有害言论检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,具体取决于原始数据来源。... -
社交媒体情绪分析推文数据集SocialMediaSentimentAnalysisTweets-atharvpatawar
社交媒体情绪分析推文数据集SocialMediaSentimentAnalysisTweets-atharvpatawar 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 社交媒体, 推文, 自然语言处理, 情绪识别, 数据标注, 机器学习 数据概述: 该数据集包含来自Twitter的推文数据,记录了推文内容及其对应的情感极性。主要特征如下:... -
嵌入向量数据集EmbeddingsVectorsDataset-ahmedembedded
嵌入向量数据集EmbeddingsVectorsDataset-ahmedembedded 数据来源:互联网公开数据 标签:嵌入向量, 机器学习, 深度学习, 自然语言处理, 模型训练, 特征工程, 数据分析, 向量空间 数据概述: 该数据集包含预计算的嵌入向量,用于表示数据中的特征。主要特征如下: 时间跨度:数据未明确时间戳,可视为静态嵌入向量集合。... -
新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064
新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064 数据来源:互联网公开数据 标签:文本摘要, 新闻摘要, 自然语言处理, 文本生成, 机器翻译, 深度学习, 语料库, 摘要模型 数据概述:...