-
教育领域学生写作质量评估数据集EducationStudentWritingQualityAssessment-jay12332
教育领域学生写作质量评估数据集EducationStudentWritingQualityAssessment-jay12332 数据来源:互联网公开数据 标签:文本分析, 写作评估, 机器学习, 自然语言处理, 教育, 情感分析, 文本分类, 语言模型 数据概述:... -
电影推荐系统数据集MovieRecommendationSystemDataset-playgroundteen
电影推荐系统数据集MovieRecommendationSystemDataset-playgroundteen 数据来源:互联网公开数据 标签:电影推荐, 用户行为, 评分数据, 电影标签, 文本分析, 机器学习, 数据挖掘, 关联分析 数据概述: 该数据集包含来自电影推荐系统的数据,记录了用户对电影的评分、标签、以及电影的基本信息。主要特征如下:... -
文本摘要新闻文章数据集TextSummarizationNewsArticles-amitdoke
文本摘要新闻文章数据集TextSummarizationNewsArticles-amitdoke 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 新闻文章, 深度学习, 文本分析, 数据集构建, 机器翻译, 语料库 数据概述: 该数据集包含来自新闻文章的文本内容及其对应的摘要,旨在用于文本摘要任务的训练和评估。主要特征如下:... -
Airbnb房源价格预测训练测试数据集AirbnbListingPricePredictionTraining-TestingData-viveks716
Airbnb房源价格预测训练测试数据集AirbnbListingPricePredictionTraining-TestingData-viveks716 数据来源:互联网公开数据 标签:Airbnb, 房源, 价格预测, 机器学习, 房产, 文本分析, 住宿, 城市 数据概述:... -
大型新闻语料库数据集GigawordCorpusDataset-arngowda
大型新闻语料库数据集GigawordCorpusDataset-arngowda 数据来源:互联网公开数据 标签:新闻语料,数据集,自然语言处理,文本分析,机器学习,语言模型,人工智能,信息提取 数据概述: 该数据集包含来自全球各大新闻机构的新闻报道文本,记录了海量新闻文章的全文内容。主要特征如下:... -
学术论文作者与摘要分析数据集AcademicPaperAuthorandAbstractAnalysisDataset-siddy123
学术论文作者与摘要分析数据集AcademicPaperAuthorandAbstractAnalysisDataset-siddy123 数据来源:互联网公开数据 标签:学术论文, 作者信息, 论文摘要, 自然语言处理, 文本分析, 学术研究, 数据挖掘, 论文检索 数据概述:... -
自然语言处理电影剧本命名实体识别数据集NaturalLanguageProcessingMovieScriptNamedEntityRecognition...
自然语言处理电影剧本命名实体识别数据集NaturalLanguageProcessingMovieScriptNamedEntityRecognitionDataset-amardura 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 电影剧本, 文本分析, 语料库, 文本标注, 机器学习, 电影行业 数据概述:... -
酒店评论与地理位置数据集HotelReview-LocationDataset-nagasudhans
酒店评论与地理位置数据集HotelReview-LocationDataset-nagasudhans 数据来源:互联网公开数据 标签:酒店评论,地理位置,文本分析,情感分析,数据集,旅游,推荐系统,自然语言处理 数据概述: 该数据集包含来自多个来源的酒店评论数据,记录了用户对酒店的评价以及酒店的地理位置信息。主要特征如下:... -
Reddit问答社区帖子分析数据集RedditAskRedditPostsAnalysis-camerinfigueroa
Reddit问答社区帖子分析数据集RedditAskRedditPostsAnalysis-camerinfigueroa 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 内容挖掘, 情感分析, 舆情分析, 话题趋势, 数据抓取, 自然语言处理 数据概述:... -
商品成分信息文本分析数据集ProductIngredientTextAnalysis-vashalavenugopal75
商品成分信息文本分析数据集ProductIngredientTextAnalysis-vashalavenugopal75 数据来源:互联网公开数据 标签:商品成分, 文本分析, 数据清洗, 机器学习, 自然语言处理, 成分提取, 文本分类, 数据标注 数据概述: 该数据集包含来自产品说明信息的数据,记录了商品的成分描述文本。主要特征如下:... -
印地语文本重复检测数据集Paraphrasedetection-hindiDataset-quicklearner
印地语文本重复检测数据集Paraphrasedetection-hindiDataset-quicklearner 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,重复检测,语言技术,印地语,文本相似度 数据概述: 该数据集包含印地语文本的重复检测数据,记录了印地语文本中的重复或改写文本对。主要特征如下:... -
人类与大型语言模型LLM文本交叉对比数据集-mohamedlotfy50
人类与大型语言模型LLM文本交叉对比数据集-mohamedlotfy50 数据来源:互联网公开数据 标签:文本分析,大型语言模型,人类写作,数据集,自然语言处理,对比分析,机器学习,文本生成 数据概述: 该数据集包含人类创作的文本与大型语言模型生成的文本的对比数据,旨在研究人类写作风格与LLM生成文本的差异。主要特征如下:... -
讽刺识别全球数据集SarcasmGlobalDataset-nardinehanfi
讽刺识别全球数据集SarcasmGlobalDataset-nardinehanfi 数据来源:互联网公开数据 标签:讽刺识别,数据集,自然语言处理,机器学习,文本分析,社交媒体分析,语言学,情感计算 数据概述: 该数据集来自全球多个社交媒体平台的文本数据,主要用于讽刺识别的研究和应用。主要特征如下: 时间跨度:... -
自然语言处理与话题建模数据集NLPTopicModellingDataset-hj5992
自然语言处理与话题建模数据集NLPTopicModellingDataset-hj5992 数据来源:互联网公开数据 标签:自然语言处理,话题建模,数据集,文本分析,机器学习,文本挖掘,语义分析,信息提取 数据概述: 该数据集包含自然语言处理领域的话题建模数据,记录了文本内容及其对应的话题标签。主要特征如下:... -
Reddit新闻帖子数据集RedditNewsPostsDataset-lowerlight
Reddit新闻帖子数据集RedditNewsPostsDataset-lowerlight 数据来源:互联网公开数据 标签:社交媒体,新闻,文本分析,自然语言处理,数据集,情感分析,机器学习,舆情分析 数据概述: 该数据集包含来自Reddit平台r/news子版块的帖子数据,记录了用户发布的新闻帖子的详细信息。主要特征如下:... -
Transformer模型嵌入与偏移分割数据集-chaudharypriyanshu
Transformer模型嵌入与偏移分割数据集-chaudharypriyanshu 数据来源:互联网公开数据 标签:自然语言处理,数据集,Transformer,词嵌入,偏移量,分割,文本分析,深度学习 数据概述: 该数据集包含用于训练和评估Transformer模型,特别是关注词嵌入、偏移量计算和序列分割的数据。主要特征如下:... -
数据2020年20-000条查询预处理数据集20kQueriesPreprocessedData2020-ictworld
2020年20-000条查询预处理数据集20kQueriesPreprocessedData2020-ictworld 数据来源:互联网公开数据 标签:查询数据,数据预处理,数据集,自然语言处理,搜索引擎,文本分析,机器学习,信息检索 数据概述:... -
越南新闻文章数据集VNExpressArticlesDataset-trnnhtminh
越南新闻文章数据集VNExpressArticlesDataset-trnnhtminh 数据来源:互联网公开数据 标签:新闻,文章,数据集,自然语言处理,文本分析,机器学习,媒体研究,越南语 数据概述: 该数据集包含来自越南最大新闻网站之一——越南新闻(VNExpress)的文章数据,记录了该网站发布的新闻文章的详细信息。主要特征如下:... -
双向长短期记忆网络模型数据集NewBiLSTMDataDataset-daniabizarahmad
双向长短期记忆网络模型数据集NewBiLSTMDataDataset-daniabizarahmad 数据来源:互联网公开数据 标签:双向长短期记忆网络,数据集,机器学习,自然语言处理,文本分析,时间序列,深度学习,人工智能 数据概述:... -
英国广播公司BBC新闻文本分类数据集GBRNew200TrialDataset-fischcatcher
英国广播公司BBC新闻文本分类数据集GBRNew200TrialDataset-fischcatcher 数据来源:互联网公开数据 标签:新闻分类,文本分析,数据集,机器学习,自然语言处理,模式识别,分类算法,数据挖掘 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文本数据,记录了200篇新闻文章的文本内容和分类标签。主要特征如下:...