-
性别分类数据集GenderClassifierDataset-kaamyasarda
性别分类数据集GenderClassifierDataset-kaamyasarda 数据来源:互联网公开数据 标签:性别分类,数据分析,机器学习,文本挖掘,自然语言处理,数据集,分类算法,模式识别 数据概述: 该数据集包含来自社交媒体平台(如Twitter)的用户数据,记录了用户的性别分类信息及相关特征。主要特征如下:... -
新冠疫情期间齐夫定律验证数据集Zipf-sLawTestDataset-COVID-19-salemrezzag
新冠疫情期间齐夫定律验证数据集Zipf-sLawTestDataset-COVID-19-salemrezzag 数据来源:互联网公开数据 标签:新冠疫情,齐夫定律,文本分析,数据集,自然语言处理,流行病学,数据科学,词频分析 数据概述: 该数据集包含从新冠疫情期间收集的文本数据,用于验证齐夫定律在疫情语境下的适用性。主要特征如下:... -
说服力与影响力分析数据集Persuade-2-0Dataset-garried
说服力与影响力分析数据集Persuade-2-0Dataset-garried 数据来源:互联网公开数据 标签:说服力,影响力,数据集,自然语言处理,文本分析,情感分析,机器学习,心理学 数据概述: 该数据集包含来自Persuade-2.0项目的数据,记录了不同情境下的说服性文本及其效果评估。主要特征如下:... -
医疗人工智能大模型数据集MedicaAILLMDatasetandModel-emirhanai
医疗人工智能大模型数据集MedicaAILLMDatasetandModel-emirhanai 数据来源:互联网公开数据 标签:医疗人工智能,大模型,数据集,机器学习,自然语言处理,文本分析,健康医疗,医疗研究 数据概述:该数据集为MedicaAI项目的一部分,主要记录了医疗相关文本数据,适用于医疗人工智能大模型的训练和应用。主要特征如下:... -
地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan
地名识别数据集PlaceNameIdentificationDataset-vishvveshnagappan 数据来源:互联网公开数据 标签:地理信息,地名识别,数据集,自然语言处理,机器学习,文本分析,数据挖掘,信息提取 数据概述: 该数据集包含来自网络文本和地理信息资源的地名数据,记录了不同文本中的地名及其位置信息。主要特征如下: 时间跨度:... -
尼泊尔语命名实体识别数据集NepaliNERDataset-rajanghimire
尼泊尔语命名实体识别数据集NepaliNERDataset-rajanghimire 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,数据集,尼泊尔语,机器学习,文本分析,序列标注,语言技术 数据概述: 该数据集包含尼泊尔语的命名实体识别数据,记录了尼泊尔语文本中的人名,地名,组织名等实体信息。主要特征如下:... -
数据7年自发性行为数据集BE-SPONT7YearsDataset-wooyakob
7年自发性行为数据集BE-SPONT7YearsDataset-wooyakob 数据来源:互联网公开数据 标签:行为分析,数据集,社交媒体,用户行为,情感分析,自然语言处理,机器学习,时间序列 数据概述: 该数据集包含了来自社交媒体平台的用户自发性行为数据,记录了用户在七年内的各种行为,例如帖子,评论,点赞,分享等。主要特征如下: 时间跨度:... -
巴勒莫餐厅评价数据集RestaurantsPalermoPonderadoDataset-puedefallar
巴勒莫餐厅评价数据集RestaurantsPalermoPonderadoDataset-puedefallar 数据来源:互联网公开数据 标签:餐厅,评价,数据集,意大利,餐饮业,情感分析,自然语言处理,美食 数据概述: 该数据集包含了来自意大利巴勒莫地区的餐厅评价数据,记录了用户对当地餐厅的详细评价信息。主要特征如下:... -
两步Wave-Net语音合成数据集-garganany
两步Wave-Net语音合成数据集-garganany 数据来源:互联网公开数据 标签:语音合成,深度学习,数据集,音频处理,人工智能,自然语言处理,WaveNet,语音生成 数据概述: 该数据集包含用于训练两步 WaveNet 模型的数据,主要用于语音合成任务。主要特征如下: 时间跨度:数据记录了音频的录制时间,具体时间跨度取决于原始数据。... -
隐含仇恨言论排名数据集ImplicitHateSpeechwithRankingDataset-devayani14
隐含仇恨言论排名数据集ImplicitHateSpeechwithRankingDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,情感分析,机器学习,自然语言处理,社会研究,内容审核 数据概述:该数据集包含来自多个在线平台的文本数据,记录了带有隐含仇恨言论的言论内容及其对应的排名。主要特征如下:... -
电影相似度分析数据集MoviesSimilarityDataset-devendra45
电影相似度分析数据集MoviesSimilarityDataset-devendra45 数据来源:互联网公开数据 标签:电影分析,相似度计算,数据集,推荐系统,机器学习,数据挖掘,娱乐产业,自然语言处理 数据概述: 该数据集包含来自多个电影数据库的电影信息,记录了电影之间的相似度关系及相关特征。主要特征如下:... -
LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881
LaTeX文档分析数据集LaTeXDocumentAnalysisDataset-sai1881 数据来源:互联网公开数据 标签:LaTeX, 文档分析, 数据集, 语法结构, 文学研究, 自然语言处理, 计算机科学, 学术资源 数据概述:... -
用户评论情感分析数据集CommentsScoreDataset-esgintn
用户评论情感分析数据集CommentsScoreDataset-esgintn 数据来源:互联网公开数据 标签:评论分析,情感分析,数据集,自然语言处理,机器学习,文本挖掘,用户行为,社交媒体 数据概述:该数据集包含来自各种来源的用户评论数据,记录了用户对特定主题或产品的评论及其对应的情感评分。主要特征如下:... -
RedditWSB论坛帖子数据集RedditWSBPostsDataset-dataranch
RedditWSB论坛帖子数据集RedditWSBPostsDataset-dataranch 数据来源:互联网公开数据 标签:社交媒体,金融,股票,投资,文本分析,自然语言处理,舆情分析,机器学习 数据概述: 该数据集包含来自 Reddit 网站 WallStreetBets(WSB)子版块的帖子数据,记录了用户在 WSB... -
俄英虚假新闻翻译数据集RUS-ENFakeNewsTranslationDataset-nimbus32
俄英虚假新闻翻译数据集RUS-ENFakeNewsTranslationDataset-nimbus32 数据来源:互联网公开数据 标签:虚假新闻,翻译,数据集,俄语,英语,自然语言处理,机器翻译,文本分析 数据概述: 该数据集包含了俄语(RUS)到英语(EN)的虚假新闻翻译数据,旨在促进虚假信息检测和跨语言分析的研究。主要特征如下:... -
电影评论情感分析数据集IMDBReviewSentimentAnalysisDataset-princegupta19998
电影评论情感分析数据集IMDBReviewSentimentAnalysisDataset-princegupta19998 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,电影评论,人工智能,大数据 数据概述:... -
合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy
合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,语音识别,多语言,人工智能,数据分析 数据概述:... -
数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666
2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源:互联网公开数据 标签:自然语言处理,检索增强生成,数据集,文本生成,信息检索,机器学习,人工智能,CCF 数据概述: 该数据集由中国计算机学会(CCF)提供,旨在促进检索增强生成(RAG)技术的研究与发展。主要特征如下: 时间跨度:数据记录的时间范围为2024年。... -
改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07
改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,深度学习,文本生成,视觉理解,人工智能 数据概述: 该数据集包含经过改进的图像字幕数据,记录了与图像内容相匹配的,经过优化的描述性文本。主要特征如下:... -
数学竞赛解题API数据集MathematicsContestSolvingviaAPIDataset-sumansuhag
数学竞赛解题API数据集MathematicsContestSolvingviaAPIDataset-sumansuhag 数据来源:互联网公开数据 标签:数学竞赛,解题,API,数据集,人工智能,自然语言处理,数学建模,编程 数据概述: 该数据集包含通过API解决数学竞赛问题的相关数据,记录了使用API解答数学竞赛试题的过程和结果。主要特征如下:...