-
假新闻与真实新闻检测数据集FakeandRealNewsDetectionDataset-vivekrainaa
假新闻与真实新闻检测数据集FakeandRealNewsDetectionDataset-vivekrainaa 数据来源:互联网公开数据 标签:新闻检测,数据集,文本分析,机器学习,自然语言处理,信息传播,数据分析,深度学习 数据概述: 该数据集包含来自多个新闻来源的假新闻与真实新闻数据,记录了新闻文本及其标签(真假类别)。主要特征如下:... -
越南法律法规文本数据集-thinh4526
越南法律法规文本数据集-thinh4526 数据来源:互联网公开数据 标签:法律法规,文本分析,自然语言处理,越南,数据集,法律检索,文本挖掘,法规研究 数据概述: 该数据集包含来自越南政府官方网站及其他公开渠道的法律法规文本数据,记录了越南的法律法规、政府规章、决议等文件。主要特征如下: 时间跨度:数据记录的时间范围从20世纪90年代至今。... -
英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar
英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar 数据来源:互联网公开数据 标签:英印翻译,数据集,自然语言处理,机器翻译,语言学,人工智能,文本分析,语料库 数据概述: 该数据集包含来自Samanantar项目的英印翻译对照数据,记录了英文原文及其对应的印地文翻译。主要特征如下:... -
消费者金融投诉数据集CFPBComplaintsDataset-koushiktcs12
消费者金融投诉数据集CFPBComplaintsDataset-koushiktcs12 数据来源:互联网公开数据 标签:消费者金融,投诉数据,数据集,自然语言处理,文本分析,金融科技,客户服务,风险管理 数据概述: 该数据集包含来自美国消费者金融保护局(CFPB)的消费者投诉数据,记录了消费者对各种金融产品和服务的投诉信息。主要特征如下:... -
有毒评论清理数据集JigsawToxicCommentCleanData-harits
有毒评论清理数据集JigsawToxicCommentCleanData-harits 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,情感分析,垃圾信息,网络安全,数据清理 数据概述: 该数据集包含来自Jigsaw平台的有毒评论数据,记录了网络上具有攻击性、侮辱性或不当内容的评论信息。主要特征如下:... -
reddit比特币话题文本数据集RedditBitcoinTopicTextDataset-afterrain007
reddit比特币话题文本数据集RedditBitcoinTopicTextDataset-afterrain007 数据来源:互联网公开数据 标签:社交网络,比特币,文本分析,数据集,机器学习,自然语言处理,金融科技,数据挖掘 数据概述:... -
俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh
俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh 数据来源:互联网公开数据 标签:文本语料库, 俄语, 越南语, 文本分析, 自然语言处理, 语言学, 多语言, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语和越南语文本语料,主要用于语言学研究、自然语言处理模型的训练与评估。主要特征如下:... -
社交媒体用户行为模拟数据集SocialMediaUserBehaviorSimulationDataset-abhinavgangil
社交媒体用户行为模拟数据集SocialMediaUserBehaviorSimulationDataset-abhinavgangil 数据来源:互联网公开数据 标签:社交媒体, 用户行为, 文本分析, 内容分析, 情感分析, 品牌分析, 营销策略, 机器学习 数据概述:... -
图书ISBN信息抓取数据集-robinfaro13
图书ISBN信息抓取数据集-robinfaro13 数据来源:互联网公开数据 标签:图书,ISBN,数据集,网络爬虫,文本分析,图书信息,出版物,数据挖掘 数据概述: 该数据集包含了通过网络抓取获得的图书ISBN信息,记录了图书的基本信息,主要特征如下: 时间跨度:数据抓取时间集中在近期。 地理范围:数据主要来源于全球范围内的图书出版信息。... -
英语写作质量评估数据集EnglishWritingQualityAssessment-hasanbasriakcay
英语写作质量评估数据集EnglishWritingQualityAssessment-hasanbasriakcay 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 可读性分析, 语言模型, 机器学习, 文本特征, 写作质量 数据概述: 该数据集包含来自不同来源的英语写作文本,记录了用于评估英语写作质量的各项指标。主要特征如下:... -
社交媒体谣言检测数据集SocialMediaRumorDetectionDataset-mohamedhismail
社交媒体谣言检测数据集SocialMediaRumorDetectionDataset-mohamedhismail 数据来源:互联网公开数据 标签:谣言检测, 社交媒体, 文本分析, 舆情分析, 机器学习, 自然语言处理, 情感分析, Twitter 数据概述:... -
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,计算重用,语义理解,人工智能 数据概述: 该数据集包含来自词句银行(Word-Sent... -
教育项目资助申请数据集EducationProjectFundingApplicationDataset-tejveerchauhan
教育项目资助申请数据集EducationProjectFundingApplicationDataset-tejveerchauhan 数据来源:互联网公开数据 标签:教育, 项目资助, 文本分析, 机器学习, 自然语言处理, 教师, 学校, 数据挖掘 数据概述:... -
印度地区新冠疫情与社交媒体互动数据集IndiaCOVID-19-SocialMediaInteractions-b19cse065
印度地区新冠疫情与社交媒体互动数据集IndiaCOVID-19-SocialMediaInteractions-b19cse065 数据来源:互联网公开数据 标签:新冠疫情, 社交媒体, 疫情传播, 文本分析, 地理位置, 情感分析, 疫情影响, 数据挖掘 数据概述:... -
文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan
文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan 数据来源:互联网公开数据 标签:文本嵌入,深度学习,自然语言处理,数据集,机器学习,人工智能,文本分析,语言模型 数据概述:该数据集包含来自CLIP(Contrastive Language-Image Pre-... -
电影信息与票房分析数据集MovieInformationandBoxOfficeAnalysis-dilekcay
电影信息与票房分析数据集MovieInformationandBoxOfficeAnalysis-dilekcay 数据来源:互联网公开数据 标签:电影, 票房, 电影信息, 电影数据, 电影产业, 市场分析, 文本分析, 机器学习 数据概述: 该数据集包含来自The Movie Database (TMDb)... -
网络小说阅读评价数据集NovelReadingEvaluationDataset-geriatricvibes
网络小说阅读评价数据集NovelReadingEvaluationDataset-geriatricvibes 数据来源:互联网公开数据 标签:网络小说, 阅读评价, 用户行为, 评分数据, 文本分析, 推荐系统, 数据挖掘, 情感分析 数据概述: 该数据集包含来自网络小说更新网站的数据,记录了用户对网络小说的阅读评价行为。主要特征如下:... -
乱码文本清洗分析数据集GarbledTextCleaningAnalysisDataset-kaushal2896
乱码文本清洗分析数据集GarbledTextCleaningAnalysisDataset-kaushal2896 数据来源:互联网公开数据 标签:文本清洗, 数据预处理, 文本分析, 字符编码, 数据质量, 异常检测, 机器学习, 自然语言处理 数据概述: 该数据集包含经过预处理的文本数据,记录了经过编码处理后产生的乱码文本。主要特征如下:... -
食谱菜谱与用户评价数据集RecipeandUserRatingDataset-jhondare01
食谱菜谱与用户评价数据集RecipeandUserRatingDataset-jhondare01 数据来源:互联网公开数据 标签:食谱, 菜谱, 用户评价, 烹饪, 菜品, 推荐系统, 文本分析, 机器学习 数据概述: 该数据集包含来自烹饪网站或相关平台的数据,记录了食谱菜谱信息以及用户对菜谱的评价。主要特征如下:... -
社交媒体用户行为分析数据集SocialMediaUserBehaviorAnalysis-akashkadali345678
社交媒体用户行为分析数据集SocialMediaUserBehaviorAnalysis-akashkadali345678 数据来源:互联网公开数据 标签:社交媒体, 用户行为, 垃圾信息检测, 文本分析, 机器学习, 用户画像, 社交网络, 数据挖掘 数据概述:...