-
泰卢固语图书数据集TeluguBooksDataset-vishnugandavarapu
泰卢固语图书数据集TeluguBooksDataset-vishnugandavarapu 数据来源:互联网公开数据 标签:泰卢固语,图书,数据集,语言学,文化研究,文本分析,机器学习,数字资源 数据概述: 该数据集包含来自互联网的泰卢固语图书数据,记录了泰卢固语文学作品的相关信息。主要特征如下: 时间跨度:数据记录的时间范围从19世纪至今。... -
商品标题文本数据集ProductTitleTextData-composto
商品标题文本数据集ProductTitleTextData-composto 数据来源:互联网公开数据 标签:商品标题, 文本数据, 商品识别, 文本分析, 巴西市场, 零售商品, 自然语言处理, 命名实体识别 数据概述: 该数据集包含来自巴西市场的商品标题文本,记录了各种商品的名称和对应的商品ID。主要特征如下:... -
公司信息行业分类数据集CompanyInformationIndustryClassification-kaleab1
公司信息行业分类数据集CompanyInformationIndustryClassification-kaleab1 数据来源:互联网公开数据 标签:公司信息, 行业分类, 商业数据, 企业分析, 市场调研, 数据挖掘, 机器学习, 文本分析 数据概述: 该数据集包含来自公开渠道的公司信息,记录了公司的基本属性及行业分类信息。主要特征如下:... -
阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal
阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal 数据来源:互联网公开数据 标签:阿拉伯语, 文本分析, 文本对比, 自然语言处理, 语言学, 语料库, 文本挖掘, 语义分析 数据概述: 该数据集包含来自不同来源的阿拉伯语文本,记录了用于文本对比分析的语料。主要特征如下:... -
葡萄酒品鉴笔记分析数据集WineTastingNotesAnalysis-statiana
葡萄酒品鉴笔记分析数据集WineTastingNotesAnalysis-statiana 数据来源:互联网公开数据 标签:葡萄酒, 品鉴笔记, 文本分析, 自然语言处理, 情感分析, 葡萄酒产区, 数据清洗, 机器学习 数据概述: 该数据集包含来自葡萄酒品鉴笔记的数据,记录了不同年份、不同葡萄酒的品鉴描述。主要特征如下:... -
代码笔记语言识别与排名数据集CodeNotebookLanguageIdentificationandRanking-kirderf
代码笔记语言识别与排名数据集CodeNotebookLanguageIdentificationandRanking-kirderf 数据来源:互联网公开数据 标签:代码笔记, 语言识别, 文本分析, 机器学习, 排名预测, 自然语言处理, 数据标注, 代码分析 数据概述:... -
亚马逊食品评论文本清洗数据集-bchltrng
亚马逊食品评论文本清洗数据集-bchltrng 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,亚马逊,食品评论,数据集,机器学习,评论数据 数据概述: 该数据集包含来自亚马逊网站的食品评论数据,主要用于自然语言处理和文本分析任务。主要特征如下: 时间跨度: 数据记录的时间跨度不明确,涵盖了亚马逊网站上的食品评论历史数据。 地理范围:... -
假新闻与真实新闻检测数据集FakeandRealNewsDetectionDataset-vivekrainaa
假新闻与真实新闻检测数据集FakeandRealNewsDetectionDataset-vivekrainaa 数据来源:互联网公开数据 标签:新闻检测,数据集,文本分析,机器学习,自然语言处理,信息传播,数据分析,深度学习 数据概述: 该数据集包含来自多个新闻来源的假新闻与真实新闻数据,记录了新闻文本及其标签(真假类别)。主要特征如下:... -
越南法律法规文本数据集-thinh4526
越南法律法规文本数据集-thinh4526 数据来源:互联网公开数据 标签:法律法规,文本分析,自然语言处理,越南,数据集,法律检索,文本挖掘,法规研究 数据概述: 该数据集包含来自越南政府官方网站及其他公开渠道的法律法规文本数据,记录了越南的法律法规、政府规章、决议等文件。主要特征如下: 时间跨度:数据记录的时间范围从20世纪90年代至今。... -
英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar
英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar 数据来源:互联网公开数据 标签:英印翻译,数据集,自然语言处理,机器翻译,语言学,人工智能,文本分析,语料库 数据概述: 该数据集包含来自Samanantar项目的英印翻译对照数据,记录了英文原文及其对应的印地文翻译。主要特征如下:... -
消费者金融投诉数据集CFPBComplaintsDataset-koushiktcs12
消费者金融投诉数据集CFPBComplaintsDataset-koushiktcs12 数据来源:互联网公开数据 标签:消费者金融,投诉数据,数据集,自然语言处理,文本分析,金融科技,客户服务,风险管理 数据概述: 该数据集包含来自美国消费者金融保护局(CFPB)的消费者投诉数据,记录了消费者对各种金融产品和服务的投诉信息。主要特征如下:... -
有毒评论清理数据集JigsawToxicCommentCleanData-harits
有毒评论清理数据集JigsawToxicCommentCleanData-harits 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,情感分析,垃圾信息,网络安全,数据清理 数据概述: 该数据集包含来自Jigsaw平台的有毒评论数据,记录了网络上具有攻击性、侮辱性或不当内容的评论信息。主要特征如下:... -
reddit比特币话题文本数据集RedditBitcoinTopicTextDataset-afterrain007
reddit比特币话题文本数据集RedditBitcoinTopicTextDataset-afterrain007 数据来源:互联网公开数据 标签:社交网络,比特币,文本分析,数据集,机器学习,自然语言处理,金融科技,数据挖掘 数据概述:... -
俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh
俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh 数据来源:互联网公开数据 标签:文本语料库, 俄语, 越南语, 文本分析, 自然语言处理, 语言学, 多语言, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语和越南语文本语料,主要用于语言学研究、自然语言处理模型的训练与评估。主要特征如下:... -
社交媒体用户行为模拟数据集SocialMediaUserBehaviorSimulationDataset-abhinavgangil
社交媒体用户行为模拟数据集SocialMediaUserBehaviorSimulationDataset-abhinavgangil 数据来源:互联网公开数据 标签:社交媒体, 用户行为, 文本分析, 内容分析, 情感分析, 品牌分析, 营销策略, 机器学习 数据概述:... -
图书ISBN信息抓取数据集-robinfaro13
图书ISBN信息抓取数据集-robinfaro13 数据来源:互联网公开数据 标签:图书,ISBN,数据集,网络爬虫,文本分析,图书信息,出版物,数据挖掘 数据概述: 该数据集包含了通过网络抓取获得的图书ISBN信息,记录了图书的基本信息,主要特征如下: 时间跨度:数据抓取时间集中在近期。 地理范围:数据主要来源于全球范围内的图书出版信息。... -
英语写作质量评估数据集EnglishWritingQualityAssessment-hasanbasriakcay
英语写作质量评估数据集EnglishWritingQualityAssessment-hasanbasriakcay 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 可读性分析, 语言模型, 机器学习, 文本特征, 写作质量 数据概述: 该数据集包含来自不同来源的英语写作文本,记录了用于评估英语写作质量的各项指标。主要特征如下:... -
社交媒体谣言检测数据集SocialMediaRumorDetectionDataset-mohamedhismail
社交媒体谣言检测数据集SocialMediaRumorDetectionDataset-mohamedhismail 数据来源:互联网公开数据 标签:谣言检测, 社交媒体, 文本分析, 舆情分析, 机器学习, 自然语言处理, 情感分析, Twitter 数据概述:... -
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,计算重用,语义理解,人工智能 数据概述: 该数据集包含来自词句银行(Word-Sent... -
教育项目资助申请数据集EducationProjectFundingApplicationDataset-tejveerchauhan
教育项目资助申请数据集EducationProjectFundingApplicationDataset-tejveerchauhan 数据来源:互联网公开数据 标签:教育, 项目资助, 文本分析, 机器学习, 自然语言处理, 教师, 学校, 数据挖掘 数据概述:...