-
僧伽罗语对话数据集SinhalaDialogueDataset-preminda
僧伽罗语对话数据集SinhalaDialogueDataset-preminda 数据来源:互联网公开数据 标签:僧伽罗语, 文本数据, 对话语料, 语言学, 自然语言处理, 文本分析, 语料库, 机器学习 数据概述: 该数据集包含来自公开渠道的僧伽罗语对话文本,记录了不同场景下的对话内容。主要特征如下:... -
Reddit评论数据集RedditCommentsDataset-abianchi
Reddit评论数据集RedditCommentsDataset-abianchi 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,自然语言处理,情感分析,机器学习,社区研究,大数据 数据概述: 该数据集包含来自Reddit平台的用户评论数据,记录了用户在各类话题下的互动和讨论。主要特征如下:... -
医学文本数据去噪与词嵌入数据集MedicalTextDataDenoisingandWordEmbedding-vobachkhoi
医学文本数据去噪与词嵌入数据集MedicalTextDataDenoisingandWordEmbedding-vobachkhoi 数据来源:互联网公开数据 标签:医学文本, 自然语言处理, 词嵌入, 数据去噪, 文本分析, 预训练模型, 临床记录, 数据清洗 数据概述:... -
电影信息与影评分析数据集MovieInformationandReviewAnalysis-tarunm561
电影信息与影评分析数据集MovieInformationandReviewAnalysis-tarunm561 数据来源:互联网公开数据 标签:电影, 影评, 文本分析, 情感分析, 电影推荐, 数据挖掘, 机器学习, 电影票房 数据概述:... -
流媒体影视内容分析数据集StreamingMediaContentAnalysisDataset-edaniel1093
流媒体影视内容分析数据集StreamingMediaContentAnalysisDataset-edaniel1093 数据来源:互联网公开数据 标签:流媒体, 影视作品, 内容分析, 电影, 电视剧, 数据挖掘, 平台对比, 文本分析 数据概述: 该数据集包含来自亚马逊Prime... -
孟加拉语语料库2022数据集-srjony
孟加拉语语料库2022数据集-srjony 数据来源:互联网公开数据 标签:孟加拉语,语料库,自然语言处理,文本分析,机器学习,语言学,学术研究,数据集 数据概述:该数据集包含来自多个来源的孟加拉语文本数据,记录了广泛的孟加拉语语料,适用于自然语言处理、文本分析等任务。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2022年。... -
图片链接混淆与去混淆数据集ImageURLObfuscationandDe-obfuscationDataset-savimaan
图片链接混淆与去混淆数据集ImageURLObfuscationandDe-obfuscationDataset-savimaan 数据来源:互联网公开数据 标签:图片链接, 混淆, 去混淆, 数据集, 图像处理, 网络安全, 机器学习, 文本分析 数据概述:... -
文本毒性预测提交模板数据集TextToxicityPredictionSubmissionTemplate-vedanttolia
文本毒性预测提交模板数据集TextToxicityPredictionSubmissionTemplate-vedanttolia 数据来源:互联网公开数据 标签:文本分析, 毒性检测, 机器学习, 自然语言处理, 情感分析, 文本分类, 数据提交, 竞赛数据 数据概述:... -
东南亚电商平台商品信息数据集ShopeeIETDataset-khotijahs1
东南亚电商平台商品信息数据集ShopeeIETDataset-khotijahs1 数据来源:互联网公开数据 标签:电商,商品信息,数据集,文本分析,图像识别,自然语言处理,机器学习,东南亚 数据概述: 该数据集包含来自东南亚电商平台Shopee的商品信息,记录了平台上各种商品的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段。... -
文本语义相似度计算嵌入向量数据集TextSemanticSimilarityEmbeddingVectors-erkhatkalkabay
文本语义相似度计算嵌入向量数据集TextSemanticSimilarityEmbeddingVectors-erkhatkalkabay 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 向量表示, 机器学习, 自然语言处理, 数据分析, 文本分析, 预训练模型 数据概述:... -
新闻真伪识别文本数据集NewsCredibilityIdentificationTextDataset-sohaila103
新闻真伪识别文本数据集NewsCredibilityIdentificationTextDataset-sohaila103 数据来源:互联网公开数据 标签:新闻, 文本分类, 虚假新闻, 自然语言处理, 机器学习, 文本分析, 新闻标题, 作者 数据概述:... -
人工智能主题推特文本数据分析数据集ArtificialIntelligenceTopicTweetsTextDataAnalysisDataset-njoudals
人工智能主题推特文本数据分析数据集ArtificialIntelligenceTopicTweetsTextDataAnalysisDataset-njoudals 数据来源:互联网公开数据 标签:人工智能, 推特数据, 文本分析, 自然语言处理, 社交媒体, 数据挖掘, 情感分析, 话题追踪 数据概述:... -
电影票房与内容分析数据集MovieRevenueandContentAnalysisDataset-kishoreramb
电影票房与内容分析数据集MovieRevenueandContentAnalysisDataset-kishoreramb 数据来源:互联网公开数据 标签:电影, 票房, 电影内容, 电影产业, 票房预测, 文本分析, 数据挖掘, 机器学习 数据概述:... -
Spotify歌曲歌词数据集SpotifySongLyricsDataset-razaali10
Spotify歌曲歌词数据集SpotifySongLyricsDataset-razaali10 数据来源:互联网公开数据 标签:歌词, 音乐, Spotify, 文本分析, 自然语言处理, 情感分析, 音乐流派, ABBA 数据概述: 该数据集包含来自Spotify平台的歌曲歌词数据,记录了歌曲的艺术家、歌曲名称、歌曲链接以及歌词文本。主要特征如下:... -
图书推荐系统用户行为与图书信息数据集BookRecommendationSystemUserBehaviorandBookInformationDatas...
图书推荐系统用户行为与图书信息数据集BookRecommendationSystemUserBehaviorandBookInformationDataset-meghdeb2xx5 数据来源:互联网公开数据 标签:图书推荐, 用户行为, 图书信息, 协同过滤, 数据挖掘, 自然语言处理, 文本分析, 机器学习 数据概述:... -
工程领域推特文本数据集-melodious8
工程领域推特文本数据集-melodious8 数据来源:互联网公开数据 标签:工程,推特,社交媒体,文本分析,自然语言处理,情感分析,机器学习,信息检索 数据概述: 该数据集包含来自推特平台的工程领域相关推文,记录了工程师、研究人员和相关行业从业者在社交媒体上的公开交流信息。主要特征如下:... -
自然语言问答上下文数据集NaturalQuestionsSmall-thedrcat
自然语言问答上下文数据集NaturalQuestionsSmall-thedrcat 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, 文本理解, 信息检索, 机器阅读, 语料库, 数据集, 文本分析 数据概述: 该数据集包含来自互联网的自然语言问答数据,记录了用户提出的问题、相关的上下文段落以及答案。主要特征如下:... -
电影票房与用户评价数据集MovieBoxOffice-UserRatingDataset-azmary
电影票房与用户评价数据集MovieBoxOffice-UserRatingDataset-azmary 数据来源:互联网公开数据 标签:电影, 票房, 评价, 电影分析, 文本分析, 推荐系统, 数据挖掘, 电影产业 数据概述:... -
写作评估实验论文数据集EssayAssessmentExperimentData-sunilsoftkaggle
写作评估实验论文数据集EssayAssessmentExperimentData-sunilsoftkaggle 数据来源:互联网公开数据 标签:写作评估, 论文写作, 文本分析, 评分预测, 教育评估, 自然语言处理, 文本挖掘, 机器学习 数据概述:... -
商品信息描述文本数据集ProductInformationDescriptionTextDataset-its4iris
商品信息描述文本数据集ProductInformationDescriptionTextDataset-its4iris 数据来源:互联网公开数据 标签:商品描述, 产品信息, 文本分析, 商品分类, 自然语言处理, 电子商务, 市场营销, 数据清洗 数据概述:...