-
新冠疫情期间推特数据分析数据集COVID-19TwitterDataAnalysisDataset-tejaswini336
新冠疫情期间推特数据分析数据集COVID-19TwitterDataAnalysisDataset-tejaswini336 数据来源:互联网公开数据 标签:新冠疫情,推特数据,社交媒体,文本分析,情感分析,疫情传播,数据挖掘,自然语言处理 数据概述:... -
电商产品信息链接数据集-samksoon
电商产品信息链接数据集-samksoon 数据来源:互联网公开数据 标签:电商,产品信息,数据集,链接分析,网络爬虫,文本分析,数据挖掘,市场研究 数据概述: 该数据集包含了来自电商平台的产品信息链接,记录了各种产品的详细信息。主要特征如下: 时间跨度: 数据记录的时间范围,随数据源更新而变化。 地理范围: 数据覆盖的区域,主要为电商平台所涉及的地区。... -
自然语言处理与Python编程结合数据集NLPwithSpaCyandPythonDataset-flaviagg
自然语言处理与Python编程结合数据集NLPwithSpaCyandPythonDataset-flaviagg 数据来源:互联网公开数据 标签:自然语言处理,SpaCy,Python编程,数据集,文本分析,机器学习,语言模型,计算语言学 数据概述:... -
外部数据有害评论数据集ExternalDataToxicCommentsDataset-roshanvelpula
外部数据有害评论数据集ExternalDataToxicCommentsDataset-roshanvelpula 数据来源:互联网公开数据 标签:数据集,文本分析,情感分析,自然语言处理,机器学习,网络安全,数据挖掘,社交媒体 数据概述: 该数据集包含来自外部来源的有害评论数据,记录了网络平台上的评论内容及其标签。主要特征如下:... -
中国人民大学文本聚类数据集RUCTextClusteringDataset-spiritwalk
中国人民大学文本聚类数据集RUCTextClusteringDataset-spiritwalk 数据来源:互联网公开数据 标签:文本分析,数据集,聚类算法,自然语言处理,机器学习,文本分类,信息检索,数据挖掘 数据概述: 该数据集由中国人民大学提供,专注于文本数据的聚类分析。主要特征如下: 时间跨度:数据记录的时间范围未明确说明,推测为近年数据。... -
法文与英文平行语料数据集French-EnglishParallelCorpusDataset-mayankkalbande9
法文与英文平行语料数据集French-EnglishParallelCorpusDataset-mayankkalbande9 数据来源:互联网公开数据 标签:语言翻译,平行语料,数据集,自然语言处理,机器学习,双语研究,文本分析,人工智能 数据概述: 该数据集包含法文与英文的平行语料,记录了两种语言之间的对应翻译文本。主要特征如下:... -
Spacy自然语言处理研究数据集-dsfelix
Spacy自然语言处理研究数据集-dsfelix 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,Spacy,语言模型,文本标注,机器学习,NLP 数据概述: 该数据集包含了用于Spacy自然语言处理研究的多个数据集,涵盖了广泛的NLP任务。主要特征如下: 时间跨度:... -
真实翻译数据集RealTranslatedDataset-tihsrahly
真实翻译数据集RealTranslatedDataset-tihsrahly 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,文本分析,机器学习,自然语言处理,多语言,人工智能 数据概述: 该数据集包含来自真实翻译项目的文本数据,记录了多种语言之间的翻译对。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能跨越多个时间段。... -
情感分析数据集SentimentAnalysisDataset-serkanp
情感分析数据集SentimentAnalysisDataset-serkanp 数据来源:互联网公开数据 标签:情感分析,文本分析,自然语言处理,数据集,机器学习,情感分类,文本情感,NLP 数据概述: 该数据集包含用于情感分析任务的文本数据,主要记录了文本内容及其对应的情感标签。主要特征如下:... -
俄罗斯乌克兰战争2022年4月-5月推文数据集Russia-UkraineWarFilteredTweetsDataset2022April-May-pr...
俄罗斯乌克兰战争2022年4月-5月推文数据集Russia-UkraineWarFilteredTweetsDataset2022April-May-prosenjitchatterjee 数据来源:互联网公开数据 标签:战争,推特,社交媒体,数据集,文本分析,自然语言处理,国际政治,冲突研究 数据概述:... -
阅读障碍预测数据集DyslexiaPredictionDataset-thenikhilnj45
阅读障碍预测数据集DyslexiaPredictionDataset-thenikhilnj45 数据来源:互联网公开数据 标签:阅读障碍,数据集,机器学习,儿童健康,神经科学,文本分析,教育,预测模型 数据概述: 该数据集包含用于预测阅读障碍的数据,记录了儿童的阅读能力,认知能力以及相关行为特征。主要特征如下:... -
越南法律问答数据集VI-Law-QA-3K1Dataset-hiuluc
越南法律问答数据集VI-Law-QA-3K1Dataset-hiuluc 数据来源:互联网公开数据 标签:法律问答,越南,自然语言处理,问答系统,数据集,文本分析,机器学习,法律 数据概述:该数据集包含了来自越南法律领域的问答对,旨在为越南语法律问答系统的开发和研究提供支持。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了越南现行法律法规。... -
社交媒体用户故事与高光时刻数据集StoriesandHighlightsCSVDataset-kibs11
社交媒体用户故事与高光时刻数据集StoriesandHighlightsCSVDataset-kibs11 数据来源:互联网公开数据 标签:社交媒体,用户故事,高光时刻,文本分析,情感分析,内容推荐,数据挖掘,用户行为 数据概述:... -
多语言机器翻译结果数据集MT5MultilingualResultsDataset-devtousif
多语言机器翻译结果数据集MT5MultilingualResultsDataset-devtousif 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,人工智能,翻译技术,语言学,文本分析 数据概述: 该数据集包含多语言机器翻译模型MT5的翻译结果,记录了多种语言之间的翻译准确性,速度和质量。主要特征如下:... -
个人身份信息PII泄露检测数据集-takaito
个人身份信息PII泄露检测数据集-takaito 数据来源:互联网公开数据 标签:数据安全,PII,数据集,机器学习,文本分析,信息安全,隐私保护,自然语言处理 数据概述:该数据集包含了用于个人身份信息(PII,Personal Identifiable... -
现代英语到莎士比亚英语翻译数据集-abdelazizsidenna
现代英语到莎士比亚英语翻译数据集-abdelazizsidenna 数据来源:互联网公开数据 标签:语言学,翻译,数据集,自然语言处理,文本转换,莎士比亚,机器学习,文本分析 数据概述: 该数据集旨在提供现代英语到莎士比亚英语的翻译对,用于训练和评估翻译模型。主要特征如下:... -
索赔分解-重构与验证数据集ClaimDecomposition-Restructuring-andValidationDataset-swethabalram2410
索赔分解-重构与验证数据集ClaimDecomposition-Restructuring-andValidationDataset-swethabalram2410 数据来源:互联网公开数据 标签:索赔分析,自然语言处理,文本分析,数据集,信息抽取,机器学习,金融科技,风险管理 数据概述:... -
中文文本摘要评估数据集AACLSumEvalCombinedData-shantanupatankar
中文文本摘要评估数据集AACLSumEvalCombinedData-shantanupatankar 数据来源:互联网公开数据 标签:文本摘要评估,自然语言处理,数据集,机器学习,信息检索,学术研究,语言学,文本分析... -
罗曼诗歌数据集RomanPoetryDataset-mustafa2003
罗曼诗歌数据集RomanPoetryDataset-mustafa2003 数据来源:互联网公开数据 标签:诗歌,文学,数据集,文本分析,语言学,机器翻译,文化研究,古典文学 数据概述: 该数据集包含来自罗马时期的诗歌作品,记录了古罗马诗人创作的经典诗歌。主要特征如下: 时间跨度:数据记录的时间范围从公元前2世纪到公元4世纪。... -
虚假广告检测数据集FakeAdvertisingDetectionDataset-syedahmedshah
虚假广告检测数据集FakeAdvertisingDetectionDataset-syedahmedshah 数据来源:互联网公开数据 标签:广告检测,数据集,虚假广告,机器学习,自然语言处理,文本分析,数据挖掘,商业智能 数据概述: 该数据集包含来自公开来源的虚假广告数据,记录了各类广告文本及其标签,适用于虚假广告检测,文本分类等任务。主要特征如下:...