-
伊朗电商Digikala商品评论情感分析数据集DigikalaBigFiveDatasets-IranianBusiness-ykhorrami
伊朗电商Digikala商品评论情感分析数据集DigikalaBigFiveDatasets-IranianBusiness-ykhorrami 数据来源:互联网公开数据 标签:电商,情感分析,评论数据,自然语言处理,伊朗,机器学习,文本挖掘,商业分析 数据概述:... -
新闻主题分类数据集-lysatrf
新闻主题分类数据集-lysatrf 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,新闻,机器学习,主题建模,舆情分析,信息检索 数据概述:该数据集包含来自新闻网站的文章数据,记录了新闻文章的内容及其对应的主题分类。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了近期的新闻文章。... -
朱尔斯-凡尔纳作品数据集JulesVerneWorksDataset-sabir00
朱尔斯-凡尔纳作品数据集JulesVerneWorksDataset-sabir00 数据来源:互联网公开数据 标签:文学作品,科幻小说,数据集,文学分析,自然语言处理,文化研究,机器学习,历史研究 数据概述: 该数据集包含法国著名作家朱尔斯·凡尔纳的文学作品数据,记录了凡尔纳创作的科幻小说及其他文学作品的详细信息。主要特征如下:... -
阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596
阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 自然语言处理, 情感极性, 机器学习, 语料库, 数据标注 数据概述:... -
疫苗接种评论情感分析数据集VaccinationCommentsSentimentAnalysisDataset-dimasananda
疫苗接种评论情感分析数据集VaccinationCommentsSentimentAnalysisDataset-dimasananda 数据来源:互联网公开数据 标签:情感分析, 疫苗接种, 文本挖掘, 社交媒体, 自然语言处理, 情感分类, 印度尼西亚, 疫情 数据概述:... -
编程问答社区问题文本数据集ProgrammingQ-ACommunityQuestionTextData-nandhinirjs
编程问答社区问题文本数据集ProgrammingQ-ACommunityQuestionTextData-nandhinirjs 数据来源:互联网公开数据 标签:编程问答, 文本分析, 自然语言处理, 问答系统, 文本挖掘, 社区数据, 机器学习, 语料库 数据概述:... -
土耳其语与英语双语平行语料数据集Turkish-EnglishParallelCorpusDataset-eneskulak
土耳其语与英语双语平行语料数据集Turkish-EnglishParallelCorpusDataset-eneskulak 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,翻译研究,双语对齐,语言模型,计算机科学,数据挖掘 数据概述: 该数据集包含来自土耳其语和英语的双语平行文本数据,记录了两种语言之间的对应关系。主要特征如下:... -
产品清洗训练数据集CleanedProductsTrainingDataDataset-koteswaruduakula
产品清洗训练数据集CleanedProductsTrainingDataDataset-koteswaruduakula 数据来源:互联网公开数据 标签:产品数据,数据清洗,机器学习,文本分析,自然语言处理,数据集,数据预处理,信息提取 数据概述: 该数据集包含经过清洗和标准化的产品数据,主要用于训练和评估产品数据清洗模型。主要特征如下:... -
信息检索研究数据集-khamalking
信息检索研究数据集-khamalking 数据来源:互联网公开数据 标签:信息检索,数据集,文本分析,自然语言处理,机器学习,搜索,语义理解,文本挖掘 数据概述: 该数据集包含用于信息检索领域的研究和评估的文本数据。主要特征如下: 时间跨度:数据记录的时间跨度不定,取决于具体的数据来源,但通常涵盖了近年来公开的文本和文档。... -
商品评分与评论数据集RatingandReviewsDataset-qucvinhdng
商品评分与评论数据集RatingandReviewsDataset-qucvinhdng 数据来源:互联网公开数据 标签:商品评分,用户评论,数据集,电子商务,机器学习,自然语言处理,消费者行为,市场研究 数据概述:该数据集包含来自电子商务平台的商品评分和用户评论数据,记录了用户对商品的评价和评分情况。主要特征如下:... -
DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin
DistilBERT预处理数据集DistilBERTPreprocessedDataset-kirillklyukvin 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,数据集,文本分类,机器学习,深度学习,文本分析,人工智能 数据概述:... -
知识图谱嵌入数据集DRKGEmbeddingDataset-rawanmahmoudrm
知识图谱嵌入数据集DRKGEmbeddingDataset-rawanmahmoudrm 数据来源:互联网公开数据 标签:知识图谱,图嵌入,数据集,生物医学,关系抽取,机器学习,自然语言处理,知识表示 数据概述: 该数据集包含了从多个生物医学知识图谱中提取的知识,用于知识图谱嵌入任务。主要特征如下:... -
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan 数据来源:互联网公开数据 标签:歌词,翻译,数据集,自然语言处理,机器翻译,文本分析,多语言,语言学 数据概述: 该数据集包含来自多个来源的歌曲歌词及其对应的翻译文本,旨在用于机器翻译、文本分析和多语言研究。主要特征如下:... -
COVID-19相关医学文献分析数据集COVID-19RelatedMedicalLiteratureAnalysis-saumya94
COVID-19相关医学文献分析数据集COVID-19RelatedMedicalLiteratureAnalysis-saumya94 数据来源:互联网公开数据 标签:COVID-19, 医学文献, 文本分析, 传染病, 呼吸系统疾病, 自然语言处理, 疫情研究, 生物医学 数据概述: 该数据集包含来自PMC(Pubmed... -
大型语言模型系统综合评估数据集LMSYSAllData-LargeLanguageModelSystemComprehensiveEvaluationDa...
大型语言模型系统综合评估数据集LMSYSAllData-LargeLanguageModelSystemComprehensiveEvaluationDataset-takukawatani 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,语言模型,模型评估,深度学习,技术评估 数据概述:... -
消费者行为分析用户评论数据集ConsumerBehaviorAnalysisUserReviews-saodem74
消费者行为分析用户评论数据集ConsumerBehaviorAnalysisUserReviews-saodem74 数据来源:互联网公开数据 标签:用户评论, 消费者行为, 情感分析, 文本挖掘, 市场调研, 产品反馈, 自然语言处理, 数据分析 数据概述: 该数据集包含用户对特定产品或服务的评论数据,记录了消费者在体验后的评价信息。主要特征如下:... -
服务条款与可读性评分数据集TermsofServiceandReadabilityScoresDataset-caitvh14
服务条款与可读性评分数据集TermsofServiceandReadabilityScoresDataset-caitvh14 数据来源:互联网公开数据 标签:法律文本,可读性分析,数据集,文本处理,自然语言处理,机器学习,语言学,数据分析 数据概述: 该数据集包含来自多个互联网平台的服务条款文本以及相应的可读性评分。主要特征如下:... -
印地语语料库数据集HindiCorpusDataset-flaming0
印地语语料库数据集HindiCorpusDataset-flaming0 数据来源:互联网公开数据 标签:印地语,语料库,自然语言处理,文本分析,语言学,机器学习,数据集,印度 数据概述: 该数据集包含来自互联网和公开资源的印地语文本数据,记录了印地语的丰富文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
Yelp用户评论负样本数据集-che011
Yelp用户评论负样本数据集-che011 数据来源:互联网公开数据 标签:用户评论,负样本,情感分析,自然语言处理,数据集,机器学习,文本分类,Yelp 数据概述:该数据集包含来自Yelp平台的负样本用户评论数据,主要用于情感分析和文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了Yelp平台上较早期的用户评论。... -
多领域语义匹配数据集MSMARCOModifiedDataset-n068968
多领域语义匹配数据集MSMARCOModifiedDataset-n068968 数据来源:互联网公开数据 标签:自然语言处理,语义匹配,数据集,机器学习,信息检索,文本分类,深度学习,数据挖掘 数据概述: 该数据集是对MSMARCO数据集的改进版,包含来自多个领域的语义匹配数据,用于训练和评估文本匹配模型。主要特征如下:...