找到5,734个数据集

标签: 文本分析

过滤结果
  • 古兰经印尼语版本数据集QuranIndonesiaDataset-sofyanuli

    2025年4月23日   

    古兰经印尼语版本数据集QuranIndonesiaDataset-sofyanuli 数据来源:互联网公开数据 标签:古兰经,宗教,伊斯兰教,文本分析,自然语言处理,文化研究,宗教文本,印尼语 数据概述: 该数据集包含古兰经的印尼语版本,记录了《古兰经》中的所有章节(苏拉)和经文(阿亚特)。主要特征如下:...
    packageimg
  • 刑事审判案例数据集TRECTrialDataExampleDataset-cryosky

    2025年4月23日   

    刑事审判案例数据集TRECTrialDataExampleDataset-cryosky 数据来源:互联网公开数据 标签:法律研究,司法数据,数据集,案例分析,机器学习,文本分析,法律科技,司法统计 数据概述: 该数据集包含来自刑事审判案例的文本数据,记录了案件的基本信息,审判过程和法律判决。主要特征如下:...
    packageimg
  • 学术论文引用关系数据集SIYAPaperDataset-lakshinpathak

    2025年4月22日   

    学术论文引用关系数据集SIYAPaperDataset-lakshinpathak 数据来源:互联网公开数据 标签:学术论文,引用关系,数据集,知识图谱,自然语言处理,文本分析,学术研究,科学计量学 数据概述:该数据集包含来自多个学术领域的论文引用关系数据,记录了论文之间的引用情况,适用于学术研究,知识图谱构建等任务。主要特征如下:...
    packageimg
  • 圣经文本数据集-vishnuprksh

    2025年4月22日   

    圣经文本数据集-vishnuprksh 数据来源:互联网公开数据 标签:圣经,文本分析,自然语言处理,数据集,宗教研究,语言学,文本挖掘,语料库 数据概述:该数据集包含来自圣经的文本数据,涵盖了旧约和新约的多个版本和翻译。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了圣经创作的整个时期,从公元前15世纪到公元1世纪。...
    packageimg
  • 电影描述数据集MovieDescriptionDataset-malihamehjabinmitu

    2025年4月22日   

    电影描述数据集MovieDescriptionDataset-malihamehjabinmitu 数据来源:互联网公开数据 标签:电影,数据集,文本分析,自然语言处理,情感分析,机器学习,影视研究,数据挖掘 数据概述: 该数据集包含来自公开电影数据库的电影描述数据,记录了多部电影的剧情简介,分类标签,导演,演员等信息。主要特征如下:...
    packageimg
  • Flipkart产品属性值提取数据集FlipkartProductsforAttribute-ValueExtractionDataset-lameesm...

    2025年4月22日   

    Flipkart产品属性值提取数据集FlipkartProductsforAttribute-ValueExtractionDataset-lameesmohamedmohee 数据来源:互联网公开数据 标签:电子商务,产品数据,属性提取,数据集,自然语言处理,机器学习,文本分析,数据挖掘 数据概述:...
    packageimg
  • 现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong

    2025年4月22日   

    现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,BERT,模型微调,情感分析,文本分类 数据概述: 该数据集包含用于微调现代BERT模型的数据,主要记录了用于各种自然语言处理任务的文本信息。主要特征如下:...
    packageimg
  • 古兰经印尼语翻译数据集DataAl-QuranIndonesia-wahyunahdaputra

    2025年4月22日   

    古兰经印尼语翻译数据集DataAl-QuranIndonesia-wahyunahdaputra 数据来源:互联网公开数据 标签:古兰经,印尼语,翻译,宗教,文本分析,自然语言处理,伊斯兰教,数据集 数据概述: 该数据集包含来自印尼语翻译的古兰经文本,记录了古兰经经文的印尼语翻译内容。主要特征如下:...
    packageimg
  • 生成式AI文章数据集ChatGPTFakeArticlesDataset-michaeljs

    2025年4月22日   

    生成式AI文章数据集ChatGPTFakeArticlesDataset-michaeljs 数据来源:互联网公开数据 标签:生成式AI,假新闻,数据集,文本分析,自然语言处理,机器学习,信息验证,网络安全 数据概述:该数据集包含由ChatGPT生成的假新闻文章,记录了AI生成的文章内容及特征。主要特征如下:...
    packageimg
  • 尼日利亚政治新闻真伪鉴别数据集-nevilmaloba

    2025年4月22日   

    尼日利亚政治新闻真伪鉴别数据集-nevilmaloba 数据来源:互联网公开数据 标签:政治新闻,虚假新闻,尼日利亚,数据集,文本分析,自然语言处理,信息真实性,新闻分类 数据概述: 该数据集包含了来自尼日利亚的政治新闻,旨在用于研究和分析新闻的真伪。主要特征如下: 时间跨度:数据记录的时间范围为特定时期内。 地理范围:数据主要来源于尼日利亚。...
    packageimg
  • IMDB电影情感分析数据集IMDBSentimentAnalysisDataset-arunlokanatha

    2025年4月22日   

    IMDB电影情感分析数据集IMDBSentimentAnalysisDataset-arunlokanatha 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本分析,分类算法,人工智能...
    packageimg
  • 领域分类数据集DomainDatasetCls-nguyncboa

    2025年4月22日   

    领域分类数据集DomainDatasetCls-nguyncboa 数据来源:互联网公开数据 标签:分类,数据集,机器学习,文本分析,自然语言处理,领域识别,数据挖掘,人工智能 数据概述: 该数据集包含来自多个领域的文本数据,主要记录了不同领域的文本样本及其对应的分类标签。主要特征如下:...
    packageimg
  • 预训练RoBERTa-base模型预测结果数据集-mathislucka

    2025年4月22日   

    预训练RoBERTa-base模型预测结果数据集-mathislucka 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器翻译,文本分类,模型预测,RoBERTa,数据集 数据概述: 该数据集包含了基于预训练RoBERTa-base模型对文本数据的预测结果。主要特征如下:...
    packageimg
  • 突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi

    2025年4月22日   

    突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi 数据来源:互联网公开数据 标签:突尼斯,问答,自然语言处理,文本分析,信息检索,阿拉伯语,数据集,文化 数据概述: 该数据集包含来自突尼斯的问答数据,主要记录了关于突尼斯文化,历史,社会,旅游等领域的问题和答案。主要特征如下:...
    packageimg
  • 法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari

    2025年4月22日   

    法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari 数据来源:互联网公开数据 标签:自然语言处理,地理位置,数据集,文本分析,机器学习,地理信息系统,语言学,信息检索 数据概述:该数据集包含来自互联网公开资源的法国地理位置相关文本数据,适用于自然语言处理,地理位置信息提取等任务。主要特征如下:...
    packageimg
  • 聚类后句子数据集SentencesAfterClusteringDataset-mrqian0509

    2025年4月22日   

    聚类后句子数据集SentencesAfterClusteringDataset-mrqian0509 数据来源:互联网公开数据 标签:文本分析,数据集,聚类分析,自然语言处理,机器学习,文本挖掘,数据分析,人工智能 数据概述:该数据集包含通过聚类算法处理后生成的句子数据,记录了不同类别或主题的文本句子。主要特征如下:...
    packageimg
  • 推特训练数据集TwitterTrainingDataCSVDataset-compellingdemigod

    2025年4月22日   

    推特训练数据集TwitterTrainingDataCSVDataset-compellingdemigod 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,机器学习,情感分析,自然语言处理,数据挖掘,文本分类 数据概述: 该数据集包含来自推特平台的公开文本数据,记录了用户发布的推文及其相关信息。主要特征如下:...
    packageimg
  • 计算语言学与语音学领域论文摘要数据集AbstractsfromarXiv-orgunderCSLGCategory-ajiiscbanglore

    2025年4月22日   

    计算语言学与语音学领域论文摘要数据集AbstractsfromarXiv-orgunderCSLGCategory-ajiiscbanglore 数据来源:互联网公开数据 标签:计算语言学,语音学,数据集,学术研究,自然语言处理,文本分析,机器学习,学术论文 数据概述:...
    packageimg
  • 新冠疫情下医疗伦理研究文本数据集-2020-ayan78

    2025年4月22日   

    新冠疫情下医疗伦理研究文本数据集-2020-ayan78 数据来源:互联网公开数据 标签:新冠疫情,医疗伦理,文本分析,多标签分类,伦理学,医学,数据集,COVID-19,道德,研究 数据概述: 本数据集旨在为新冠疫情背景下的医疗伦理研究提供训练数据。数据集由Ayan...
    packageimg
  • Kompas新闻事实核查数据集CEK-FaktaKompasDataset-aginanjar

    2025年4月22日   

    Kompas新闻事实核查数据集CEK-FaktaKompasDataset-aginanjar 数据来源:互联网公开数据 标签:新闻事实核查,数据集,信息真实性,新闻分析,机器学习,自然语言处理,媒体研究,文本分析 数据概述: 该数据集包含来自印尼Kompas新闻网站的事实核查数据,记录了新闻内容的真实性核查结果。主要特征如下:...
    packageimg