找到11,717个数据集

标签: 自然语言处理

过滤结果
  • 现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong

    2025年4月22日   

    现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,BERT,模型微调,情感分析,文本分类 数据概述: 该数据集包含用于微调现代BERT模型的数据,主要记录了用于各种自然语言处理任务的文本信息。主要特征如下:...
    packageimg
  • 古兰经印尼语翻译数据集DataAl-QuranIndonesia-wahyunahdaputra

    2025年4月22日   

    古兰经印尼语翻译数据集DataAl-QuranIndonesia-wahyunahdaputra 数据来源:互联网公开数据 标签:古兰经,印尼语,翻译,宗教,文本分析,自然语言处理,伊斯兰教,数据集 数据概述: 该数据集包含来自印尼语翻译的古兰经文本,记录了古兰经经文的印尼语翻译内容。主要特征如下:...
    packageimg
  • 生成式AI文章数据集ChatGPTFakeArticlesDataset-michaeljs

    2025年4月22日   

    生成式AI文章数据集ChatGPTFakeArticlesDataset-michaeljs 数据来源:互联网公开数据 标签:生成式AI,假新闻,数据集,文本分析,自然语言处理,机器学习,信息验证,网络安全 数据概述:该数据集包含由ChatGPT生成的假新闻文章,记录了AI生成的文章内容及特征。主要特征如下:...
    packageimg
  • 尼日利亚政治新闻真伪鉴别数据集-nevilmaloba

    2025年4月22日   

    尼日利亚政治新闻真伪鉴别数据集-nevilmaloba 数据来源:互联网公开数据 标签:政治新闻,虚假新闻,尼日利亚,数据集,文本分析,自然语言处理,信息真实性,新闻分类 数据概述: 该数据集包含了来自尼日利亚的政治新闻,旨在用于研究和分析新闻的真伪。主要特征如下: 时间跨度:数据记录的时间范围为特定时期内。 地理范围:数据主要来源于尼日利亚。...
    packageimg
  • 虚假与真实新闻数据集FakeandTrueNewsDatasets-ramaqubra

    2025年4月22日   

    虚假与真实新闻数据集FakeandTrueNewsDatasets-ramaqubra 数据来源:互联网公开数据 标签:新闻分析,数据集,文本分类,机器学习,信息传播,自然语言处理,虚假信息,新闻媒体 数据概述: 该数据集包含来自多个新闻来源的文本数据,记录了虚假新闻与真实新闻的内容对比。主要特征如下:...
    packageimg
  • 情绪识别LSTM数据集EmotionDetectionLSTMDataset-annadad

    2025年4月22日   

    情绪识别LSTM数据集EmotionDetectionLSTMDataset-annadad 数据来源:互联网公开数据 标签:情绪识别,数据集,深度学习,自然语言处理,情感分析,机器学习,文本分类,人工智能 数据概述:...
    packageimg
  • IMDB电影情感分析数据集IMDBSentimentAnalysisDataset-arunlokanatha

    2025年4月22日   

    IMDB电影情感分析数据集IMDBSentimentAnalysisDataset-arunlokanatha 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本分析,分类算法,人工智能...
    packageimg
  • 数据4KMixtral87B生成文本与AI检测数据集4KMixtral87BCraftedEssaysforDetectAICompDataset-jisukim8873

    2025年4月22日   

    4KMixtral87B生成文本与AI检测数据集4KMixtral87BCraftedEssaysforDetectAICompDataset-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,文本生成,AI检测,机器学习,数据集,文本分类,深度学习,学术研究 数据概述: 该数据集包含由Mixtral...
    packageimg
  • 领域分类数据集DomainDatasetCls-nguyncboa

    2025年4月22日   

    领域分类数据集DomainDatasetCls-nguyncboa 数据来源:互联网公开数据 标签:分类,数据集,机器学习,文本分析,自然语言处理,领域识别,数据挖掘,人工智能 数据概述: 该数据集包含来自多个领域的文本数据,主要记录了不同领域的文本样本及其对应的分类标签。主要特征如下:...
    packageimg
  • 汽车品牌用户评论数据集Reviewsof5CarBrandsDataset-ashisparida

    2025年4月22日   

    汽车品牌用户评论数据集Reviewsof5CarBrandsDataset-ashisparida 数据来源:互联网公开数据 标签:汽车,用户评论,情感分析,品牌声誉,文本挖掘,自然语言处理,消费者行为,市场调研 数据概述: 该数据集包含了来自互联网的关于五个主要汽车品牌的消费者评论数据。主要特征如下: 时间跨度:...
    packageimg
  • 命名实体识别数据集NERDataPS-NamedEntityRecognitionDataSet-hharshsharma2098

    2025年4月22日   

    命名实体识别数据集NERDataPS-NamedEntityRecognitionDataSet-hharshsharma2098 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本挖掘,机器学习,人工智能,语言学,信息抽取...
    packageimg
  • 预训练RoBERTa-base模型预测结果数据集-mathislucka

    2025年4月22日   

    预训练RoBERTa-base模型预测结果数据集-mathislucka 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器翻译,文本分类,模型预测,RoBERTa,数据集 数据概述: 该数据集包含了基于预训练RoBERTa-base模型对文本数据的预测结果。主要特征如下:...
    packageimg
  • 突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi

    2025年4月22日   

    突尼斯问答数据集TunisiaQ-ADataset-anismarrouchi 数据来源:互联网公开数据 标签:突尼斯,问答,自然语言处理,文本分析,信息检索,阿拉伯语,数据集,文化 数据概述: 该数据集包含来自突尼斯的问答数据,主要记录了关于突尼斯文化,历史,社会,旅游等领域的问题和答案。主要特征如下:...
    packageimg
  • 多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-fida5073

    2025年4月22日   

    多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-fida5073 数据来源:互联网公开数据 标签:仇恨言论,多语言,自然语言处理,文本分类,机器学习,情感分析,社交媒体,数据集 数据概述: 该数据集包含来自社交媒体平台的多语言文本数据,旨在用于仇恨言论的检测和分类。主要特征如下:...
    packageimg
  • 法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari

    2025年4月22日   

    法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari 数据来源:互联网公开数据 标签:自然语言处理,地理位置,数据集,文本分析,机器学习,地理信息系统,语言学,信息检索 数据概述:该数据集包含来自互联网公开资源的法国地理位置相关文本数据,适用于自然语言处理,地理位置信息提取等任务。主要特征如下:...
    packageimg
  • 聚类后句子数据集SentencesAfterClusteringDataset-mrqian0509

    2025年4月22日   

    聚类后句子数据集SentencesAfterClusteringDataset-mrqian0509 数据来源:互联网公开数据 标签:文本分析,数据集,聚类分析,自然语言处理,机器学习,文本挖掘,数据分析,人工智能 数据概述:该数据集包含通过聚类算法处理后生成的句子数据,记录了不同类别或主题的文本句子。主要特征如下:...
    packageimg
  • 虚假新闻文本识别数据集FakedditText50kDataset-rajatdhanuka

    2025年4月22日   

    虚假新闻文本识别数据集FakedditText50kDataset-rajatdhanuka 数据来源:互联网公开数据 标签:虚假新闻,文本识别,数据集,自然语言处理,机器学习,情感分析,信息传播,文本分类 数据概述: 该数据集包含来自Fakeddit项目的文本数据,记录了50,000条新闻文本及其真实性标签。主要特征如下:...
    packageimg
  • 推特训练数据集TwitterTrainingDataCSVDataset-compellingdemigod

    2025年4月22日   

    推特训练数据集TwitterTrainingDataCSVDataset-compellingdemigod 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,机器学习,情感分析,自然语言处理,数据挖掘,文本分类 数据概述: 该数据集包含来自推特平台的公开文本数据,记录了用户发布的推文及其相关信息。主要特征如下:...
    packageimg
  • 计算语言学与语音学领域论文摘要数据集AbstractsfromarXiv-orgunderCSLGCategory-ajiiscbanglore

    2025年4月22日   

    计算语言学与语音学领域论文摘要数据集AbstractsfromarXiv-orgunderCSLGCategory-ajiiscbanglore 数据来源:互联网公开数据 标签:计算语言学,语音学,数据集,学术研究,自然语言处理,文本分析,机器学习,学术论文 数据概述:...
    packageimg
  • 情感分类社交媒体评论数据集SentimentClassificationSocialMediaCommentsDataset-chandan999

    2025年4月22日   

    情感分类社交媒体评论数据集SentimentClassificationSocialMediaCommentsDataset-chandan999 数据来源:互联网公开数据 标签:情感分析,数据集,社交媒体,文本分类,自然语言处理,机器学习,文本挖掘,社会学研究 数据概述:...
    packageimg