找到1,311个数据集

分类: 互联网数据 标签: 语料库

过滤结果
  • 文本序列分类数据集

    2026年3月1日 30 24 11

    文本序列分类数据集_Text_Sequence_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 序列标注, 深度学习, BERT模型, 语料库, 机器学习, 自然语言处理, 预训练模型 数据概述: 该数据集包含从公开渠道获取的文本序列数据,主要用于文本分类和序列标注任务。主要特征如下:...
    packageimg
  • 多领域越南语文本分类数据集

    2026年2月28日 30 20 0

    多领域越南语文本分类数据集_Vietnamese_Multi_domain_Text_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 越南语, 自然语言处理, 多领域, 意图识别, 机器学习, 语料库, 数据标注 数据概述: 该数据集包含来自多个领域的越南语文本数据,旨在用于多领域文本分类任务。主要特征如下:...
    packageimg
  • 阿拉伯新闻文本情感分析数据集

    2026年2月22日 30 116 109

    阿拉伯新闻文本情感分析数据集_Arabic_News_Text_Sentiment_Analysis 数据来源:互联网公开数据 标签:阿拉伯语, 情感分析, 文本分类, 自然语言处理, 新闻文本, 情感极性, 机器翻译, 语料库 数据概述: 该数据集包含来自阿拉伯新闻网站的文本数据,记录了新闻文章的内容及其对应的情感极性标签。主要特征如下:...
    packageimg
  • 加泰罗尼亚语文本词汇预测数据集

    2025年11月12日 30 45 20

    加泰罗尼亚语文本词汇预测数据集_Catalan_Text_Vocabulary_Prediction 数据来源:互联网公开数据 标签:自然语言处理, 文本预测, 语言模型, 加泰罗尼亚语, 词汇分析, 深度学习, 语料库, 文本生成 数据概述:...
    packageimg
  • 尼泊尔语_英语平行语料库数据集

    2025年11月10日 30 27 9

    尼泊尔语_英语平行语料库数据集_Nepali_English_Parallel_Corpus_Dataset 数据来源:互联网公开数据 标签:机器翻译, 语料库, 尼泊尔语, 英语, 自然语言处理, 文本对齐, 语言学, 双语文本 数据概述:...
    packageimg
  • 学术论文写作结构分析数据集

    2025年11月10日 30 105 12

    学术论文写作结构分析数据集_Academic_Paper_Writing_Structure_Analysis 数据来源:互联网公开数据 标签:文本分析, 论文结构, 语义分割, 自然语言处理, 机器学习, 深度学习, 写作辅助, 语料库 数据概述:...
    packageimg
  • 俄乌冲突语料文本主题聚类分析数据集

    2025年11月9日 30 28 11

    俄乌冲突语料文本主题聚类分析数据集_Russia_Ukraine_Conflict_Text_Topic_Clustering_Dataset 数据来源:互联网公开数据 标签:俄乌冲突, 文本聚类, 主题建模, 自然语言处理, 情感分析, 舆情分析, 机器学习, 语料库 数据概述:...
    packageimg
  • 文本质量评估与打分数据集

    2025年11月7日 30 202 4

    文本质量评估与打分数据集_Text_Quality_Evaluation_and_Scoring_Dataset 数据来源:互联网公开数据 标签:文本分析, 文本质量, 语言评估, 多维度评分, 机器学习, 自然语言处理, 语料库, 深度学习 数据概述: 该数据集包含用于文本质量评估与打分的结构化数据,旨在评估文本在不同维度上的表现。主要特征如下:...
    packageimg
  • 儿童英语句子重组训练数据集

    2025年11月7日 30 9 8

    儿童英语句子重组训练数据集_Children_s_English_Sentence_Reconstruction_Training_Dataset 数据来源:互联网公开数据 标签:英语学习, 句子重组, 文本生成, 语言模型, 自然语言处理, 英语教育, 语料库, 数据集 数据概述:...
    packageimg
  • 自然语言生成文章写作质量评估数据集

    2025年11月5日 30 144 34

    自然语言生成文章写作质量评估数据集_Natural_Language_Generation_Article_Writing_Quality_Assessment 数据来源:互联网公开数据 标签:自然语言生成, 文本质量评估, 写作质量, 语言模型, 生成文本, 文本分析, 机器学习, 语料库 数据概述:...
    packageimg
  • 书籍评论情感分析数据集

    2025年11月1日 30 74 12

    书籍评论情感分析数据集_Book_Review_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 文本分类, 书籍评论, 自然语言处理, 情感标签, 机器学习, 评论分析, 语料库 数据概述: 该数据集包含来自书籍评论网站的书籍评论数据,记录了用户对书籍的评价文本以及对应的情感标签。主要特征如下:...
    packageimg
  • 主题识别模型验证数据集

    2025年10月31日 30 15 11

    主题识别模型验证数据集_Topic_Identification_Model_Validation_Dataset 数据来源:互联网公开数据 标签:主题识别, 文本分类, 模型验证, 自然语言处理, 机器学习, 数据集构建, 深度学习, 语料库 数据概述:...
    packageimg
  • 越南新闻犯罪事件文本数据集

    2025年10月28日 30 69 49

    越南新闻犯罪事件文本数据集_Vietnam_News_Crime_Incident_Text_Data 数据来源:互联网公开数据 标签:犯罪事件, 新闻文本, 越南, 文本分析, 自然语言处理, 情感分析, 数据清洗, 语料库 数据概述: 该数据集包含来自越南新闻网站的犯罪事件相关文本,记录了不同来源的新闻报道内容。主要特征如下:...
    packageimg
  • 金融合规问答数据集

    2025年10月26日 30 33 25

    金融合规问答数据集_Financial_Compliance_Question_Answering_Dataset 数据来源:互联网公开数据 标签:金融合规, 问答系统, 自然语言处理, 文本匹配, 信息检索, 知识图谱, 机器学习, 语料库 数据概述:...
    packageimg
  • 越南新闻犯罪事件文本数据集

    2025年10月25日 30 11 7

    越南新闻犯罪事件文本数据集_Vietnam_News_Crime_Incident_Text_Data 数据来源:互联网公开数据 标签:犯罪事件, 新闻文本, 越南, 文本分析, 自然语言处理, 情感分析, 数据清洗, 语料库 数据概述: 该数据集包含来自越南新闻网站的犯罪事件相关文本,记录了不同来源的新闻报道内容。主要特征如下:...
    packageimg
  • 中文文本分词训练数据集

    2025年10月24日 30 144 78

    中文文本分词训练数据集_Chinese_Text_Tokenization_Training_Dataset 数据来源:互联网公开数据 标签:中文分词, 文本处理, 自然语言处理, 机器学习, 词汇表构建, BPE分词, 语料库, 深度学习 数据概述: 该数据集包含用于中文文本分词任务的训练数据和相关配置信息。主要特征如下:...
    packageimg
  • 学术论文文本结构分析评估数据集

    2025年10月23日 30 50 21

    学术论文文本结构分析评估数据集_Academic_Paper_Text_Structure_Analysis_Evaluation_Dataset 数据来源:互联网公开数据 标签:文本结构分析, 自然语言处理, 论文分析, 文本分类, 评估指标, 机器学习, 深度学习, 语料库 数据概述:...
    packageimg
  • 俄罗斯新闻文本数据集

    2025年10月21日 30 42 18

    俄罗斯新闻文本数据集_Russian_News_Articles 数据来源:互联网公开数据 标签:新闻文本, 俄罗斯, 文本分析, 自然语言处理, 舆情分析, 文本挖掘, 情感分析, 语料库 数据概述: 该数据集包含来自俄罗斯新闻网站的文章文本数据,旨在为研究人员提供一个用于文本分析和自然语言处理的资源。主要特征如下:...
    packageimg
  • 问答文本分类数据集

    2025年10月21日 30 44 26

    问答文本分类数据集_Question_Answering_Text_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 问答系统, 自然语言处理, 语料库, 机器学习, 知识挖掘, 语义分析, 情感分析 数据概述: 该数据集包含来自雅虎问答的数据,记录了用户提出的问题、对应的答案以及问题所属的类别。主要特征如下:...
    packageimg
  • 国际新闻文本摘要数据集

    2025年10月20日 30 74 51

    国际新闻文本摘要数据集_International_News_Text_Summary_Dataset 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本分类, 舆情分析, 机器阅读, 语料库, 文本生成 数据概述:...
    packageimg