-
文本评论情感分析数据集
2025年8月26日 30 175 25
文本评论情感分析数据集_Text_Comment_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 文本处理, 自然语言处理, 评论数据, 负面评论, 机器学习, 文本分类, 数据预处理 数据概述:... -
越南语堤坝安全问答数据集
2025年8月13日 30 201 145
越南语堤坝安全问答数据集_Vietnamese_Dam_Safety_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 堤坝安全, 文本处理, 越南语, 信息检索, 灾害管理, 语义理解 数据概述:... -
语音识别与自然语言处理NeMo模型数据集
2025年8月1日 30 107 28
语音识别与自然语言处理NeMo模型数据集_Speech_Recognition_and_Natural_Language_Processing_NeMo_Models_Dataset 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, NeMo, 深度学习, 语音合成, 机器翻译, 文本处理, 模型评估 数据概述: 该数据集包含NVIDIA... -
文本信息实体识别验证数据集
2025年7月30日 30 148 18
文本信息实体识别验证数据集_Text_Information_Entity_Recognition_Validation_Dataset 数据来源:互联网公开数据 标签:实体识别, 文本处理, 自然语言处理, 机器学习, 模型评估, 命名实体识别, 验证集, 标注数据 数据概述:... -
文本标点符号校正数据集
2025年7月26日 30 165 7
文本标点符号校正数据集_Text_Punctuation_Correction_Dataset 数据来源:互联网公开数据 标签:文本处理, 自然语言处理, 标点符号, 文本校正, 数据标注, 机器学习, 语料库, 文本分析 数据概述: 该数据集包含来自公开文本的数据,记录了用于文本标点符号校正的语料。主要特征如下:... -
代码单元格类型与来源数据集
2025年7月14日 30 164 46
代码单元格类型与来源数据集_Code_Cell_Type_and_Source_Dataset 数据来源:互联网公开数据 标签:代码分析, 数据科学, 代码单元格, Jupyter Notebook, 文本处理, 机器学习, 数据预处理, 代码理解 数据概述: 该数据集包含来自Jupyter... -
文本片段索引信息数据集
2025年6月30日 30 137 90
文本片段索引信息数据集_Text_Segment_Index_Information 数据来源:互联网公开数据 标签:文本处理, 信息检索, 索引构建, 数据结构, 文本分析, 机器学习, 自然语言处理, 数据集 数据概述: 该数据集包含文本片段的索引信息,记录了文本被分割成片段后的关键索引数据。主要特征如下:... -
arXiv论文多标记语言数据集-2023年1月至2023年10月
2025年6月4日 30 22 20
arXiv论文多标记语言数据集-2023年1月至2023年10月 数据来源:互联网公开数据 标签:arXiv,论文,多标记语言,科学研究,机器学习,自然语言处理,文本处理,学术资源 数据概述:... -
达观数据文本处理挑战赛数据集
2025年6月4日 30 51 46
达观数据文本处理挑战赛数据集 数据来源:互联网公开数据 标签:竞赛,文本处理,NLP,分类,长文本解析,自然语言处理,机器学习 数据概述: 本数据集由达观数据提供,用于文本处理竞赛。数据集包含两个CSV文件:train_set.csv和test_set.csv。 -... -
STEM领域维基百科语料库数据集
2025年6月4日 30 10 8
STEM领域维基百科语料库数据集 数据来源:互联网公开数据 标签:STEM,维基百科,语料库,文本处理,自然语言处理,科学教育,知识图谱,数据分析 数据概述:... -
Klinger等处理后的arXiv论文元数据和摘要数据集-机器学习方法分类-2020
2025年6月1日 30 72 41
Klinger等处理后的arXiv论文元数据和摘要数据集-机器学习方法分类-2020 数据来源:互联网公开数据 标签:arXiv,论文元数据,摘要,机器学习,分类,文本处理,训练数据,TF-IDF 数据概述:... -
乌尔都语新闻文本大规模数据集-2021-saurabhshahane
2025年6月1日 30 24 12
乌尔都语新闻文本大规模数据集-2021-saurabhshahane 数据来源:互联网公开数据 标签:乌尔都语,新闻数据,文本处理,NLP,分类,摘要,命名实体识别,主题建模,文本生成 数据概述:... -
伊博语重音符号恢复数据集
2025年5月31日 30 37 27
伊博语重音符号恢复数据集 数据来源:互联网公开数据 标签:伊博语,重音符号恢复,自然语言处理,机器学习,文本处理,语言资源 数据概述: 本数据集包含超过50万条经过精心整理的伊博语文本数据,数据来源包括开放获取的伊博语文学文本,如书籍、新闻文章等。数据集经过转录和预处理,旨在为AI模型的训练提供高质量的文本资源,特别是在模式识别领域。 数据用途概述:... -
毒性评论分类数据集
2025年5月31日 30 173 133
毒性评论分类数据集 数据来源:互联网公开数据 标签:毒性评论,分类模型,自然语言处理,多语言,情感分析,文本处理,数据预处理 数据概述:... -
银行交易记录数据分析数据集BankTransactionRecordsDataAnalysis-tanhsama
2025年5月31日 30 107 44
银行交易记录数据分析数据集BankTransactionRecordsDataAnalysis-tanhsama 数据来源:互联网公开数据 标签:银行交易, 金融数据, 交易记录, 数据分析, 文本处理, 客户信息, 数据隐私, 机器学习 数据概述:... -
COVID-19研究论文词干提取数据集
2025年5月31日 30 170 59
COVID-19研究论文词干提取数据集 数据来源:互联网公开数据 标签:COVID-19研究,NLP技术,词干提取,文本处理,数据科学,公共卫生 数据概述:... -
越南地名图像识别数据集VietnamPlaceNameImageRecognition-tuanltm
2025年5月31日 30 126 54
越南地名图像识别数据集VietnamPlaceNameImageRecognition-tuanltm 数据来源:互联网公开数据 标签:图像识别, 地名识别, OCR, 文本处理, 越南, 计算机视觉, 数据标注, 自然语言处理 数据概述: 该数据集包含来自越南地区的地名图像数据,记录了越南地名的图像及其对应的文本标注信息。主要特征如下:... -
印尼税务法庭判决数据集
2025年5月30日 30 32 13
印尼税务法庭判决数据集 数据来源:互联网公开数据 标签:税务法庭,判决分析,NLP,ML,法律预测,文本处理,法律纠纷 数据概述:... -
机器学习模型训练与评估数据集MachineLearningModelTrainingandEvaluationDatasets-goldenlock
2025年5月30日 30 167 156
机器学习模型训练与评估数据集MachineLearningModelTrainingandEvaluationDatasets-goldenlock 数据来源:互联网公开数据 标签:机器学习, 模型训练, 模型评估, 深度学习, 文本处理, 图像识别, 数据集, TensorFlow, 神经网络 数据概述:... -
数字序列文本数据集DigitalSequenceTextDataset-tracerboy
2025年5月30日 30 115 58
数字序列文本数据集DigitalSequenceTextDataset-tracerboy 数据来源:互联网公开数据 标签:文本数据, 数字序列, 数据集, 序列分析, 机器学习, 文本处理, 自然语言处理, 模式识别 数据概述: 该数据集包含来自未知来源的数字序列文本数据,记录了由数字组成的文本序列。主要特征如下:...