-
主题识别模型验证数据集
2025年10月31日 30 17 1
主题识别模型验证数据集_Topic_Identification_Model_Validation_Dataset 数据来源:互联网公开数据 标签:主题识别, 文本分类, 模型验证, 自然语言处理, 机器学习, 数据集构建, 深度学习, 语料库 数据概述:...
-
越南新闻犯罪事件文本数据集
2025年10月28日 30 34 24
越南新闻犯罪事件文本数据集_Vietnam_News_Crime_Incident_Text_Data 数据来源:互联网公开数据 标签:犯罪事件, 新闻文本, 越南, 文本分析, 自然语言处理, 情感分析, 数据清洗, 语料库 数据概述: 该数据集包含来自越南新闻网站的犯罪事件相关文本,记录了不同来源的新闻报道内容。主要特征如下:...
-
金融合规问答数据集
2025年10月26日 30 29 23
金融合规问答数据集_Financial_Compliance_Question_Answering_Dataset 数据来源:互联网公开数据 标签:金融合规, 问答系统, 自然语言处理, 文本匹配, 信息检索, 知识图谱, 机器学习, 语料库 数据概述:...
-
越南新闻犯罪事件文本数据集
2025年10月25日 30 100 93
越南新闻犯罪事件文本数据集_Vietnam_News_Crime_Incident_Text_Data 数据来源:互联网公开数据 标签:犯罪事件, 新闻文本, 越南, 文本分析, 自然语言处理, 情感分析, 数据清洗, 语料库 数据概述: 该数据集包含来自越南新闻网站的犯罪事件相关文本,记录了不同来源的新闻报道内容。主要特征如下:...
-
中文文本分词训练数据集
2025年10月24日 30 117 7
中文文本分词训练数据集_Chinese_Text_Tokenization_Training_Dataset 数据来源:互联网公开数据 标签:中文分词, 文本处理, 自然语言处理, 机器学习, 词汇表构建, BPE分词, 语料库, 深度学习 数据概述: 该数据集包含用于中文文本分词任务的训练数据和相关配置信息。主要特征如下:...
-
学术论文文本结构分析评估数据集
2025年10月23日 30 171 26
学术论文文本结构分析评估数据集_Academic_Paper_Text_Structure_Analysis_Evaluation_Dataset 数据来源:互联网公开数据 标签:文本结构分析, 自然语言处理, 论文分析, 文本分类, 评估指标, 机器学习, 深度学习, 语料库 数据概述:...
-
俄罗斯新闻文本数据集
2025年10月21日 30 175 146
俄罗斯新闻文本数据集_Russian_News_Articles 数据来源:互联网公开数据 标签:新闻文本, 俄罗斯, 文本分析, 自然语言处理, 舆情分析, 文本挖掘, 情感分析, 语料库 数据概述: 该数据集包含来自俄罗斯新闻网站的文章文本数据,旨在为研究人员提供一个用于文本分析和自然语言处理的资源。主要特征如下:...
-
问答文本分类数据集
2025年10月21日 30 121 53
问答文本分类数据集_Question_Answering_Text_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 问答系统, 自然语言处理, 语料库, 机器学习, 知识挖掘, 语义分析, 情感分析 数据概述: 该数据集包含来自雅虎问答的数据,记录了用户提出的问题、对应的答案以及问题所属的类别。主要特征如下:...
-
国际新闻文本摘要数据集
2025年10月20日 30 72 49
国际新闻文本摘要数据集_International_News_Text_Summary_Dataset 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本分类, 舆情分析, 机器阅读, 语料库, 文本生成 数据概述:...
-
新闻文章摘要生成数据集
2025年10月19日 30 102 13
新闻文章摘要生成数据集_News_Article_Summarization_Dataset 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 数据集, 语料库, 摘要生成 数据概述: 该数据集包含来自新闻文章及其对应的摘要数据,旨在用于训练和评估文本摘要模型。主要特征如下:...
-
新闻文本摘要生成数据集
2025年10月17日 30 171 160
新闻文本摘要生成数据集_News_Text_Summarization_Dataset 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 文本生成, 深度学习, 新闻分析, 语料库, 数据集构建 数据概述: 该数据集包含来自新闻报道的文本数据,记录了新闻标题、摘要、正文内容及其相关信息,主要用于文本摘要生成任务。主要特征如下:...
-
维基百科文章段落文本数据集
2025年10月17日 30 76 60
维基百科文章段落文本数据集_Wikipedia_Article_Paragraphs_Text 数据来源:互联网公开数据 标签:文本分析, 自然语言处理, 语料库, 文本挖掘, 维基百科, 文本语料, 语义分析, 信息检索 数据概述:...
-
无监督学习网络文本内容数据集
2025年10月14日 30 104 85
无监督学习网络文本内容数据集_Unsupervised_Learning_Web_Content_Dataset 数据来源:互联网公开数据 标签:文本挖掘, 无监督学习, 自然语言处理, 网页内容, 文本预处理, 语料库, 数据清洗, 机器学习 数据概述: 该数据集包含来自网络抓取的文本内容,记录了用于无监督学习模型的网页文本信息。主要特征如下:...
-
泰式按摩文本生成数据集
2025年10月12日 30 175 114
泰式按摩文本生成数据集_Thai_Massage_Text_Generation_Dataset 数据来源:互联网公开数据 标签:泰式按摩, 文本生成, 机器学习, 自然语言处理, 语料库, 文本分析, 深度学习, 康复理疗 数据概述:...
-
电影评论情感分析数据集
2025年8月4日 90 26 19
电影评论情感分析数据集_Movie_Reviews_Sentiment_Analysis 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 语料库, 数据挖掘 数据概述: 该数据集包含来自电影评论网站的文本数据,记录了用户对电影的评论内容及其对应的情感极性。主要特征如下:...
-
文本分类新闻数据集
2025年10月11日 30 174 109
文本分类新闻数据集_Text_Classification_News_Dataset 数据来源:互联网公开数据 标签:文本分类, 新闻, 自然语言处理, 机器学习, 语料库, 分类, 深度学习, 中文 数据概述: 该数据集包含来自新闻网站的文本数据,记录了经过预处理的中文新闻文章,用于文本分类任务。主要特征如下:...
-
孟加拉诺阿卡利语语音识别数据集
2025年10月7日 30 73 1
孟加拉诺阿卡利语语音识别数据集_Noakhali_Bengali_Speech_Recognition_Dataset 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 诺阿卡利语, 语音信号, 文本转录, 语料库, 声学模型, 深度学习 数据概述:...
-
格鲁吉亚语语音片段数据集
2025年10月5日 30 29 15
格鲁吉亚语语音片段数据集_Georgian_Speech_Segments_Dataset 数据来源:互联网公开数据 标签:语音识别, 声学模型, 语音数据, 格鲁吉亚语, 语音转录, 机器学习, 语料库, 音频分析 数据概述: 该数据集包含来自格鲁吉亚语的语音片段,记录了不同说话人的语音录音及其对应的文本转录。主要特征如下:...
-
哈萨克斯坦公共服务问答数据集
2025年10月3日 30 54 35
哈萨克斯坦公共服务问答数据集_Kazakhstan_Public_Service_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 公共服务, 文本处理, 信息检索, 机器翻译, 语料库, 知识图谱, 自然语言处理 数据概述:...
-
多语言文本嵌入与翻译数据集
2025年10月3日 30 94 2
多语言文本嵌入与翻译数据集_Multilingual_Text_Embedding_and_Translation_Dataset 数据来源:互联网公开数据 标签:文本嵌入, 词向量, 机器翻译, 英语, 西班牙语, 语料库, 自然语言处理, 数据集 数据概述:...



