-
中文文本生成评估数据集
2025年8月26日 30 200 167
中文文本生成评估数据集_Chinese_Text_Generation_Evaluation_Dataset 数据来源:互联网公开数据 标签:文本生成, 中文, 自然语言处理, 评估, 语言模型, 数据集, 文本质量, 机器翻译 数据概述: 该数据集包含用于评估中文文本生成模型性能的数据,记录了生成的中文文本及其相应的评估指标。主要特征如下:... -
中文维基百科2019年文本数据集
2025年8月25日 30 91 4
中文维基百科2019年文本数据集_Chinese_Wikipedia_2019_Text_Dataset 数据来源:互联网公开数据 标签:维基百科, 中文, 文本数据, 自然语言处理, 语料库, 文本分析, 语言模型, 知识图谱 数据概述: 该数据集包含来自2019年中文维基百科的文本数据,记录了维基百科上各种主题的中文文章内容。主要特征如下:... -
中文新闻文本分类数据集_Chinese_News_Text_Classification_Dataset
2025年6月28日 30 67 3
中文新闻文本分类数据集_Chinese_News_Text_Classification_Dataset 数据来源:互联网公开数据 标签:文本分类, 新闻, 情感分析, 自然语言处理, 机器学习, 类别识别, 语料库, 中文 数据概述: 该数据集包含来自互联网的新闻文本,记录了不同类别的新闻文章内容,主要用于文本分类任务。主要特征如下:... -
豆瓣电影短评情感分析数据集10377部电影-liujt14
2025年6月4日 0 156 131
豆瓣电影短评情感分析数据集10377部电影-liujt14 数据来源:互联网公开数据 标签:豆瓣电影,短评,情感分析,评论,电影评论,观众反馈,中文,电影数据,情感分类 数据概述:... -
Digikala电商平台用户评论情感分析数据集DigikalaE-commercePlatformUserReviewsSentimentAnalysis...
2025年5月30日 30 122 89
Digikala电商平台用户评论情感分析数据集DigikalaE-commercePlatformUserReviewsSentimentAnalysisDataset-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,电商,用户评论,机器学习,文本挖掘,中文 数据概述:... -
中文OCR识别数据集-jianse
2025年5月29日 30 147 111
中文OCR识别数据集-jianse 数据来源:互联网公开数据 标签:OCR,光学字符识别,数据集,图像处理,深度学习,文本识别,中文,自然语言处理 数据概述:该数据集包含用于中文OCR(光学字符识别)任务的图像和对应的文本标注数据。主要特征如下: 时间跨度:数据集涵盖了不同时间段的中文文本图像。... -
歌词清洗与预处理数据集-kalyanitewari
2025年5月29日 30 114 15
歌词清洗与预处理数据集-kalyanitewari 数据来源:互联网公开数据 标签:歌词,文本分析,自然语言处理,数据集,情感分析,音乐,数据清洗,中文 数据概述: 该数据集包含了经过清洗和预处理的歌词数据,旨在为自然语言处理和文本分析任务提供高质量的文本资源。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了不同年代的歌词。... -
游戏翻译语料库-中文-越南语对照数据集GameTranslationCorpus-Chinese-Vietnamese-trninh
2025年5月29日 30 207 100
游戏翻译语料库-中文-越南语对照数据集GameTranslationCorpus-Chinese-Vietnamese-trninh 数据来源:互联网公开数据 标签:机器翻译, 游戏翻译, 语言对, 中文, 越南语, 文本数据, 语料库, 多语言 数据概述:... -
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal
2025年5月29日 30 192 18
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校对,机器学习,语言模型,文本分析,中文 数据概述: 该数据集包含用于拼写纠错任务的文本数据,专注于中文文本的拼写错误及其对应的正确文本。主要特征如下:... -
数据2020年Shopee代码联赛情感分析数据集-rareloto
2025年5月29日 30 159 25
2020年Shopee代码联赛情感分析数据集-rareloto 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,电商,Shopee,中文 数据概述: 该数据集来自2020年Shopee代码联赛,旨在用于情感分析任务,特别是针对电商平台上的用户评论。主要特征如下: 时间跨度:数据记录的时间范围为2020年。... -
中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari
2025年5月29日 30 144 16
中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,数据集,中文,语言理解,文本分析,人工智能 数据概述: 该数据集是中文语言理解评测(CLUE)的一部分,主要包含中文文本的分类和标注数据,用于评估和训练自然语言处理模型。主要特征如下:... -
维基文库标题草稿数据集ZhWikiSourceTitleDraftDataset-raynardj
2025年5月29日 30 183 14
维基文库标题草稿数据集ZhWikiSourceTitleDraftDataset-raynardj 数据来源:互联网公开数据 标签:维基文库,标题,草稿,文本分析,自然语言处理,数据集,中文,语料库 数据概述: 该数据集包含来自维基文库(ZhWikiSource)的标题草稿数据,记录了维基文库中标题草稿的详细信息。主要特征如下:... -
通用拼音输入法词库数据集GPNUAllWordsDataset-nazmuddhohaansary
2025年5月28日 30 161 122
通用拼音输入法词库数据集GPNUAllWordsDataset-nazmuddhohaansary 数据来源:互联网公开数据 标签:词库,输入法,数据集,中文,自然语言处理,语言资源,文本处理,机器学习 数据概述: 该数据集包含通用拼音输入法(GPNU)的完整词库数据,记录了中文词语及其对应的拼音信息。主要特征如下:... -
千言实体链接预处理数据集-kejiewang
2025年5月28日 30 10 2
千言实体链接预处理数据集-kejiewang 数据来源:互联网公开数据 标签:自然语言处理,实体链接,数据集,中文,文本处理,信息抽取,知识图谱,预处理 数据概述: 该数据集包含经过预处理的中文文本数据,旨在用于实体链接任务。数据的主要特征如下: 时间跨度:数据未明确标注时间范围,主要聚焦于文本内容本身。... -
新闻文章情感分析数据集NewPreprocessedNewsArticlesSentimentAnalysisDataset-zeuss2k3
2025年5月28日 30 72 43
新闻文章情感分析数据集NewPreprocessedNewsArticlesSentimentAnalysisDataset-zeuss2k3 数据来源:互联网公开数据 标签:情感分析,新闻文章,数据集,自然语言处理,机器学习,文本分析,情感分类,中文 数据概述: 该数据集包含预处理过的新闻文章数据,旨在用于情感分析任务。主要特征如下:... -
单热编码未翻译文本数据集-franciscomisa
2025年5月28日 30 71 27
单热编码未翻译文本数据集-franciscomisa 数据来源:互联网公开数据 标签:文本数据,单热编码,机器学习,自然语言处理,数据预处理,文本分类,数据分析,中文 数据概述: 该数据集包含经过单热编码处理的未翻译文本数据,主要用于机器学习模型的训练和评估。主要特征如下: 时间跨度:数据记录时间不限,为静态数据集。... -
细粒度情感分析清洗数据集-adedapoadeniran
2025年5月19日 30 208 27
细粒度情感分析清洗数据集-adedapoadeniran 数据来源:互联网公开数据 标签:情感分析,细粒度,数据集,文本分析,自然语言处理,情感分类,机器学习,中文 数据概述:该数据集包含用于细粒度情感分析的中文文本数据,旨在支持对文本情感倾向进行更精细化的识别。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的文本。... -
中文日常语句翻译数据集ChineseDailySentenceTranslationDataset-jahnaviyelamanchi
2025年5月15日 30 65 51
中文日常语句翻译数据集ChineseDailySentenceTranslationDataset-jahnaviyelamanchi 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 中文, 文本数据, 语料库, 句子翻译, 自然语言处理, 语言模型 数据概述:... -
产品组装SOP中越双语对照数据集ProductAssemblySOPChinese-VietnameseBilingualDataset-phamanhtu495
2025年5月11日 30 130 29
产品组装SOP中越双语对照数据集ProductAssemblySOPChinese-VietnameseBilingualDataset-phamanhtu495 数据来源:互联网公开数据 标签:双语对照, 机器翻译, 文本翻译, 产品组装, SOP, 越南语, 中文, 制造业 数据概述:... -
中文情感分析平衡数据集ChineseSentimentAnalysisBalancedDataset-bhikshapathi
2025年5月9日 30 102 55
中文情感分析平衡数据集ChineseSentimentAnalysisBalancedDataset-bhikshapathi 数据来源:互联网公开数据 标签:情感分析, 文本分类, 中文, 情感极性, 自然语言处理, 数据平衡, 机器学习, 情感词典 数据概述: 该数据集包含来自公开渠道的中文文本数据,记录了经过平衡处理的文本情感数据。主要特征如下:...