-
Digikala电商平台用户评论情感分析数据集DigikalaE-commercePlatformUserReviewsSentimentAnalysis...
2025年5月30日 30 90 55
Digikala电商平台用户评论情感分析数据集DigikalaE-commercePlatformUserReviewsSentimentAnalysisDataset-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,电商,用户评论,机器学习,文本挖掘,中文 数据概述:... -
中文OCR识别数据集-jianse
2025年5月29日 30 206 75
中文OCR识别数据集-jianse 数据来源:互联网公开数据 标签:OCR,光学字符识别,数据集,图像处理,深度学习,文本识别,中文,自然语言处理 数据概述:该数据集包含用于中文OCR(光学字符识别)任务的图像和对应的文本标注数据。主要特征如下: 时间跨度:数据集涵盖了不同时间段的中文文本图像。... -
歌词清洗与预处理数据集-kalyanitewari
2025年5月29日 30 161 152
歌词清洗与预处理数据集-kalyanitewari 数据来源:互联网公开数据 标签:歌词,文本分析,自然语言处理,数据集,情感分析,音乐,数据清洗,中文 数据概述: 该数据集包含了经过清洗和预处理的歌词数据,旨在为自然语言处理和文本分析任务提供高质量的文本资源。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了不同年代的歌词。... -
游戏翻译语料库-中文-越南语对照数据集GameTranslationCorpus-Chinese-Vietnamese-trninh
2025年5月29日 30 170 144
游戏翻译语料库-中文-越南语对照数据集GameTranslationCorpus-Chinese-Vietnamese-trninh 数据来源:互联网公开数据 标签:机器翻译, 游戏翻译, 语言对, 中文, 越南语, 文本数据, 语料库, 多语言 数据概述:... -
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal
2025年5月29日 30 93 9
文本拼写纠错数据集DF-SpellcheckDataset-alvaromendizabal 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校对,机器学习,语言模型,文本分析,中文 数据概述: 该数据集包含用于拼写纠错任务的文本数据,专注于中文文本的拼写错误及其对应的正确文本。主要特征如下:... -
数据2020年Shopee代码联赛情感分析数据集-rareloto
2025年5月29日 30 89 63
2020年Shopee代码联赛情感分析数据集-rareloto 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,电商,Shopee,中文 数据概述: 该数据集来自2020年Shopee代码联赛,旨在用于情感分析任务,特别是针对电商平台上的用户评论。主要特征如下: 时间跨度:数据记录的时间范围为2020年。... -
中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari
2025年5月29日 30 69 68
中文语言理解评测数据集CLUEAnswerDataset-prajeshrajbhandari 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,数据集,中文,语言理解,文本分析,人工智能 数据概述: 该数据集是中文语言理解评测(CLUE)的一部分,主要包含中文文本的分类和标注数据,用于评估和训练自然语言处理模型。主要特征如下:... -
维基文库标题草稿数据集ZhWikiSourceTitleDraftDataset-raynardj
2025年5月29日 30 143 96
维基文库标题草稿数据集ZhWikiSourceTitleDraftDataset-raynardj 数据来源:互联网公开数据 标签:维基文库,标题,草稿,文本分析,自然语言处理,数据集,中文,语料库 数据概述: 该数据集包含来自维基文库(ZhWikiSource)的标题草稿数据,记录了维基文库中标题草稿的详细信息。主要特征如下:... -
通用拼音输入法词库数据集GPNUAllWordsDataset-nazmuddhohaansary
2025年5月28日 30 21 1
通用拼音输入法词库数据集GPNUAllWordsDataset-nazmuddhohaansary 数据来源:互联网公开数据 标签:词库,输入法,数据集,中文,自然语言处理,语言资源,文本处理,机器学习 数据概述: 该数据集包含通用拼音输入法(GPNU)的完整词库数据,记录了中文词语及其对应的拼音信息。主要特征如下:... -
千言实体链接预处理数据集-kejiewang
2025年5月28日 30 82 2
千言实体链接预处理数据集-kejiewang 数据来源:互联网公开数据 标签:自然语言处理,实体链接,数据集,中文,文本处理,信息抽取,知识图谱,预处理 数据概述: 该数据集包含经过预处理的中文文本数据,旨在用于实体链接任务。数据的主要特征如下: 时间跨度:数据未明确标注时间范围,主要聚焦于文本内容本身。... -
新闻文章情感分析数据集NewPreprocessedNewsArticlesSentimentAnalysisDataset-zeuss2k3
2025年5月28日 30 102 2
新闻文章情感分析数据集NewPreprocessedNewsArticlesSentimentAnalysisDataset-zeuss2k3 数据来源:互联网公开数据 标签:情感分析,新闻文章,数据集,自然语言处理,机器学习,文本分析,情感分类,中文 数据概述: 该数据集包含预处理过的新闻文章数据,旨在用于情感分析任务。主要特征如下:... -
单热编码未翻译文本数据集-franciscomisa
2025年5月28日 30 132 106
单热编码未翻译文本数据集-franciscomisa 数据来源:互联网公开数据 标签:文本数据,单热编码,机器学习,自然语言处理,数据预处理,文本分类,数据分析,中文 数据概述: 该数据集包含经过单热编码处理的未翻译文本数据,主要用于机器学习模型的训练和评估。主要特征如下: 时间跨度:数据记录时间不限,为静态数据集。... -
细粒度情感分析清洗数据集-adedapoadeniran
2025年5月19日 30 166 140
细粒度情感分析清洗数据集-adedapoadeniran 数据来源:互联网公开数据 标签:情感分析,细粒度,数据集,文本分析,自然语言处理,情感分类,机器学习,中文 数据概述:该数据集包含用于细粒度情感分析的中文文本数据,旨在支持对文本情感倾向进行更精细化的识别。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的文本。... -
中文日常语句翻译数据集ChineseDailySentenceTranslationDataset-jahnaviyelamanchi
2025年5月15日 30 23 5
中文日常语句翻译数据集ChineseDailySentenceTranslationDataset-jahnaviyelamanchi 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 中文, 文本数据, 语料库, 句子翻译, 自然语言处理, 语言模型 数据概述:... -
产品组装SOP中越双语对照数据集ProductAssemblySOPChinese-VietnameseBilingualDataset-phamanhtu495
2025年5月11日 30 166 118
产品组装SOP中越双语对照数据集ProductAssemblySOPChinese-VietnameseBilingualDataset-phamanhtu495 数据来源:互联网公开数据 标签:双语对照, 机器翻译, 文本翻译, 产品组装, SOP, 越南语, 中文, 制造业 数据概述:... -
中文情感分析平衡数据集ChineseSentimentAnalysisBalancedDataset-bhikshapathi
2025年5月9日 30 191 166
中文情感分析平衡数据集ChineseSentimentAnalysisBalancedDataset-bhikshapathi 数据来源:互联网公开数据 标签:情感分析, 文本分类, 中文, 情感极性, 自然语言处理, 数据平衡, 机器学习, 情感词典 数据概述: 该数据集包含来自公开渠道的中文文本数据,记录了经过平衡处理的文本情感数据。主要特征如下:... -
中文词频统计分析数据集ChineseWordFrequencyStatistics-danphan2012
2025年5月5日 30 171 5
中文词频统计分析数据集ChineseWordFrequencyStatistics-danphan2012 数据来源:互联网公开数据 标签:中文, 词频分析, 自然语言处理, 文本挖掘, 语料库, 统计分析, 语言学, 数据集 数据概述: 该数据集包含来自公开语料库的中文文本数据,记录了词语及其对应的出现频率。主要特征如下:... -
维基百科中文语句数据集-terrychanorg
2025年5月5日 30 126 24
维基百科中文语句数据集-terrychanorg 数据来源:互联网公开数据 标签:维基百科,中文,语句数据,自然语言处理,文本分析,语言学,数据集 数据概述: 本数据集包含从维基百科中文版提取的1258282句语句数据。这些语句涵盖了广泛的主题和领域,包括但不限于历史、科学、技术、文化和社会。数据集旨在为自然语言处理和文本分析提供丰富的语料库资源。... -
文本对齐与数据标注辅助数据集TextAlignmentandDataAnnotationAuxiliaryDataset-nairsaanvi
2025年5月1日 30 103 27
文本对齐与数据标注辅助数据集TextAlignmentandDataAnnotationAuxiliaryDataset-nairsaanvi 数据来源:互联网公开数据 标签:文本对齐, 数据标注, 自然语言处理, 数据预处理, 文本分析, 语料库, 辅助工具, 中文 数据概述:... -
中越双语翻译语句数据集Chinese-VietnameseTranslationSentences-patxhaui
2025年5月1日 30 163 96
中越双语翻译语句数据集Chinese-VietnameseTranslationSentences-patxhaui 数据来源:互联网公开数据 标签:机器翻译, 语言学, 中文, 越南语, 翻译对齐, 双语语料库, 自然语言处理, 文本数据 数据概述: 该数据集包含来自互联网的中文与越南语双语对照文本,记录了中文句子及其对应的越南语翻译。主要特征如下:...