-
越南语文本事实核查数据集VietnameseTextFactVerificationDataset-nguynhngha
越南语文本事实核查数据集VietnameseTextFactVerificationDataset-nguynhngha 数据来源:互联网公开数据 标签:事实核查, 自然语言处理, 文本蕴含, 越南语, 多文档推理, 文本分类, 机器学习, 语料库 数据概述:... -
文本生成对话语料数据集TextGenerationDialogueCorpus-terrychanorg
文本生成对话语料数据集TextGenerationDialogueCorpus-terrychanorg 数据来源:互联网公开数据 标签:文本生成, 对话系统, 语料库, 自然语言处理, 文本摘要, 机器翻译, 语言模型, 数据集 数据概述: 该数据集包含多个CSV文件,记录了用于文本生成和对话系统训练的语料。主要特征如下:... -
英文文档语料库数据集-ashwanillkagechaad
英文文档语料库数据集-ashwanillkagechaad 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,英文,文档,语料库,语言模型,文本挖掘 数据概述:该数据集包含大量的英文文档,涵盖了多种主题和来源。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于文档的发布时间。 地理范围:数据来源广泛,覆盖全球范围内的英文文档。... -
写作风格评估数据集WritingStyleAssessmentDataset-yus002
写作风格评估数据集WritingStyleAssessmentDataset-yus002 数据来源:互联网公开数据 标签:写作风格, 文本分析, 机器学习, 文本特征, 风格迁移, 自然语言处理, 语料库, 评估指标 数据概述: 该数据集包含多个CSV文件,记录了用于评估写作风格的数据。主要特征如下: 时间跨度:数据未明确标明时间,可视为静态语料库。... -
Zalo推荐系统用户行为数据集ZaloRecommendationSystemUserBehaviorData-thoquang12345
Zalo推荐系统用户行为数据集ZaloRecommendationSystemUserBehaviorData-thoquang12345 数据来源:互联网公开数据 标签:推荐系统, 用户行为, 自然语言处理, 文本分析, 机器学习, 数据挖掘, 社交媒体, 语料库 数据概述:... -
网络社区评论毒性检测数据集OnlineCommunityCommentToxicityDetection-denisgrushentsev
网络社区评论毒性检测数据集OnlineCommunityCommentToxicityDetection-denisgrushentsev 数据来源:互联网公开数据 标签:毒性检测, 文本分类, 自然语言处理, 情感分析, 机器学习, 语料库, 评论分析, 文本标注 数据概述:... -
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassification-qubeet
社交媒体灾难事件文本分类数据集SocialMediaDisasterEventTextClassification-qubeet 数据来源:互联网公开数据 标签:文本分类, 灾难事件, 社交媒体, 自然语言处理, 机器学习, 情感分析, 预训练词向量, 语料库 数据概述:... -
心理健康文章摘要分析数据集MentalHealthArticleSummaryAnalysis-terrychanorg
心理健康文章摘要分析数据集MentalHealthArticleSummaryAnalysis-terrychanorg 数据来源:互联网公开数据 标签:心理健康, 摘要, 文本分析, 自然语言处理, 摘要生成, 情感分析, 文本长度, 语料库 数据概述: 该数据集包含来自互联网的文章,记录了文章标题、摘要、正文内容及其对应的URL。主要特征如下:... -
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-minhmai17
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-minhmai17 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 社交媒体, 自然语言处理, 情感分析, 政治言论, 恶意内容, 语料库 数据概述:... -
阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596
阿拉伯语文本情感分类数据集ArabicTextSentimentClassificationDataset-alinasir1596 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 自然语言处理, 情感极性, 机器学习, 语料库, 数据标注 数据概述:... -
编程问答社区问题文本数据集ProgrammingQ-ACommunityQuestionTextData-nandhinirjs
编程问答社区问题文本数据集ProgrammingQ-ACommunityQuestionTextData-nandhinirjs 数据来源:互联网公开数据 标签:编程问答, 文本分析, 自然语言处理, 问答系统, 文本挖掘, 社区数据, 机器学习, 语料库 数据概述:... -
印地语语料库数据集HindiCorpusDataset-flaming0
印地语语料库数据集HindiCorpusDataset-flaming0 数据来源:互联网公开数据 标签:印地语,语料库,自然语言处理,文本分析,语言学,机器学习,数据集,印度 数据概述: 该数据集包含来自互联网和公开资源的印地语文本数据,记录了印地语的丰富文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
土耳其新闻文章分类数据集TurkishNewsArticlesClassificationDataset-denizhanahin
土耳其新闻文章分类数据集TurkishNewsArticlesClassificationDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻文章, 文本分类, 土耳其语, 内容分析, 类别识别, 自然语言处理, 机器学习, 语料库 数据概述: 该数据集包含来自土耳其TRT... -
邮件礼貌性文本情感分析数据集EmailPolitenessTextSentimentAnalysis-gouravawasthi
邮件礼貌性文本情感分析数据集EmailPolitenessTextSentimentAnalysis-gouravawasthi 数据来源:互联网公开数据 标签:文本情感分析, 邮件数据, 礼貌性, 情感分类, 自然语言处理, 文本标注, 机器学习, 语料库 数据概述:... -
文本校对与润色训练数据集TextProofreadingandPolishingTrainingDataset-hustzx
文本校对与润色训练数据集TextProofreadingandPolishingTrainingDataset-hustzx 数据来源:互联网公开数据 标签:文本校对, 润色, 错误检测, 自然语言处理, 文本纠错, 机器学习, 数据清洗, 语料库 数据概述:... -
游戏翻译语料库-中文-越南语对照数据集GameTranslationCorpus-Chinese-Vietnamese-trninh
游戏翻译语料库-中文-越南语对照数据集GameTranslationCorpus-Chinese-Vietnamese-trninh 数据来源:互联网公开数据 标签:机器翻译, 游戏翻译, 语言对, 中文, 越南语, 文本数据, 语料库, 多语言 数据概述:... -
数据2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong
2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong 数据来源:互联网公开数据 标签:互联网文本,自然语言处理,语料库,大数据,机器学习,文本分析,人工智能,语言学 数据概述:该数据集为2024年互联网公开的文本数据,涵盖了广泛的互联网文本资源,适用于自然语言处理、文本分析等任务。主要特征如下:... -
越南语文本摘要生成数据集VietnameseTextSummarizationDataset-nguyenvuthanhtung
越南语文本摘要生成数据集VietnameseTextSummarizationDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 越南语, 深度学习, 文本生成, 数据集构建, 机器翻译, 语料库 数据概述: 该数据集包含越南语文本及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下:... -
电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif
电影评论情感分析数据集MovieReviewsSentimentAnalysis-mdtanviruddinalif 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了每条评论对应的情感极性标签。主要特征如下:... -
新闻摘要生成文本数据集NewsSummarizationTextDataset-sebastianpetrik
新闻摘要生成文本数据集NewsSummarizationTextDataset-sebastianpetrik 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 语料库, 新闻文章, 语义分析 数据概述: 该数据集包含来自 GigaWord...