-
阿拉伯语情感分析数据集SentimentAnalysisinArabicDataset-essasartawi
阿拉伯语情感分析数据集SentimentAnalysisinArabicDataset-essasartawi 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,数据集,自然语言处理,文本分类,机器学习,语言处理,情感计算 数据概述: 该数据集包含来自阿拉伯语社交媒体平台和评论网站的情感分析数据,记录了用户对特定主题或产品的情感表达。主要特征如下:... -
英文-印地语文本语料库
英文-印地语文本语料库 数据来源:互联网公开数据 标签:英文,印地语,文本语料库,机器翻译,语言处理,平行语料,数据清洗 数据概述: 本数据集包含来自两个公开来源的英文-印地语文本数据。其中,英文-印地语数据集基于印度理工学院孟买分校(IIT... -
英语到泰卢固语高质量翻译数据集EnglishtoTeluguHigh-QualityTranslationDataset-krizzna69
英语到泰卢固语高质量翻译数据集EnglishtoTeluguHigh-QualityTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,翻译质量,英语,泰卢固语,自然语言处理,多语言 数据概述:... -
乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab
乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab 数据来源:互联网公开数据 标签:语言处理,文本分析,自然语言处理,乌尔都语,机器学习,数据集,文本分类,多语言 数据概述: 该数据集包含来自互联网公开资源的乌尔都语文本数据,记录了乌尔都语的自然语言文本内容。主要特征如下:... -
阿尔及利亚推文数据集AlgerianTweetsDataset-didamarouane
阿尔及利亚推文数据集AlgerianTweetsDataset-didamarouane 数据来源:互联网公开数据 标签:社交媒体,推文分析,数据集,情感分析,机器学习,文本挖掘,语言处理,情感研究 数据概述: 该数据集包含来自阿尔及利亚地区推文数据,记录了社交媒体上用户发布的内容。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
阿拉伯语序列标注IOB数据集ArabicIOBforSequenceLabelingDataset-yassinabdulmahdi
阿拉伯语序列标注IOB数据集ArabicIOBforSequenceLabelingDataset-yassinabdulmahdi 数据来源:互联网公开数据 标签:序列标注,自然语言处理,数据集,命名实体识别,机器学习,语言处理,NLP,文本分析 数据概述: 该数据集包含阿拉伯语的序列标注数据,采用IOB标注格式记录了文本中的命名实体。主要特征如下:... -
NepaliSpellCheckandCorrectionDataset尼泊尔语拼写检查与纠正数据集-tha077bct007
NepaliSpellCheckandCorrectionDataset尼泊尔语拼写检查与纠正数据集-tha077bct007 数据来源:互联网公开数据 标签:语言处理,拼写检查,数据集,自然语言处理,机器学习,纠错算法,文本分析,语言技术 数据概述:... -
Facebook用户评论数据集FacebookUserCommentDataset-snnguyn310
Facebook用户评论数据集FacebookUserCommentDataset-snnguyn310 数据来源:互联网公开数据 标签:社交媒体,评论分析,数据集,文本挖掘,情感分析,机器学习,用户行为,语言处理 数据概述:该数据集包含来自Facebook平台的用户评论数据,记录了用户在社交媒体上的互动内容。主要特征如下:... -
孟加拉语新闻分类数据集BanglaNewsClassificationDataset-anikchandra70
孟加拉语新闻分类数据集BanglaNewsClassificationDataset-anikchandra70 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,语言处理,孟加拉语,分类算法 数据概述: 该数据集包含来自孟加拉语新闻网站的数据,记录了各类新闻文章的文本内容和分类标签。主要特征如下:... -
翻译项目CSV数据集TranslatedCSVDataset-ahensetihom
翻译项目CSV数据集TranslatedCSVDataset-ahensetihom 数据来源:互联网公开数据 标签:翻译项目,CSV数据,语言处理,自然语言处理,数据集,文本分析,机器学习,多语言研究 数据概述:该数据集包含来自多个翻译项目的CSV格式数据,记录了不同语言文本之间的翻译结果。主要特征如下:... -
真实翻译数据集RealTranslatedDataset-tihsrahly
真实翻译数据集RealTranslatedDataset-tihsrahly 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,文本分析,机器学习,自然语言处理,多语言,人工智能 数据概述: 该数据集包含来自真实翻译项目的文本数据,记录了多种语言之间的翻译对。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能跨越多个时间段。... -
翻译数据数据集TranslatedDataDataset-krsna540
翻译数据数据集TranslatedDataDataset-krsna540 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,机器学习,自然语言处理,多语言,文本分析,数据转换 数据概述: 该数据集包含来自互联网的翻译数据,记录了不同语言之间的文本翻译结果。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
多标签英语和孟加拉语评论数据集Multi-labeledEnglishandBanglaCommentsDataset-sanzidasiddike
多标签英语和孟加拉语评论数据集Multi-labeledEnglishandBanglaCommentsDataset-sanzidasiddike 数据来源:互联网公开数据 标签:自然语言处理,多语言,数据集,情感分析,机器学习,文本分类,情感识别,语言处理 数据概述:... -
中文分词数据集Word-SegmentedDatasetfrom01Janto03-ictunivers
中文分词数据集Word-SegmentedDatasetfrom01Janto03-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,中文分词,数据集,文本分析,机器学习,语言处理,NLP,中文处理 数据概述: 该数据集包含中文文本的分词数据,记录了从01月01日到03月31日之间的中文文本的分词结果。主要特征如下:... -
印地语音译数据集HindiTransliterationDataset-omkartupe
印地语音译数据集HindiTransliterationDataset-omkartupe 数据来源:互联网公开数据 标签:印地语,音译,数据集,语言处理,机器学习,文本分析,自然语言处理,语音识别 数据概述: 该数据集包含印地语单词的音译数据,记录了印地语单词及其对应的罗马音译版本。主要特征如下:... -
欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar
欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar 数据来源:互联网公开数据 标签:语言处理,数据集,自然语言,机器学习,文本分析,意大利语,代词研究,多语言 数据概述: 该数据集来源于欧洲议会会议记录,专注于意大利语中的代词使用情况。主要特征如下:... -
口述历史访谈记录数据集LokisTranscriptDataset-anomic
口述历史访谈记录数据集LokisTranscriptDataset-anomic 数据来源:互联网公开数据 标签:口述历史,访谈记录,数据集,历史研究,文本分析,社会研究,语言处理,人文科学 数据概述:该数据集包含来自口述历史项目的访谈记录,记录了个人口述历史访谈的完整文本内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。... -
拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot
拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,数据集,文本分割,语言处理,数据挖掘,历史文献,自然语言处理,语言学研究 数据概述: 该数据集包含拉丁语的文本分割数据,记录了拉丁语文本的分割和标注信息。主要特征如下:... -
德国到英语翻译数据集GermantoEnglishTranslationDataset-jamesbond00700
德国到英语翻译数据集GermantoEnglishTranslationDataset-jamesbond00700 数据来源:互联网公开数据 标签:翻译,语言处理,数据集,机器学习,自然语言处理,双语,文本分析,人工智能 数据概述: 该数据集包含来自互联网的德语到英语的平行文本数据,记录了德语原文及其对应的英语翻译。主要特征如下:... -
美国手语识别演示数据集-hengck23
美国手语识别演示数据集-hengck23 数据来源:互联网公开数据 标签:ASL,手语识别,机器学习,PyTorch,Transformer,语言处理,演示,多媒体数据 数据概述:...